当前位置: 首页 > 知识库问答 >
问题:

卷积神经网络中的过拟合问题及卷积层参数的确定

茅曾琪
2023-03-14

我应用批量标准化技术来提高我的cnn模型的准确性。没有批量归一化的模型精度仅为46%,但应用批量归一化后,精度超过了83%,但这里出现了一个bif过拟合问题,模型给出的验证精度仅为15%。也请告诉我如何决定没有过滤器的步幅在卷积层和没有单位在登斯层

共有1个答案

蓬思博
2023-03-14

批量规范化在许多情况下都有帮助,但并不总是最佳的。我发现这取决于它在您的模型体系结构中的位置以及您试图实现的目标。我对不同的GAN CNN做了很多研究,发现BN通常不需要,甚至会降低性能。它的目的是帮助模型更快地泛化,但有时会增加训练时间。如果我试图复制图像,我会完全跳过BN。关于准确性,我不明白你的意思。你的意思是说它在训练数据上达到了83%的准确率,但在验证数据上却下降到了15%的准确率?没有BN的验证准确度是多少?一般来说,验证精度是更重要的指标。如果你有一个高训练精度和低验证精度,你确实是过度拟合。如果有多个卷积层,则可能需要在每个层之后应用BN。如果您仍然过胖,请尝试增加步幅和内核大小。如果这不起作用,您可能需要再次查看数据,确保您有足够的数据,并且数据有一定的多样性。假设你正在处理图像数据,你是在创建你旋转图像、裁剪它们的样本等等。考虑合成数据来增加你的真实数据来帮助克服过度。

 类似资料:
  • 注意: 本教程适用于对Tensorflow有丰富经验的用户,并假定用户有机器学习相关领域的专业知识和经验。 概述 对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题,其任务是对一组大小为32x32的RGB图像进行分类,这些图像涵盖了10个类别: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。 想了解更多信息请参考CIFAR-10 page,以及Alex Kriz

  • 卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络

  • 下午好在第一阶段,在卷积神经网络(输入层)的输入上,我们接收一个源图像(因此是手写英文字母的图像)。首先,我们使用一个从左到右的nxn窗口来扫描图像并在内核(卷积矩阵)上乘法来构建特征映射?但没有人写过内核应该具有什么样的精确值(换句话说,我应该将从n*n窗口检索到的数据相乘到什么样的内核值)。是否适合在这个用于边缘检测的卷积核上乘以数据?有许多卷积核(浮雕、高斯滤波器、边缘检测、角度检测等)?但

  • 我正在试图理解卷积神经网络中的维度是如何表现的。在下图中,输入为带1个通道的28乘28矩阵。然后是32个5乘5的过滤器(高度和宽度步幅为2)。所以我理解结果是14乘14乘32。但是在下一个卷积层中,我们有64个5×5的滤波器(同样是步幅2)。那么为什么结果是7乘7乘64而不是7乘7乘32*64呢?我们不是将64个滤波器中的每一个应用于32个通道中的每一个吗?

  • 在了解了机器学习概念之后,现在可以将注意力转移到深度学习概念上。深度学习是机器学习的一个分支。深度学习实现的示例包括图像识别和语音识别等应用。 以下是两种重要的深度神经网络 - 卷积神经网络 递归神经网络 在本章中,我们将重点介绍CNN - 卷积神经网络。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。CNN与其他普通神经网络之间的主要区别在于

  • 主要内容:卷积神经网络深度学习是机器学习的一个分支,它是近几十年来研究人员突破的关键步骤。深度学习实现的示例包括图像识别和语音识别等应用。 下面给出了两种重要的深度神经网络 - 卷积神经网络 递归神经网络。 在本章中,我们将关注第一种类型,即卷积神经网络(CNN)。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。 CNN与任何其他普通神经网络之间的主要区别在于CNN