当前位置: 首页 > 知识库问答 >
问题:

卷积神经网络特征图及参数总数

酆耀
2023-03-14

假设我有一幅尺寸为125*125的RGB图像,我使用了10个尺寸为5*5、步长为3的过滤器,那么这一层的特征图是什么?特征图的参数总数是多少?10*((125-5)/3)1=(41*41*10)(过滤器数量)但RGB图像和灰度图像之间的区别是什么?因此,对于RGB图像,它应该是41*41*30(过滤器数量*输入图像通道数量)?对于参数总数:5*5*3*10=750?

共有2个答案

贺奕
2023-03-14

注:我有一篇关于CNN如何在数据科学堆栈交换上工作的直觉的帖子,受到了广泛的欢迎。也一定要检查一下。

对于给定步幅的要素贴图的形状,您是对的。

CNN中的参数总数如下所示-

Params = (n*m*l+1)*k

where, l = number of input feature maps / image channels, 
       k = number of output feature maps / # of filters, 
       n*m = filter dimensions

Important! - The +1 in the formula is because each of the output feature
maps have a bias term added, which is also a trainable parameter. So, don't
forget to add that!

因此,对于您的情况是,可训练参数的数量:<代码>((5*5*3 1)*10)=760

对于灰度,它是:((5*5*1*10)=260

这是一个非常好的可视化,我发现它可以直观地显示过滤器如何创建要素地图。

如果输入图像是第一个CNN层,则输入特征贴图与输入图像的通道数相同。由于CNN通常是堆叠的,以前CNN的输出通道被称为当前CNN层的输入特征映射。

边桐
2023-03-14

特征映射数=过滤器数,每个特征映射的大小为41×41(如果填充为零,则计算正确)。因此,在上述情况下,如果您有10个过滤器,您将有10个大小为41×41的特征贴图,与rgb或灰度无关。

对于rgb与灰度,将通道视为输入层的特征图,并且一次在所有特征图上应用一个过滤器。如果您有一个5*5过滤器大小的输入rgb图像,它实际上是一个大小为5*5*3的过滤器(通道数量)。因此,独立于rgb或灰度,如果您在大小为125*125且步幅为3的图像上应用10个5*5的过滤器,您将始终得到10个41*41的特征图。

无论何时定义滤波器,都将其定义为x*y,但z始终等于2d卷积的“已应用conv的通道数”。这样,每个滤波器的参数总数将为x*y*n\u通道1(额外的1是常数)

在10个过滤器的情况下,对于rgb图像,每个过滤器的大小为5*5*3。因此,rgb的总参数=10 * (5 * 5 * 3 1)。对于灰度,每个过滤器是5*5*1。因此,灰度的总参数=10 * (5 * 5 * 1 1)

 类似资料:
  • 我在Keras有卷积神经网络。我需要知道每个图层中要素地图的尺寸。我的输入是28 x 28像素的图像。我知道有一种计算方法,但我不知道如何计算。下面是我使用Keras的代码片段。 最后,这就是我想画的。非常感谢。

  • 我读过这篇文章http://www.codeproject.com/Articles/143059/Neural-Network-for-Recognition-of-Handwritten-Di当我转到这个:第0层:是MNIST数据库中手写字符的灰度图像,填充到29x29像素。输入层有29x29=841个神经元。图层#1:是一个包含六(6)个要素地图的卷积图层。从第1层到前一层有13x13x6=

  • 注意: 本教程适用于对Tensorflow有丰富经验的用户,并假定用户有机器学习相关领域的专业知识和经验。 概述 对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题,其任务是对一组大小为32x32的RGB图像进行分类,这些图像涵盖了10个类别: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。 想了解更多信息请参考CIFAR-10 page,以及Alex Kriz

  • 卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络

  • 我正在试图理解卷积神经网络中的维度是如何表现的。在下图中,输入为带1个通道的28乘28矩阵。然后是32个5乘5的过滤器(高度和宽度步幅为2)。所以我理解结果是14乘14乘32。但是在下一个卷积层中,我们有64个5×5的滤波器(同样是步幅2)。那么为什么结果是7乘7乘64而不是7乘7乘32*64呢?我们不是将64个滤波器中的每一个应用于32个通道中的每一个吗?

  • 在了解了机器学习概念之后,现在可以将注意力转移到深度学习概念上。深度学习是机器学习的一个分支。深度学习实现的示例包括图像识别和语音识别等应用。 以下是两种重要的深度神经网络 - 卷积神经网络 递归神经网络 在本章中,我们将重点介绍CNN - 卷积神经网络。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。CNN与其他普通神经网络之间的主要区别在于