当前位置: 首页 > 知识库问答 >
问题:

输入和转换的大小

谢鸿羲
2023-03-14

在CS231n关于卷积神经网络的课程中,在ConvNet中注:

>

  • INPUT[32x32x3]将保存图像的原始像素值,在这种情况下是宽32、高32和具有三个颜色通道R、G、B的图像。

    CONV层将计算连接到输入中局部区域的神经元的输出,每个神经元在其权重和输入卷中连接到的小区域之间计算一个点积。如果我们决定使用12个过滤器,这可能会导致体积,例如[32x32x12]。

    从文档中,我了解到INPUT将包含32(宽)x 32(高)x 3深度的图像。但后来在Conv层的结果中,如果我们决定使用12个过滤器,则为[32x32x12]。图像深度的3在哪里?

    请帮帮我,提前谢谢你。

  • 共有2个答案

    缑文栋
    2023-03-14

    所以,这很有趣。我再次阅读了文档,找到了答案,答案是“向下滚动”。例如,之前我认为过滤器是32 x 32(无深度)。事实是:

    ConvNet第一层上的典型过滤器可能具有5x5x3的大小(即5像素的宽度和高度,以及3,因为图像具有深度3,即颜色通道)。

    在正向传递期间,我们在输入体积的宽度和高度上滑动(更准确地说,卷积)每个过滤器,并计算过滤器条目和任何位置的输入之间的点积。

    卢元龙
    2023-03-14

    它将“分布”到每个特征映射(使用过滤器卷积后的结果)。

    在考虑12个滤波器之前,只要想一个,那就是你正在应用带有[filter_width*filter_height*input_channel_number]滤波器的卷积,并且由于你的input_channel_number与滤波器通道相同,所以你基本上在每个输入通道上独立应用二维卷积的input_channel_number,然后将它们相加在一起,结果就是一个2D特征图。

    现在,您可以重复此操作12次,以获得12个要素地图,并将它们堆叠在一起,以获得您的[32 x 32 x 12]要素体积。这就是为什么您的过滤器大小是一个4D向量,带有[过滤器\u宽度*过滤器\u高度*输入\u通道\u编号*输出\u通道\u编号],在您的情况下,这应该类似于[3x3x3x12](请注意,不同框架之间的顺序可能不同,但操作是相同的)

     类似资料:
    • 有人能帮我定义jolt规范,把输入json转换成输出json吗..我在一个文件中输入了json,像{"filename":"test1 "," value":"10"} {"filename":"test2 "," value":"10"}。转换后的输出json应该如下所示:{"filename":"test "," overallvalue":"20 "," filename":[{"filen

    • 我将python 3用于anaconda,将keras用于over tensorflow,我的目标是创建一个具有可变输入大小的Conv层的网络 我在这里找到了使用此代码的 我已经用它用这段代码创建了我自己的模型(我需要一个扁平层) 我一直在犯这个错误 ValueError:“展平”输入的形状没有完全定义(get(None,None,1)。确保将完整的“input\u shape”或“batch\u

    • 我有以下输入json: 输出JSON应如下所示: 任何人都可以就如何为上述内容构建适当的 Bump 规范提供任何指导吗? 非常感谢您的帮助 ^_^

    • 问题内容: 我被分配编写一个程序,该程序读取一系列整数输入并打印-输入的最小和最大-以及偶数和奇数输入的数量 我想出了第一部分,但对如何使程序显示最大和最小感到困惑。到目前为止,这是我的代码。我怎样才能显示最小的输入呢? 问题答案: 最简单的解决方案是使用诸如和

    • 我想用JOLT规范做JSON到JSON的转换。我有一个输入,它是Flattern JSOn,我想把它隐藏到嵌套JSOn中。我已经为此编写了JOLT规范,下面提到了它。但它并没有给出我所期望的输出。 提前感谢....

    • 当建立索引时,Sphinx从指定的数据源获得文本文档,将文本分成词的集合,再对每个词做大小写转换,于是“Abc”,“ABC”和“abc”都被当作同一个词(word,或者更学究一点,词项term) 为了正确完成上述工作,Sphinx需要知道: 源文本是什么编码的; 那些字符是字母,哪些不是; 哪些字符需要被转换,以及被转换成什么. 这些都可以用charset_type和charset_table选项