当前位置: 首页 > 知识库问答 >
问题:

卷积输出

宗涵蓄
2023-03-14

假设我们有一个5x5大小的图像和一个3x3大小的内核,带有跨步2和填充。通过神经网络中的卷积层后,输出图像的大小是多少。

共有2个答案

费和惬
2023-03-14

让我们考虑一个更一般的情况:

输入是大小为I*I的图像。输入用P*P像素填充。内核的大小为K*K,步长为S*S。然后,输出的大小为O*O,可以使用一个简单的公式计算:

O=[(I 2*P-K)/S]1;其中[]表示楼层功能。

所以,你的答案是3*3,因为O=[(5 2*1-3)/2]1=3。

祁兴运
2023-03-14

一: 图像大小,K:内核大小,P:填充,S:步幅

我将仅解释一个方向的公式(将过滤器向右移动),因为另一个方向的原理相同。

想象一下,您将内核(过滤器)放置在填充图像的左上角。

然后在右侧还有I-K 2P像素。如果您的步幅是S,您将能够将内核放置在地板((I-K 2*P)/S)位置的剩余部分上。您可以验证是否需要4x4像素图像的“地板”。您必须为内核的初始位置添加一个,以获得内核位置的总数。

因此,总共有1个楼层((I-K 2*P)/S)位置,这是输出大小的公式。希望这有帮助。

 类似资料:
  • 我在Keras建立了一个卷积神经网络。 根据CS231讲座,卷积操作为每个过滤器创建一个特征映射(即激活映射),然后将其堆叠在一起。在我的例子中,卷积层有一个300维的输入。因此,我预计会进行以下计算: 每个过滤器的窗口大小为5。因此,每个滤波器产生300-5 1=296个卷积 但是,实际输出形状看起来不同: 偏移值的形状很有意义,因为每个过滤器都有一个偏移值。然而,我不了解重量的形状。显然,第一

  • 图像的卷积(Convolution)定义为 $$f(x) = act(\sum{i, j}^n \theta{(n - i)(n - j)} x_{ij}+b)$$ 其计算过程为 示例1 import tensorflow as tf import numpy as np sess = tf.InteractiveSession() input_batch = tf.constant([

  • 我正在开发一种卷积神经网络用于图像分类或更好的车牌分类。这些车牌最多包含8个字符,每个字符可以包含37个字符(A-Z、0-9和空格)。我现在想知道如何设计网络中的最后两层。我认为,最后一个必须是具有37个概率的softmax层。这应该完全连接到一个(?)神经元在前一层?我想,在前一层我们需要8个神经元,因为之前的车牌上有8个字符,但我不确定。在此层之前,我添加了一些卷积层和maxPooling层。

  • 我正在尝试创建一维卷积模型,但我似乎无法获得正确的输入形状。以下是我所拥有的: 我收到以下错误: 有人有什么建议吗?

  • 对于我的教育,我正在尝试在卷积神经网络中实现一个N维卷积层。 我想实现一个反向传播函数。然而,我不确定这样做最有效的方式。 目前,我正在使用信号。fftconvolve收件人: > 在反向传播步骤中,使用数组卷积导数(在所有维度上使用FlipAllAxes函数进行反转)(https://jefkine.com/general/2016/09/05/backpropagation-in-convol

  • 卷积神经网络有一个批量过滤器, 持续不断的在图片上滚动收集图片里的信息,每一次收集的时候都只是收集一小块像素区域, 然后把收集来的信息进行整理, 这时候整理出来的信息有了一些实际上的呈现, 比如这时的神经网络能看到一些边缘的图片信息, 然后在以同样的步骤, 用类似的批量过滤器扫过产生的这些边缘信息, 神经网络从这些边缘信息里面总结出更高层的信息结构,比如说总结的边缘能够画出眼睛,鼻子等等. 再经过