问题：

三维卷积神经网络的滤波器尺寸和输出层

殷承恩

2023-03-14

我正在实现一个三维卷积神经网络，我有两个问题。

问题一

每个输入是一个大小为（201,10,4）的3D矩阵。我希望我的过滤器能够在第二和第三维度上移动，因为它们是完全连接的。第三个维度是特征维度。所以我不想看第二和第三维度的当地社区。因此，我的过滤器大小将是例如（3,10,4）的大小。所以过滤器大小等于第二和第三维度，但我们在第一维度中有权重共享。以下是我的卷积代码：

## input layer
input_layer = Input((201, 10, 4))

## convolutional layers
conv_layer1 = Conv3D(filters=8, kernel_size=(3, 10, 4), activation='relu')(input_layer)
conv_layer2 = Conv3D(filters=16, kernel_size=(3, 10, 4), activation='relu')(conv_layer1)

所以我应该在这里使用步幅，这样它只在第一维度上分担重量。并且在剩下的第二和第三维度上保持完全连接？

问题二

对于每个矩阵，我有一个形状（6，）的输出，在每个索引处，我有每个特征的频率。所以我想让我的模型预测每个特征的频率。我想我需要在这里使用MSE。但我的输出层应该是什么样子。如果是这样：


model.add(Dense(1, activation='linear'))
opt = SGD(lr=0.01, momentum=0.9)
model.compile(loss='mean_squared_error', optimizer=opt)

或者这个：


model.add(Dense(6, activation='linear'))
opt = SGD(lr=0.01, momentum=0.9)
model.compile(loss='mean_squared_error', optimizer=opt)

敬请见识。

共有1个答案

郎建章

2023-03-14

据我所知，Conv3D需要5维输入，（无、D1、D2、D3、D4）。

您的过滤器只会在D1、D2、D3中移动，而不会在D4中移动，因为对于D4，它将是所有过滤器的总和。假设D1、D2、D3相同，则同一过滤器始终与D4中的所有元素相乘。

答案1：由于第二和第三维度与过滤器大小相同，因此不需要在Con3D中跨步，但不要忘记padding='same'，否则第二和第三维度将减少（过滤器-1）。

这意味着只有第一个Con3D层具有（201,10,4）尺寸，第二个Conv3D层将具有（199，1，1），这对于第二个Conv3D层来说不是最优的。

答案2：最后一层应该有与输出数量相等的神经元，您的输出是（6），所以密集层应该是密集的（6）。

注：无需添加线性激活

类似资料：

卷积神经网络中滤波器的差分

创建卷积神经网络（CNN）时（如中所述https://cs231n.github.io/convolutional-networks/)输入层与一个或多个过滤器连接，每个过滤器表示一个要素地图。这里，过滤层中的每个神经元只与输入层的几个神经元相连。在最简单的情况下，我的n个过滤器中的每一个都具有相同的维度并使用相同的步幅。我的问题是：如何确保过滤器学习不同的特征，尽管它们使用相同的补丁进行训练
卷积神经网络滤波器的可视化

我读过这篇文章“UFLDF”，它发展了autoencoder中隐藏层的可视化，但我很困惑如何可视化卷积神经网络的滤波器。在我看来，对于第一个卷积层，要使滤波器可视化，它需要这个等式：对于第二个卷积层，它应该将滤波器投射到原始输入空间，但我不知道如何做。
三维卷积神经网络输入形状

我在使用Keras和Python对3D形状进行分类时遇到了一个问题。我有一个文件夹，里面有一些JSON格式的模型。我将这些模型读入Numpy数组。模型是25*25*25，表示体素化模型的占用网格（每个位置表示位置（i、j、k）中的体素是否有点），因此我只有1个输入通道，就像2D图像中的灰度图像一样。我拥有的代码如下：在此之后，我得到以下错误使用TensorFlow后端。回溯（最后一次调用）：文
多输出卷积神经网络

我正在开发一种卷积神经网络用于图像分类或更好的车牌分类。这些车牌最多包含8个字符，每个字符可以包含37个字符（A-Z、0-9和空格）。我现在想知道如何设计网络中的最后两层。我认为，最后一个必须是具有37个概率的softmax层。这应该完全连接到一个（？）神经元在前一层？我想，在前一层我们需要8个神经元，因为之前的车牌上有8个字符，但我不确定。在此层之前，我添加了一些卷积层和maxPooling层。
卷积神经网络的维数

我正在试图理解卷积神经网络中的维度是如何表现的。在下图中，输入为带1个通道的28乘28矩阵。然后是32个5乘5的过滤器（高度和宽度步幅为2）。所以我理解结果是14乘14乘32。但是在下一个卷积层中，我们有64个5×5的滤波器（同样是步幅2）。那么为什么结果是7乘7乘64而不是7乘7乘32*64呢？我们不是将64个滤波器中的每一个应用于32个通道中的每一个吗？
十三、卷积神经网络

尽管 IBM 的深蓝超级计算机在1996年击败了国际象棋世界冠军 Garry Kasparvo，直到近几年计算机都不能可靠地完成一些看起来较为复杂的任务，比如判别照片中是否有狗以及识别语音。为什么这些任务对于人类而言如此简单？答案在于感知主要发生在我们意识领域之外，在我们大脑中的专门视觉，听觉和其他感官模块内。当感官信息达到我们的意识时，它已经被装饰了高级特征;例如，当你看着一只可爱的小狗的照片

三维卷积神经网络的滤波器尺寸和输出层

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档