问题：

卷积神经网络核大小的变化

和和裕

2023-03-14

我一直在从头开始创建卷积神经网络，对于如何对待隐藏卷积层的内核大小有点困惑。例如，假设我有一个MNIST图像作为input(28 x 28)并将其通过以下层。

卷积层，kernel_size=（5,5）并具有32个输出通道

吞吐量的新维度=(32,28,28)

null

由于最初的输入是二维图像，我不知道如何对隐藏层进行卷积，因为现在的输入是三维的(32x14x14)。

共有1个答案

伍皓

2023-03-14

您需要64个内核，每个内核的大小为（32,5,5）。

内核的深度(#channels)，在本例中为32，或者RGB图像为3，灰度为1，等等，应该总是与输入深度匹配，但值都是相同的。例如，如果你有一个3x3的内核，像这样:[-1 0 1；-2 0 2；-1 0 1]现在你想把它与一个以N为深度的输入卷积，或者说通道，你只需在三维中将这个3x3内核复制N次，下面的数学就像1通道的情况一样，你将内核窗口当前所在的所有N个通道中的所有值相加，然后将内核值与它们相乘，得到一个条目或像素的值。所以你最终得到的输出是一个1通道的矩阵：）你希望下一层的矩阵有多少深度？这是你应该应用的核数。因此在你的例子中，它是一个这样大小的核（64 x 32 x 5 x 5），实际上是64个核，每个核有32个通道，所有的核都有相同的5x5值。

（“我不是一个很有信心的英语说者，希望你能听懂我说的话，如果有人编辑这个就好了：）”）

类似资料：

卷积神经网络，卷积矩阵（核）

下午好在第一阶段，在卷积神经网络（输入层）的输入上，我们接收一个源图像（因此是手写英文字母的图像）。首先，我们使用一个从左到右的nxn窗口来扫描图像并在内核（卷积矩阵）上乘法来构建特征映射？但没有人写过内核应该具有什么样的精确值（换句话说，我应该将从n*n窗口检索到的数据相乘到什么样的内核值）。是否适合在这个用于边缘检测的卷积核上乘以数据？有许多卷积核（浮雕、高斯滤波器、边缘检测、角度检测等）？但
卷积神经网络

注意: 本教程适用于对Tensorflow有丰富经验的用户，并假定用户有机器学习相关领域的专业知识和经验。概述对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题，其任务是对一组大小为32x32的RGB图像进行分类，这些图像涵盖了10个类别：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船以及卡车。想了解更多信息请参考CIFAR-10 page，以及Alex Kriz
卷积神经网络

卷积神经网络（Convolutional Neural Network, CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层（对应经典的神经网络）组成，同时也包括关联权重和池化层（pooling layer）。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网络
TensorFlow卷积神经网络

在了解了机器学习概念之后，现在可以将注意力转移到深度学习概念上。深度学习是机器学习的一个分支。深度学习实现的示例包括图像识别和语音识别等应用。以下是两种重要的深度神经网络 - 卷积神经网络递归神经网络在本章中，我们将重点介绍CNN - 卷积神经网络。卷积神经网络卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。CNN与其他普通神经网络之间的主要区别在于
PyTorch卷积神经网络

主要内容：卷积神经网络深度学习是机器学习的一个分支，它是近几十年来研究人员突破的关键步骤。深度学习实现的示例包括图像识别和语音识别等应用。下面给出了两种重要的深度神经网络 - 卷积神经网络递归神经网络。在本章中，我们将关注第一种类型，即卷积神经网络(CNN)。卷积神经网络卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。 CNN与任何其他普通神经网络之间的主要区别在于CNN
2.6 卷积神经网络

注意: 本教程适用于对Tensorflow有丰富经验的用户，并假定用户有机器学习相关领域的专业知识和经验。概述对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题，其任务是对一组32x32RGB的图像进行分类，这些图像涵盖了10个类别：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船以及卡车。想了解更多信息请参考CIFAR-10 page，以及Alex Krizhev

卷积神经网络核大小的变化

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档