当前位置: 首页 > 知识库问答 >
问题:

我可以将卷积神经网络视为完全连接的神经网络吗

牛兴安
2023-03-14

例如,有一个3乘3的图像,

有两个2x2滤波器的卷积神经网络卷积图像

最后,输出的维是2x2x2

我可以将上述程序视为以下内容吗?

由于2x2过滤器,在整个图像上滑动后,我得到了4个小图像

并使用这4幅小图像作为全连接神经网络的输入

最后我也能得到8个输出

我真的不知道CNN中的反向传播,所以我试图从经典的全连接神经网络中理解它。

通过输入一幅小图像,我们可以一次性更新全连接神经网络中的权重,这与更新CNN中过滤器的权重是一样的吗?

我想得对吗?

共有1个答案

安毅
2023-03-14

简言之,是的。您可以将CNN视为(在其他可能的解释中):

>

  • 直接计算卷积运算和梯度的神经网络(典型方法)
  • 一个具有权重共享的完全连接的网络,因此为了简单起见,让我们假设输入是大小为3的1d,并且您的内核大小为2,所以它看起来像

    [X1 X2 X3]conv[w1 w2]=[X1w1 X2w2 X2w1 X3w3]

    这相当于有一个完全连接的网络,其权重vij表示“第i个输入神经元和第j个隐藏神经元之间的权重”

    X1
    X2     h1 = X1v11+X2v21+X3v31
    X3     h2 = X1v12+X2v22+X3v32
    

    因此,如果您将v31=v12=0v11=v22v21=v32您会得到完全相同的网络。相等我的意思是字面上这是同一个变量(因此词权重共享)。

    小神经网络的集合(同样,具有权重共享),它们连接到不同的小输入块(您提议的)。所以您的整个模型看起来像:

                       /-patch 1 -- shared fully connected net\ 
    Input --splitting----patch 2 -- shared fully connected net--merging---
                       .                                      .
                       .                                      . 
                       \-patch K -- shared fully connected net/ 
    

    这只是同一对象的三个视图,在这两种情况下,如果计算偏导数(梯度),最终将得到完全相同的方程。

  •  类似资料:
    • 注意: 本教程适用于对Tensorflow有丰富经验的用户,并假定用户有机器学习相关领域的专业知识和经验。 概述 对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题,其任务是对一组大小为32x32的RGB图像进行分类,这些图像涵盖了10个类别: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。 想了解更多信息请参考CIFAR-10 page,以及Alex Kriz

    • 卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络

    • 在了解了机器学习概念之后,现在可以将注意力转移到深度学习概念上。深度学习是机器学习的一个分支。深度学习实现的示例包括图像识别和语音识别等应用。 以下是两种重要的深度神经网络 - 卷积神经网络 递归神经网络 在本章中,我们将重点介绍CNN - 卷积神经网络。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。CNN与其他普通神经网络之间的主要区别在于

    • 主要内容:卷积神经网络深度学习是机器学习的一个分支,它是近几十年来研究人员突破的关键步骤。深度学习实现的示例包括图像识别和语音识别等应用。 下面给出了两种重要的深度神经网络 - 卷积神经网络 递归神经网络。 在本章中,我们将关注第一种类型,即卷积神经网络(CNN)。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。 CNN与任何其他普通神经网络之间的主要区别在于CNN

    • 注意: 本教程适用于对Tensorflow有丰富经验的用户,并假定用户有机器学习相关领域的专业知识和经验。 概述 对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题,其任务是对一组32x32RGB的图像进行分类,这些图像涵盖了10个类别: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。 想了解更多信息请参考CIFAR-10 page,以及Alex Krizhev

    • 在“多层感知机的从零开始实现”一节里我们构造了一个含单隐藏层的多层感知机模型来对Fashion-MNIST数据集中的图像进行分类。每张图像高和宽均是28像素。我们将图像中的像素逐行展开,得到长度为784的向量,并输入进全连接层中。然而,这种分类方法有一定的局限性。 图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。 对于大尺寸的输入图像,使用全连接层容易造成模型过大