问题：

卷积核需要在CNN（卷积神经网络）中设计吗？

顾跃

2023-03-14

我是卷积神经网络的新手。我正在阅读一些教程，并使用Keras测试一些示例代码。要添加卷积层，基本上我只需要指定内核的数量和大小。

我的问题是每个内核是什么样子的？它们是所有计算机视觉应用程序的通用工具吗？

共有2个答案

宇文鸿畴

2023-03-14

实际的内核值是在学习过程中学习的，这就是为什么只需要设置内核的数量和大小。

可能令人困惑的是，学习到的内核值实际上模仿了Gabor和边缘检测过滤器等东西。这些对于许多计算机视觉应用程序来说都是通用的，但它们不是手动设计的，而是从大型分类数据集（如ImageNet）学习的。

此外，内核值是特征层次结构的一部分，可直接用作各种计算机视觉问题的特征。在这方面，它们也是通用的。

邹山

2023-03-14

我的问题是每个内核看起来像什么？

这取决于您为卷积层选择的参数：

它确实取决于您提到的kernel_size参数，因为它将决定内核的形状和大小。假设您将此参数传递为（3,3）（自然在Conv2D层上），然后您将获得一个3x3内核矩阵。

它将取决于您的kernel_initializer参数，该参数决定了MxN Kernel Matrix的填充方式。它的默认值是"glorot_uniform"，在其文档页面中有解释：

Glorot均匀初始化器，也称为Xavier均匀初始化器。它从[-极限，极限]内的均匀分布中抽取样本，其中极限为sqrt（6/（fan_infan_out）），其中fan_in是权重张量中的审进量单位，fan_out是权重张量中的输出单位数。

这告诉我们它填充内核矩阵的具体方式。您可以根据需要选择任何其他内核初始值设定项。您甚至可以构建自定义初始值设定项，也可以在文档页面中进行示例：

from keras import backend as K

def my_init(shape, dtype=None):
    #or whatever you want to customize
    return K.random_normal(shape, dtype=dtype)

model.add(Dense(64, kernel_initializer=my_init))

此外，它将取决于您的kernel\u正则化器参数，该参数定义了应用于内核权重的正则化函数。默认值为“无”，但您可以从可用值中选择其他值。您可以以类似的方式再次定义自己的自定义初始值设定项：

def l1_reg(weight_matrix):
    #same here, fit your own needs
    return 0.01 * K.sum(K.abs(weight_matrix))

model.add(Dense(64, input_dim=64,
        kernel_regularizer=l1_reg)

它们是所有计算机视觉应用程序的通用工具吗？

我认为这可能有点宽泛，但我冒昧地说是的。Keras提供了许多旨在专门适应深度学习应用程序的内核；它包括那些在文献和知名应用程序中最常用的内核。

好的是，如前所述，如果这些内核中的任何一个不符合您的需要，您可以很好地定义自己的自定义初始值设定项，或者通过使用正则化来增强它。这使您能够解决您可能遇到的那些真正特定的CV问题。

卷积核需要在CNN（卷积神经网络）中设计吗？

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档