问题：

为什么仅在CNN中通过通道进行批量标准化

邢皓

2023-03-14

我想知道，在卷积神经网络中，是否应该对每个像素分别应用批处理归一化，还是应该对每个通道取像素的平均值？

我在Tensorflow的tf描述中看到了这一点。图层。batch\u归一化建议对通道执行bn，但如果我回忆正确，我使用了另一种方法，效果很好。

共有3个答案

瞿宏儒

2023-03-14

我对此困惑了几个小时，因为对每个频道进行规范化是没有意义的，因为conv-net中的每个频道都被认为是不同的“特性”。一、 e.所有通道的标准化等同于以平方英尺为单位的卧室数量的标准化（Andrew的ML课程中的多元回归示例）。这不是规范化所做的-您所做的是规范化每个特征本身。一、 e.将所有示例中的卧室数量规格化为mu=0和std=1，并将所有示例中的平方英尺规格化为mu=0和std=1。

在自己检查和测试之后，我意识到问题是什么：这里有一点混淆/误解。您在Keras中指定的轴实际上是不在计算中的轴。也就是说，除了此参数指定的轴之外，您可以在每个轴上获得平均值。这很令人困惑，因为它与NumPy的工作方式完全相反，其中指定的轴是您进行操作的轴（例如np.mean、np.std等）。编辑：在此处检查此答案。

实际上，我建立了一个只有BN的玩具模型，然后手动计算BN——在所有3个第一维度（m、n\u W、n\u H）上取平均值，std，得到n\u C结果，计算（X-mu）/std（使用广播），得到与Keras结果相同的结果。

所以我对此很确定。

杨昊

2023-03-14

据我所知，在前馈（密集）层中，每个单元（神经元）应用批量归一化，因为它们每个都有自己的权重。因此，您可以跨特征轴进行归一化。

但是，在卷积层中，权重在输入之间共享，即每个特征映射对不同输入的“体积”应用相同的变换。因此，可以使用每个特征映射的平均值和方差（而不是每个单元/神经元）应用批处理规范化。

这就是为什么我猜测轴参数值存在差异。

罗法

2023-03-14

在CNN图像中，通道内的规范化很有帮助，因为权重在通道之间共享。另一篇论文中的图显示了我们如何处理BN。这有助于更好地理解。

图取自

Wu，Y.和He，K.，2018年。组规范化。arXiv预印本arXiv:1803.08494。

为什么仅在CNN中通过通道进行批量标准化

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档