问题：

keras中的Flattle（）和GlobalAveragePoolig2D（）有什么区别

况喜

2023-03-14

我想将ConvLSTM和Conv2D的输出传递给Keras中的密集层，使用全局平均池和扁平化两者之间的区别在我的情况下都有效。

python prettyprint-override">model.add(ConvLSTM2D(filters=256,kernel_size=(3,3)))
model.add(Flatten())
# or model.add(GlobalAveragePooling2D())
model.add(Dense(256,activation='relu'))

共有3个答案

何昆

2023-03-14

扁平化是无需动脑筋的，它只需通过重新排列元素将多维对象转换为一维。

而GlobalAveragePoling是一种用于更好地表示向量的方法论。它可以是1D/2D/3D。它使用一个解析器窗口，该窗口在对象之间移动，并通过对其进行平均（GlobalAveragePoing）或选择最大值（GlobalMaxPoing）来汇集数据。将角落情况带入帐户基本上需要填充。

两者都用于以更简单的方式考虑排序的效果。

卜和悌

2023-03-14

在卷积运算之后，tf。凯拉斯。图层。展平将张量重塑为（n\u个样本，高度*宽度*通道），例如将（16，28，28，3）转换为（16，2352）。让我们试试：

import tensorflow as tf

x = tf.random.uniform(shape=(100, 28, 28, 3), minval=0, maxval=256, dtype=tf.int32)

flat = tf.keras.layers.Flatten()

flat(x).shape

TensorShape([100, 2352])

在卷积操作之后，tf.keras.layers.GlobalAveragePoling层根据最后一个轴对所有值进行平均。这意味着生成的形状将是（n_samples，last_axis）。例如，如果您的最后一个卷积层有64个过滤器，它会将（16, 7, 7, 64)变成（16,64）。让我们在进行一些卷积操作之后进行测试：

import tensorflow as tf

x = tf.cast(
    tf.random.uniform(shape=(16, 28, 28, 3), minval=0, maxval=256, dtype=tf.int32),
    tf.float32)


gap = tf.keras.layers.GlobalAveragePooling2D()

for i in range(5):
    conv = tf.keras.layers.Conv2D(64, 3)
    x = conv(x)
    print(x.shape)

print(gap(x).shape)

(16, 24, 24, 64)
(16, 22, 22, 64)
(16, 20, 20, 64)
(16, 18, 18, 64)
(16, 16, 16, 64)

(16, 64)

Flatten层将始终具有至少与GlobalAveragePooling2D层一样多的参数。如果展平前的最终张量形状仍然很大，例如（16, 240, 240, 128)，使用Flatten将产生大量的参数：240*240*128 = 7,372,800。这个巨大的数字将乘以您下一个密集层中的单元数！在那一刻，GlobalAveragePooling2D在大多数情况下可能是首选。如果您使用MaxPooling2D和Conv2D以至于展平前的张量形状就像（16, 1, 1, 128)，它不会有什么不同。如果您过度拟合，您可能需要尝试GlobalAveragePooling2D。

龙正初

2023-03-14

这两者似乎都起作用，但并不意味着它们的作用相同。

展平将采用任何形状的张量，并将其转换为一维张量（加上样本维度），但保留张量中的所有值。例如，张量（样本，10，20，1）将展平为（样本，10*20*1）。

GlobalAveragePoolig2D做了一些不同的事情。它在空间维度上应用平均池，直到每个空间维度都是一个，而其他维度保持不变。在这种情况下，值不会保持为平均值。例如，假设第二维度和第三维度是空间维度（最后一个通道），则张量（样本10、20、1）将输出为（样本1、1、1）。

keras中的Flattle（）和GlobalAveragePoolig2D（）有什么区别

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档