问题：

卷积神经网络能输出图像吗？

方焱

2023-03-14

我正在研究一个深度学习问题，它需要我有一个深度学习模型，该模型具有输入图像和输出另一张图像。现在，输入和输出图像具有不同的维度，因此我不能使用自动编码器。我已经尝试构建一个非常简单的卷积神经网络，它有一个最终的输出密集层，该层以输出图像的宽度和高度相乘为“单位”参数。然而，我下面附加的这个网络没有成功。我的问题是：

CNN是不是像我这样处理这个问题的合适的深度学习网络
如果没有，我还可以尝试其他什么类型的深度学习网络来解决这个问题

提前感谢！

以下是我已经尝试过的CNN模式的总结：

conv2d_1（Conv2D）（无，26, 877, 32) 544

activation\u 1（activation）（无，26，877，32）0

最大池2D\U 1（最大池2（无、13、438、32）0

conv2d\U 2（conv2d）（无、12437、16）2064

activation\u 2（激活）（无、12、437、16）0

最大池2D\U 2（最大池2（无、6、218、16）0

conv2d\U 3（conv2d）（无、5、217、8）520

激活\u 3（激活）（无、5、217、8）0

最大池2D\U 3（最大池2（无、2、108、8）0

activation\u 4（激活）（无、2、108、8）0

展平\u 1（展平）（无，1728）0

dropout\u 1（dropout）（无，1728）0

dense_1（密集）（无，19316) 33397364

=========================================================总参数：33400492可训练参数：33400492不可训练参数：0

def generator(data_arr, batch_size = 10):

num = len(data_arr) 

if num % batch_size != 0 : 
    num = int(num/batch_size)

# Loop forever so the generator never terminates
while True: 

for offset in range(0, num, batch_size):

    batch_samples = (data_arr[offset:offset+batch_size])

    samples = []
    labels = []

    for batch_sample in batch_samples:

        samples.append(batch_sample[0])
        labels.append((np.array(batch_sample[1].flatten)).transpose())

    X_ = np.array(samples)
    Y_ = np.array(labels)

    X_ = X_[:, :, :, newaxis]

    yield (X_, Y_)

# compile and train the model using the generator function
train_generator = generator(training_data, batch_size = 10)
validation_generator = generator(val_data, batch_size = 10)

run_opts = tf.RunOptions(report_tensor_allocations_upon_oom = True)

model = Sequential()

model.add(Conv2D(32, (4, 4), strides=(2, 2), input_shape = (55, 1756, 
1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(16, (2, 2)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(8, (2, 2)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Activation('softmax'))
model.add(Flatten())  
model.add(Dropout(0.3))
model.add(Dense(19316))

model.compile(loss = 'categorical_crossentropy',
              optimizer = 'adam',
              metrics = ['accuracy'],
              options = run_opts)

model.summary()

batch_size = 20
nb_epoch = 6

model.fit_generator(train_generator, 
                    steps_per_epoch = len(training_data) ,
                    epochs = nb_epoch,
                    validation_data = validation_generator,
                    validation_steps = len(val_data))

共有1个答案

益智明

2023-03-14

我建议您使用一种UNet。这种架构具有下采样层，然后是上采样层以返回原始空间维度。

请参阅此图像回归文章

类似资料：

多输出卷积神经网络

我正在开发一种卷积神经网络用于图像分类或更好的车牌分类。这些车牌最多包含8个字符，每个字符可以包含37个字符（A-Z、0-9和空格）。我现在想知道如何设计网络中的最后两层。我认为，最后一个必须是具有37个概率的softmax层。这应该完全连接到一个（？）神经元在前一层？我想，在前一层我们需要8个神经元，因为之前的车牌上有8个字符，但我不确定。在此层之前，我添加了一些卷积层和maxPooling层。
灰度图像的卷积神经网络

我正在尝试运行一个CNN（卷积神经网络），具有1通道/灰度图像，大小为28x28像素。当我尝试训练模型时，它说： ValueError：图层sequential_5输入0与图层不兼容:: 预期min_ndim=4，发现ndim=3。完整形状收到：[无，28,28]
卷积神经网络

注意: 本教程适用于对Tensorflow有丰富经验的用户，并假定用户有机器学习相关领域的专业知识和经验。概述对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题，其任务是对一组大小为32x32的RGB图像进行分类，这些图像涵盖了10个类别：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船以及卡车。想了解更多信息请参考CIFAR-10 page，以及Alex Kriz
卷积神经网络

卷积神经网络（Convolutional Neural Network, CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层（对应经典的神经网络）组成，同时也包括关联权重和池化层（pooling layer）。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网络
TensorFlow卷积神经网络

在了解了机器学习概念之后，现在可以将注意力转移到深度学习概念上。深度学习是机器学习的一个分支。深度学习实现的示例包括图像识别和语音识别等应用。以下是两种重要的深度神经网络 - 卷积神经网络递归神经网络在本章中，我们将重点介绍CNN - 卷积神经网络。卷积神经网络卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。CNN与其他普通神经网络之间的主要区别在于
PyTorch卷积神经网络

主要内容：卷积神经网络深度学习是机器学习的一个分支，它是近几十年来研究人员突破的关键步骤。深度学习实现的示例包括图像识别和语音识别等应用。下面给出了两种重要的深度神经网络 - 卷积神经网络递归神经网络。在本章中，我们将关注第一种类型，即卷积神经网络(CNN)。卷积神经网络卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。 CNN与任何其他普通神经网络之间的主要区别在于CNN

卷积神经网络能输出图像吗？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档