问题：

量化感知训练后如何合并ReLU

宣滨海

2023-03-14

我有一个包含Conv2D层的网络，然后是ReLU激活，声明如下：

x = layers.Conv2D(self.hparams['channels_count'], kernel_size=(4,1))(x)
x = layers.ReLU()(x)

它被移植到TFLite，具有以下代表性：

无Q感知训练的基本TFLite网络

然而，在网络上执行量化感知训练并再次移植后，ReLU层现在在图中是明确的：

TFLite网络在Q感知训练后

这导致它们在目标上被单独处理，而不是在Conv2D内核的评估期间，在我的整个网络中导致10%的性能损失。

使用以下隐式语法声明激活不会产生问题：

x = layers.Conv2D(self.hparams['channels_count'], kernel_size=(4,1), activation='relu')(x)

具有隐式ReLU激活的基本TFLite网络

Q感知训练后隐式ReLU的TFLite网络

然而，这将网络限制为基本的ReLU激活，而我希望使用ReLU6，它不能以这种方式声明。

这是TFLite问题吗？如果没有，是否有办法防止ReLU层被拆分？或者，在量化感知训练之后，是否有方法手动将ReLU层合并回Conv2D层？

编辑：QA培训代码：

def learn_qaware(self):
quantize_model = tfmot.quantization.keras.quantize_model
self.model = quantize_model(self.model)

training_generator = SCDataGenerator(self.training_set)
validate_generator = SCDataGenerator(self.validate_set)

self.model.compile(
            optimizer=self.configure_optimizers(qa_learn=True),
            loss=self.get_LLP_loss(),
            metrics=self.get_metrics(),
            run_eagerly=config['eager_mode'],
        )
self.model.fit(
    training_generator,
    epochs = self.hparams['max_epochs'],
    batch_size = 1,
    shuffle = self.hparams['shuffle_curves'],
    validation_data = validate_generator,
    callbacks = self.get_callbacks(qa_learn=True),
)

量化TFLite模型生成代码：

def tflite_convert(classifier):
output_file = get_tflite_filename(classifier.model_path)

# Convert the model to the TensorFlow Lite format without quantization
saved_shape = classifier.model.input.shape.as_list()
fixed_shape = saved_shape
fixed_shape[0] = 1
classifier.model.input.set_shape(fixed_shape) # Force batch size to 1 for generation
converter = tf.lite.TFLiteConverter.from_keras_model(classifier.model)
classifier.model.input.set_shape(saved_shape)

# Set the optimization flag.
converter.optimizations = [tf.lite.Optimize.DEFAULT]
# Enforce integer only quantization
converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS_INT8]
converter.inference_input_type = tf.int8
converter.inference_output_type = tf.int8
# Provide a representative dataset to ensure we quantize correctly.
if config['eager_mode']:
    tf.executing_eagerly()
def representative_dataset():
    for x in classifier.validate_set.get_all_inputs():
        rs = x.reshape(1, x.shape[0], 1, 1).astype(np.float32)
        yield([rs])

converter.representative_dataset = representative_dataset
model_tflite = converter.convert()

# Save the model to disk
open(output_file, "wb").write(model_tflite)

return TFLite_model(output_file)

共有2个答案

司马高明

2023-03-14

我已经找到了一种解决方法，通过实例化模型的非训练版本，然后在转换为TFLite之前复制量化感知训练模型的权重。

这似乎是一个相当大的黑客，所以我仍然在寻找一个更干净的解决方案。

解决方案的代码：

def dequantize(self):
    if not hasattr(self, 'fp_model') or not self.fp_model:
        self.fp_model = self.get_default_model()

    def find_layer_in_model(name, model):
        for layer in model.layers:
            if layer.name == name:
                return layer
        return None

    def find_weight_group_in_layer(name, layer):
        for weight_group in quant_layer.trainable_weights:
            if weight_group.name == name:
                return weight_group
        return None

    for layer in self.fp_model.layers:
        if 'input' in layer.name or 'quantize_layer' in layer.name:
            continue
        
        QUANT_TAG = "quant_"
        quant_layer = find_layer_in_model(QUANT_TAG+layer.name,self.model)
        if quant_layer is None:
            raise RuntimeError('Failed to match layer ' + layer.name)

        for i, weight_group in enumerate(layer.trainable_weights):
            quant_weight_group = find_weight_group_in_layer(QUANT_TAG+weight_group.name, quant_layer)
            if quant_weight_group is None:
                quant_weight_group = find_weight_group_in_layer(weight_group.name, quant_layer)
                if quant_weight_group is None:
                    raise RuntimeError('Failed to match weight group ' + weight_group.name)

            layer.trainable_weights[i].assign(quant_weight_group)

    self.model = self.fp_model

印曜灿

2023-03-14

您可以传递activation=tf。nn。relu6使用relu6激活。

类似资料：

如何通过TensorFlow的量化感知训练和实验量化获得量化权重

我正在使用TensorFlow的量化感知训练API，并希望部署一个具有任意比特宽度的模型。由于tflite部署仅支持8位量化，因此我将使用自定义推理算法进行部署，但我仍然需要访问正确大小的模型权重。目前，在使用量化感知训练后，我的模型仍然处于浮点状态，据我所知，访问量化权重的唯一方法是将模型转换为tflite格式。然而，在使用实验函数时，这是不可能的。这是我的量化配置类：下面是我如何量化模型
训练后

利用 Polar 应用程式、Polar Flow 应用程式以及 Polar Flow 网络服务获得有关您的训练的即时分析，深入了解您的训练。 M600 上的训练总结在每次训练后，您将在您的手表上收到您的即时训练总结。总结中显示的信息取决于运动内容。可提供的细节包括：时间长度：训练时长距离（如适用于您的运动）：指训练中已完成的距离。平均心率：指训练期间您的平均心率。最大心率：指训练期间您
如何训练Stanford NLP情感分析工具

链接到斯坦福情绪分析页面 “使用PTB格式的数据集，可以使用以下命令重新训练模型：” 来自dev.txt的示例（前导的4代表5...4/5正极性）
训练后的新模型与旧模型如何融合？

因此，主要的问题是：如何保留已有的模型数据并将新的数据添加到模型中？谢谢
Keras：如何保存模型并继续训练？

问题内容：我有一个训练了40个时代的模型。我为每个纪元保留了检查点，并且还用保存了模型。培训代码为：但是，当我加载模型并尝试再次对其进行训练时，它会像以前从未进行过训练一样从头开始。损失不是从上一次训练开始的。使我感到困惑的是，当我加载模型并重新定义模型结构并使用时，效果很好。因此，我相信模型权重已加载：但是，当我继续进行此训练时，损失与初始阶段一样高：我在这里和这里搜索并找到了一些保存
如何训练mobilenet-v1量化模型在TF Lite上的应用

我从Tensorflow Hub重新训练了一个mobilenet-v1图像分类模型，并使用toco对其进行转换，以便使用Tensorflow Lite进行推断。但是，当我使用tflite模型运行推断时，它需要与我使用指定的输入大小不同的输入大小。我如何在自己的数据上重新训练一个mobilenetv1量化模型？下面是我尝试的步骤： > 从tensorflow for poets Codelab

量化感知训练后如何合并ReLU

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档