增加类别

连俊智

2023-03-14

问题内容：

我建立了一个TensorFlow模型，该模型使用DNNClassifier将输入分为两类。

我的问题是，结果1的发生率高达90-95％。因此，TensorFlow为我的所有预测提供了相同的概率。

我正在尝试预测其他结果（例如，对结果2做出假阳性比错过可能发生的结果2更可取）。我知道，一般而言，在机器学习中，这种情况下值得尝试提高结果2。

但是，我不知道如何在TensorFlow中执行此操作。该文件暗指这是可能的，但我找不到它实际上看起来像任何例子。有没有人成功完成此操作，或者有人知道我在哪里可以找到一些示例代码或详尽的说明（我正在使用Python）？

注意：当有人使用TensorFlow的更基本部分而不是估计量时，我已经看到了暴露的权重被操纵。出于维护原因，我需要使用估算器执行此操作。

问题答案：

tf.estimator.DNNClassifier构造函数具有weight_column参数：

weight_column
：字符串或_NumericColumn通过tf.feature_column.numeric_column定义表示权重的特征列而创建的
。在训练过程中，它可用于减轻体重或增强示例效果。它将乘以示例的损失。如果是字符串，则用作从中获取权重张量的键features。如果为_NumericColumn，则通过key获取原始张量weight_column.key，然后
weight_column.normalizer_fn将其应用于权重张量。

因此，只需添加一个新列并为稀有类填充一些权重即可：

weight = tf.feature_column.numeric_column('weight')
...
tf.estimator.DNNClassifier(..., weight_column=weight)

[更新] 这是一个完整的工作示例：

import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('mnist', one_hot=False)
train_x, train_y = mnist.train.next_batch(1024)
test_x, test_y = mnist.test.images, mnist.test.labels

x_column = tf.feature_column.numeric_column('x', shape=[784])
weight_column = tf.feature_column.numeric_column('weight')
classifier = tf.estimator.DNNClassifier(feature_columns=[x_column],
                                        hidden_units=[100, 100],
                                        weight_column=weight_column,
                                        n_classes=10)

# Training
train_input_fn = tf.estimator.inputs.numpy_input_fn(x={'x': train_x, 'weight': np.ones(train_x.shape[0])},
                                                    y=train_y.astype(np.int32),
                                                    num_epochs=None, shuffle=True)
classifier.train(input_fn=train_input_fn, steps=1000)

# Testing
test_input_fn = tf.estimator.inputs.numpy_input_fn(x={'x': test_x, 'weight': np.ones(test_x.shape[0])},
                                                   y=test_y.astype(np.int32),
                                                   num_epochs=1, shuffle=False)
acc = classifier.evaluate(input_fn=test_input_fn)
print('Test Accuracy: %.3f' % acc['accuracy'])

增加类别

相关阅读

相关文章

相关问答

相关工具

相关文档