问题：

Keras模型分类，为每个模型重新编译返回不同的结果

上官砚文

2023-03-14

def create_model(model_name,data,test_data):

# lets take 80% data as training and remaining 20% for test.
train_size = int(len(data) * .9)
test_size = int(len(data) * .4)

train_headlines = data['Subject']
train_category = data['Category']
train_activities = data['Activity']

test_headlines = data['Subject'][:test_size]
test_category = data['Category'][:test_size]
test_activities = data['Activity'][:test_size]
# define Tokenizer with Vocab Sizes
vocab_size1 = 10000 
vocab_size2 = 5000
batch_size = 100
tokenizer = Tokenizer(num_words=vocab_size1)
tokenizer2 = Tokenizer(num_words=vocab_size2)

test_headlines=test_headlines.astype(str)
train_headlines=train_headlines.astype(str)
test_category=test_category.astype(str)
train_category=train_category.astype(str)

tokenizer.fit_on_texts(test_headlines)
tokenizer2.fit_on_texts(test_category)
x_train = tokenizer.texts_to_matrix(train_headlines, mode='tfidf')
x_test = tokenizer.texts_to_matrix(test_headlines, mode='tfidf')

y_train = tokenizer2.texts_to_matrix(train_category, mode='tfidf')
y_test = tokenizer2.texts_to_matrix(test_category, mode='tfidf')


# load classes
labels = []
encoder = LabelBinarizer()
encoder.fit(train_activities)
text_labels = encoder.classes_    
with open('outputs/classes.txt', 'w') as f:
    for item in text_labels:
        f.write("%s\n" % item)  
z_train = encoder.transform(train_activities)
z_test = encoder.transform(test_activities)
num_classes = len(text_labels)
print ("num_classes: "+str(num_classes))


input1 = Input(shape=(vocab_size1,), name='main_input')
x1 = Dense(512, activation='relu')(input1)
x1 = Dense(64, activation='relu')(x1)
x1 = Dense(64, activation='relu')(x1)
input2 = Input(shape=(vocab_size2,), name='cat_input')
main_output = Dense(num_classes, activation='softmax', name='main_output')(x1)

model = Model(inputs=[input1, input2], outputs=[main_output])

model.compile(loss='categorical_crossentropy',
            optimizer='adam',
            metrics=['accuracy'])

model.summary() 
history = model.fit([x_train,y_train], z_train,
                    batch_size=batch_size,
                    epochs=30,
                    verbose=1,
                    validation_split=0.1)
score = model.evaluate([x_test,y_test], z_test,
    batch_size=batch_size, verbose=1)

print('Test accuracy:', score[1])

# serialize model to JSON
model_json = model.to_json()
with open("./outputs/my_model_"+model_name+".json", "w") as json_file:
    json_file.write(model_json)
# creates a HDF5 file 'my_model.h5'
model.save('./outputs/my_model_'+model_name+'.h5')

# Save Tokenizer i.e. Vocabulary
with open('./outputs/tokenizer'+model_name+'.pickle', 'wb') as handle:
    pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)

def validate_model(model_name,test_data,labels):

from keras.models import model_from_json
test_data['Subject'] = test_data['Subject'] + " " + test_data['Description']
headlines = test_data['Subject'].astype(str)     
categories = test_data['Category'].astype(str)

# load json and create model
json_file = open("./outputs/my_model_"+model_name+".json", 'r') 
loaded_model_json = json_file.read()
json_file.close()
model = model_from_json(loaded_model_json)
# load weights into new model
model.load_weights('./outputs/my_model_'+model_name+'.h5')
print("Loaded model from disk")
# loading
import pickle
with open('./outputs/tokenizer'+model_name+'.pickle', 'rb') as handle:
    tokenizer = pickle.load(handle)    
# Subjects 
x_pred = tokenizer.texts_to_matrix(headlines, mode='tfidf')
# Categorias
y_pred = tokenizer.texts_to_matrix(categories, mode='tfidf')  
predictions = []
scores = []
predictions_vetor = model.predict({'main_input': x_pred, 'cat_input': y_pred})

共有1个答案

翟学文

2023-03-14

我读了你的训练代码。

model.fit([x_train,y_train], z_train,
                batch_size=batch_size,
                epochs=30,
                verbose=1,
                validation_split=0.1)

您使用[x_train，y_train]作为特征，使用z_train作为模型的标签。y_train是标签的原始形式，z_train是标签的编码形式。

这样，您就会向训练集泄漏信息，从而导致过拟合的情况。你的模型根本没有泛化，因此预测了不相关的结果。

类似资料：

返回不同类型/类的方法的设计模式

这是一个面向对象设计模式专家的问题。假设我有一个类，负责读取/解析数据流（携带不同类型的信息包）。每个数据包都携带不同类型的信息，因此理想情况下，我会为每种类型的数据包创建一个类（，，…每个都有自己的接口）。然后，方法将遍历流，并将类（或指向类的指针或引用）返回到相应的包类型。你会用空指针吗？一个泛型类（）可以提供一个公共（部分）接口来查询数据包的类型（这样就可以在运行时做出任何决定），怎么
编译型模板

尽管 PHP 不断升级为成熟的、面向对象的语言，但它作为模板语言没有改善多少。编译型模板，比如 Twig、Brainy 或 Smarty，提供了模板专用的新语法，填补了这片空白。从自动转义到继承以及简化控制结构，编译模板设计地更容易编写，可读性更高，同时使用上也更加的安全。编译型模板甚至可以在不同的语言中使用，Mustache 就是一个很好的例子。由于这些模板需要编译，在性能上会带来一些轻微的影
从firebase查询返回null的模型类（查询结果不返回null）

Firebase查询返回此查询的值该项由model类捕获但是，返回null
为什么编译时不检查lambda返回类型？

使用的方法引用具有返回类型。但在以下示例中允许使用不兼容。如何使用声明方法以使方法引用类型安全而无需手动强制转换？我尝试在没有注释处理（自动值）或编译器插件（龙目岛）的情况下实现通用构建器
计算Keras MLP每个模型层的参数

我正试图跟随这篇关于如何计算每层参数的帖子，有人能给我一个提示吗？这是我的的输出：这是模型：
模拟返回void返回类型的存根

我有下面的课，我试图测试。我遇到问题的方法是，因为我试图存根/模拟行为，然后在测试中验证行为。

Keras模型分类，为每个模型重新编译返回不同的结果

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档