朴素贝叶斯分类器动态训练

严令秋

2023-03-14

x_train, x_test, y_train, y_test = tts(features, labels, test_size=0.2)
clf = MultinomialNB()
for i in range(len(x_train)):
    clf.fit([x_train[i]], [y_train[i]])
preds = clf.predict(x_test)

x_train, x_test, y_train, y_test = tts(features, labels, test_size=0.2)
clf = MultinomialNB()
clf.fit(x_train, y_train)
preds = clf.predict(x_test)

共有1个答案

子车高超

2023-03-14

Scikit-learn支持多种算法的增量学习，包括MultinomialNB。在这里查看文档

您需要使用partial_fit()而不是fit()方法，因此示例代码如下所示：

x_train, x_test, y_train, y_test = tts(features, labels, test_size=0.2)
clf = MultinomialNB()
for i in range(len(x_train)):
    if i == 0:
        clf.partial_fit([x_train[i]], [y_train[I]], classes=numpy.unique(y_train))
    else:
        clf.partial_fit([x_train[i]], [y_train[I]])
preds = clf.predict(x_test)

编辑：根据@bobwazowski的建议，将classes参数添加到partial_fit

类似资料：

训练朴素贝叶斯分类器

我正在开发一个朴素的贝叶斯分类器使用简单的词袋概念。我的问题是，在朴素贝叶斯或任何其他机器学习中，senario'训练‘分类器是一个重要的问题。但是当我已经有了一个不同类别的词包时，如何训练朴素贝叶斯分类器呢？
stanford-nlp朴素贝叶斯分类器训练

作为理解用于分类的斯坦福nlp api的一部分，我在一个非常简单的训练集（3个标签=>['快乐'、'悲伤'、'中立'])上训练朴素贝叶斯分类器。此训练数据集为
朴素贝叶斯 - 朴素贝叶斯

还是让我们回到运动员的例子。如果我问你Brittney Griner的运动项目是什么，她有6尺8寸高，207磅重，你会说“篮球”；我再问你对此分类的准确度有多少信心，你会回答“非常有信心”。我再问你Heather Zurich，6尺1寸高，重176磅，你可能就不能确定地说她是打篮球的了，至少不会像之前判定Brittney那样肯定。因为从Heather的身高体重来看她也有可能是跑马拉松的。最后，
朴素贝叶斯分类器与训练数据

当用整个集合测试时，当使用分类器对一组新的tweet进行测试时，它只返回“中性”作为标签，但当使用30个时，它只返回正，这是否意味着我的训练数据不完整或过于“加权”中性条目，以及我的分类器在使用大约4000个tweet时只返回中性的原因？我已经在下面包括了我的完整代码。
朴素贝叶斯 - 使用Python编写朴素贝叶斯分类器

上例的数据格式如下： both sedentary moderate yes i100 both sedentary moderate no i100 health sedentary moderate yes i500 appearance active moderate yes i500 appearance moderate aggressive yes i500
在NLTK中保存朴素贝叶斯训练分类器

问题内容：关于如何保存经过训练的分类器，我有些困惑。就像在其中一样，每次我想使用分类器时都要对其进行重新训练显然很糟糕而且很慢，如何保存它并在需要时再次加载它？代码如下，在此先感谢您的帮助。我正在将Python与NLTK朴素贝叶斯分类器一起使用。问题答案：保存：稍后加载：

朴素贝叶斯分类器动态训练

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档