我最近开始使用weka,我正试图使用朴素贝叶斯将推特分类为正面或负面。所以我有一个训练集,上面有我给的标签,还有一个测试集,上面有所有标签都是“肯定的”。当我运行Naive Bayes时,我得到以下结果:
正确分类实例:69 92%错误分类实例:6 8%
然后,如果我将测试集中推文的标签更改为“否定”并再次运行朴素贝叶斯,结果会颠倒:
分类正确的实例:6.8%分类错误的实例:69.92%
我认为正确分类的实例显示了朴素贝叶斯的准确性,并且无论测试集中推文的标签如何,它都应该是相同的。是我的数据有问题还是我没有正确理解正确分类实例的含义?
非常感谢您抽出时间,
南田
根据您的培训集,69.92%的实例被归类为阳性。如果测试集的标签(即正确答案)表明它们都是阳性的,则正确率为69.92%。如果测试集(以及分类)是相同的,但您切换了正确的答案,那么正确的百分比当然也会相反。
请记住,为了评估分类器,您需要测试集的真实标签。否则您无法将分类器的答案与真实答案进行比较。在我看来,您可能误解了这一点。如果您想要的话,您可以获取未看到数据的标签,但在这种情况下,您无法评估分类器的准确性。
测试集上的标签应该是实际正确的分类。通过要求分类器对测试集中每个实例的分类给出最佳猜测来计算性能。然后将预测的分类与实际分类进行比较,以确定准确性。因此,如果您翻转所给的“正确”值,结果也将被翻转。
我今天开始使用Weka。我使用一个包含虚拟信息的. arff文件。然后,我使用weka来获取结果。但是,问题是我不确定weka正在做什么来获取结果。例如,使用Heoffding Tree,我在错误分类的结果上得到了75%和25%的正确分类实例结果;75%到底是什么?weka做了什么来获得75%的正确分类结果?谢谢!
我正在为一个方法编写测试,该方法为不同的扩展文件返回。 对于返回 对于非压缩文件返回 如何断言OutputStreamWriter包含或?
我是weka的新手。我有一个csv数据集,有5000个样本。这里有20个样本;当我将这个数据集上传到weka时,它看起来还可以,但是当我运行knn算法时,它会给出一个不应该给出的结果。这是样本数据。 a, b, c, d 74,85,123,1 73,84,122,1 72,83,121,1 70,81,119,1 70,81,119,1 69,80,118,1 70,81,119,1 70,81
问题内容: 我是JAVA的新手,因此遇到了这个词。“在方法内部创建的类,在Java中称为本地内部类。如果要调用本地内部类的方法,则必须在方法内部 实例化 该类”。粗体字。任何人都可以帮我解决这个问题。我知道这很尴尬,我应该做更多的研究,但我只是不明白。谢谢。 问题答案: 首先 声明的意思是 : 实例化的 简单含义 是从class创建一个对象 。 什么是物体? 类的实例。从一个类中,我们可以创建许多
问题内容: 有一个像这样的简单Python类: 我想检查以下约束: “说明不能为空” “值必须大于零” 我应该: 1.在创建垃圾邮件对象之前验证数据吗? 2.检查方法上的数据? 3.在Spam类上创建一个方法,并使用spam.isValid()进行调用? 4.在Spam类上创建一个静态方法,并使用Spam.isValid(description,value)进行调用? 5.检查二传手声明中的数据?
我对Java有很好的理解,但我正在努力学习c来制作游戏,因为我认为c是一种更好的语言。但是我对c有一些问题。 是一个带有字符串构造函数的类,只是在这个类中声明它会导致错误。如果我删除的构造函数,我不会得到错误。 错误:render.cpp:3:16:错误:没有匹配的函数调用着色器::着色器()