我想在weka中进行分类。我正在使用一些方法(随机树、随机森林、决策表、随机子空间...),但它们会给出如下结果。
=== Cross-validation ===
=== Summary ===
Correlation coefficient 0.1678
Mean absolute error 0.4832
Root mean squared error 0.4931
Relative absolute error 96.6501 %
Root relative squared error 98.6323 %
Total Number of Instances 100000
然而,我希望结果作为准确度和混淆矩阵。我怎样才能得到这样的结果?
注意:当我使用小数据集时,它会以混淆矩阵的形式给出结果。它可以与数据集的大小相关吗?
我使用J48和RandomForest运行了一个2类问题,有100000个实例,混乱矩阵显示正确。此外,我还增加了问题的复杂性,以运行20个不同的类,混淆矩阵也正确显示。
如果查看更多选项,请确保选中“输出混淆矩阵”,并查看这是否解决了问题。
Weka中训练/测试的输出取决于您试图预测的属性的类型。如果您的属性是标称的,您将获得混淆矩阵和准确度值。如果您的属性是数字的,您将获得相关系数。
在您提到的小型和大型数据集中,您预测的属性类型是什么?
如何分析Weka中的混淆矩阵,以获得准确度?我们知道,由于数据集不平衡,精度不准确。混淆矩阵如何“确认”准确性? 示例:a)准确率96.1728% b) 准确率:96.8% 等...
对不起,我是新来WEKA,刚刚学习。 在我的决策树(J48)分类器输出中,有一个混淆矩阵: 我如何读取这个矩阵?
我正在从事一个垃圾邮件过滤器挖掘项目,目前我正在使用NaiveBayesMultinomical分类器,通过计算单词出现的频率将垃圾邮件与非垃圾邮件进行分类。 问题是,WEKA在默认情况下将分类阈值设置为0.5。然而,将非垃圾邮件误分类为垃圾邮件比反之更有害。 我想调整WEKA的NaiveBayesMultinomical算法的阈值,看看混淆矩阵是如何变化的。如果不能直接实现,我如何利用WEKA的
我对数据挖掘并不陌生,所以我完全被WEKA结果难倒了。希望得到一些帮助。提前谢谢! 我有一个具有二分类(S, H)的数值向量数据集。我在省略交叉验证中训练了一个朴素贝叶斯模型(尽管方法真的无关紧要)。结果如下: 如您所见,输出和混淆矩阵都有三个错误。然后,我使用具有相同属性和相同两个类的独立数据集重新评估模型。结果如下: 这就是我的问题所在。输出清楚地显示有很多错误。事实上,有44个。另一方面,混
我正在对实际数据和来自分类器的预测数据进行多标签分类。实际数据包括三类(c1、c2和c3),同样,预测数据也包括三类(c1、c2和c3)。数据如下 在多标签分类中,文档可能属于多个类别。在上述数据中,1表示文档属于特定类,0表示文档不属于特定类。 第一行Actual\u数据表示文档属于c1类和c2类,不属于c3类。类似地,第一行predicted\u数据表示文档属于类别c1、c2和c3。 最初我使