当前位置: 首页 > 知识库问答 >
问题:

从Stanford分类器输出置信度得分的方法?

云鸿祯
2023-03-14

下面是我在包装器中使用的Java类/方法:

         //.....
         LinearClassifier<String, String> trainedClassifier = 
         IOUtils.readObjectFromFile("myClassifier.ser.gz");

         //Have to call *.prop every time
         ColumnDataClassifier myProp = 
           new ColumnDataClassifier("myClassifierProp.prop");

         //Specify the temporary one sentence file saved in class-tmp.txt
         for (String line : ObjectBank.getLineIterator("class-tmp.txt")) 
               { Datum<String,String> classType = myProp.makeDatumFromLine(line, 0); 
                 classOutput = trainedClassifier.classOf(classType);

                 System.out.println("stringCategory: "+ classOutput + "/n");
                  //end of for
                  //.....

共有1个答案

宿镜
2023-03-14

您可以使用方法counter scoresOf(datum example); (用分类器的标签键构造一个计数器,并对每个类的得分(非规范化日志概率)进行赋值)可以在分类器接口中找到。您可以这样使用它:trainedclassifier.scoresof(classType)。在这种情况下,这将返回计数器 。要查找输出类的得分,可以使用以下代码:

score = Double.toString(trainedClassifier.scoresOf(classType).getCount(classOutput));
System.out.println("Confidence score: " + score);

我做了一个像上面一样的项目。您也可以尝试这种方法:

score = trainedClassifier.scoreOf(classType, classOutput);

我想这也能完成任务。

 类似资料:
  • 我们正在学习stanford-nlp分类器的用法。正如它的维基页面所说,它可以用来建立像虹膜这样的数字数据的分类模型:http://www-nlp.stanford.edu/wiki/software/classifier#iris_data_set 但是在解释输出时,我们在其中一些方面遇到了困难:输入属性有4列(1-value、2-value、3-value、4-value),输出标签有一列(I

  • 我想使用斯坦福分类器进行文本分类。我的特征主要是文本特征,但也有一些数字特征(例如句子的长度)。 我从ClassifierExample开始,并用一个简单的实值特性替换当前特性,如果停止灯,则值,否则,这将导致以下代码(除了第10-16行的函数之外,这只是原始ClassifierExample类的代码): 根据我对线性分类器的理解,特性应该使分类任务变得非常容易--毕竟,我们只需要检查的值是否大于

  • 问题内容: 我正在尝试实现类似于的功能,如果日志具有一定的长度,它将仅对输出进行分页。如果您不熟悉git,那么我实际上是在尝试实现这一点: 借助python2.6 / pydoc.py中的分页实现的一些帮助,我得以提出以下建议: 效果很好,但是不推荐使用os.popen()。我已经考虑过写入一个临时文件并减少其路径调用,但这似乎并不理想。子流程有可能吗?还有其他想法吗? 编辑: 所以我已经使子流程

  • 但是,我还没能在Stanford CorenLP中找到任何文本分类的注释器。我有什么办法可以实现我的想法。更好的是,有没有更好的方法来实现我想要实现的目标。 提前谢了。

  • 作为理解用于分类的斯坦福nlp api的一部分,我在一个非常简单的训练集(3个标签=>['快乐'、'悲伤'、'中立'])上训练朴素贝叶斯分类器。此训练数据集为

  • 在weka中。分类器。Evaluation有一个方法,它输出如下所示的混淆矩阵。 我注意到,这个输出中的类是从作为