问题：

评估斯坦福NLP情绪时获得不同的结果

齐宗清

2023-03-14

我下载了斯坦福NLP 3.5.2，并使用默认配置运行情绪分析（即，我没有更改任何内容，只是解压缩并运行）。

java -cp "*" edu.stanford.nlp.sentiment.Evaluate -model edu/stanford/nlp/models/sentiment/sentiment.ser.gz -treebank test.txt

EVALUATION SUMMARY
Tested 82600 labels
  66258 correct
  16342 incorrect
  0.802155 accuracy
Tested 2210 roots
  976 correct
  1234 incorrect
  0.441629 accuracy
Label confusion matrix
      Guess/Gold       0       1       2       3       4    Marg. (Guess)
               0     323     161      27       3       3     517
               1    1294    5498    2245     652     148    9837
               2     292    2993   51972    2868     282   58407
               3      99     602    2283    7247    2140   12371
               4       0       1      21     228    1218    1468
    Marg. (Gold)    2008    9255   56548   10998    3791

               0        prec=0.62476, recall=0.16086, spec=0.99759, f1=0.25584
               1        prec=0.55891, recall=0.59406, spec=0.94084, f1=0.57595
               2        prec=0.88982, recall=0.91908, spec=0.75299, f1=0.90421
               3        prec=0.58581, recall=0.65894, spec=0.92844, f1=0.62022
               4        prec=0.8297, recall=0.32129, spec=0.99683, f1=0.46321

Root label confusion matrix
      Guess/Gold       0       1       2       3       4    Marg. (Guess)
               0      44      39       9       0       0      92
               1     193     451     190     131      36    1001
               2      23      62      82      30       8     205
               3      19      81     101     299     255     755
               4       0       0       7      50     100     157
    Marg. (Gold)     279     633     389     510     399

               0        prec=0.47826, recall=0.15771, spec=0.97514, f1=0.2372
               1        prec=0.45055, recall=0.71248, spec=0.65124, f1=0.55202
               2        prec=0.4, recall=0.2108, spec=0.93245, f1=0.27609
               3        prec=0.39603, recall=0.58627, spec=0.73176, f1=0.47273
               4        prec=0.63694, recall=0.25063, spec=0.96853, f1=0.35971

Approximate Negative label accuracy: 0.646009
Approximate Positive label accuracy: 0.732504
Combined approximate label accuracy: 0.695110
Approximate Negative root label accuracy: 0.797149
Approximate Positive root label accuracy: 0.774477
Combined approximate root label accuracy: 0.785832

test.txt文件下载自http://nlp.stanford.edu/sentiment/trainDevTestTrees_PTB.zip（包含train.txt、dev.txt和test.txt）。下载链接从http://nlp.stanford.edu/sentiment/code.html

然而，在论文"Socher， R.，Perelygin，A.，Wu，J.Y.，Chiang，J.，Manning，C.D.，Ng，A.Y.and Potts，C.，2013,10.情感树库上语义组合性的递归深度模型.在自然语言处理经验方法会议论文集（EMNLP）（Vol.1631，p.1642）."中，情感分析工具是基于哪个，作者报告了分类5类时的准确率为0.807。

我获得的结果正常吗？

共有1个答案

翟冷勋

2023-03-14

当我把它从盒子里拿出来时，我得到了同样的结果。如果他们为斯坦福CoreNLP制作的系统版本与论文中的版本略有不同，我不会感到惊讶。

类似资料：

斯坦福NLP CoreNLP。网的

试图运行示例，但我一直无法打开“english-left3words-distsim.tagger”文件可能丢失。文件没有丢失，目录指向模型jar文件的位置，路径：edu\stanford\nlp\模型\pos-tagger\english-left3word在jar文件中是正确的。我使用3.7.0，安装从nuget在视觉工作室2015. 代码如下：我确实在Stack上看到了一个类似的问题，他
斯坦福德NLP标记器

我使用StanfordNLP来标记用智能手机编写的一组消息。这些文本有很多拼写错误，不遵守标点符号规则。通常，空格缺失会影响标记化。例如，以下句子漏掉了“California.This”和“university，founded”中的空格。斯坦福大学位于加利福尼亚州，这所大学是一所伟大的大学，创建于1891年。标记器返回： {“斯坦福”、“大学”、“是”、“位于”、“加利福尼亚州”。这个”、“
斯坦福核心NLP NER输出

我曾使用grep和awk从斯坦福CRF-NER的“内联XML”中提取英语文本中的命名实体，我希望在其他人类语言中使用相同的更大工作流。我一直在尝试法语（西班牙语似乎给我带来了一个Java错误，这是另一个故事），并使用我得到标准文本输出，每个句子都有各种类型的注释，包括正确组合在一起的多单词实体，如下所示：我知道解析它是可能的，但当我真的只是想要整个文件中的实体列表时，这似乎浪费了很多处理。我
斯坦福核心nlp java输出

我是Java和Stanford NLP工具包的新手，并试图在一个项目中使用它们。具体地说，我尝试使用Stanford Corenlp toolkit来注释文本（使用Netbeans而不是命令行），并尝试使用http://nlp.Stanford.edu/software/Corenlp.shtml#Usage上提供的代码（使用Stanford Corenlp API）。问题是：有人能告诉我如何在文
使用UIMA和斯坦福核心NLP

UIMA和StanfordNLP在流水线操作之后生成输出，比如如果我们想做词性标记，那么在输入文本中首先进行标记化，然后进行词性标记。我想使用UIMA的标记化，并在Stanford CoreNLP的POS标记器中使用该标记。但是Stanford CoreNLP的POS标记器需要在POS标记器之前运行标记器。那么，是否可以在同一管道中使用不同的API？是否可以同时使用UIMA标记器和Stanfo
斯坦福nlp中的NER模型训练

我一直在尝试与斯坦福核心NLP合作。我希望训练我自己的NER模型。从论坛上的SO和官网上描述了如何使用一个属性文件来实现这一点。我将如何通过API实现它？。怎么做
斯坦福NLP:OutOfMemoryError

我正在注释和分析一系列文本文件。 pipeline.annotate方法每次读取文件时都会变得越来越慢。最终，我得到了一个OutOfMemoryError。管道初始化一次：然后，我使用相同的管道实例处理每个文件（如SO和斯坦福大学在其他地方推荐的）。明确地说，我希望问题出在我的配置上。但是，我确信失速和内存问题发生在pipeline.annotate（file）方法上。在处理每个文件后，我
核心NLP和斯坦福NLP有什么区别？

有人能让我知道核心NLP的区别吗 http://stanfordnlp.github.io/CoreNLP/ 斯坦福大学NLP http://nlp.stanford.edu/

评估斯坦福NLP情绪时获得不同的结果

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档