当前位置: 首页 > 知识库问答 >
问题:

nlp-斯坦福OpenNLP中句子和文档的区别?

上官波鸿
2023-03-14

假设我们有一篇文章要注释。如果我们将文本作为一个非常长的句子而不是文档输入,斯坦福在注释一个长句子与循环遍历文档中的每个句子和最终所有结果之间有什么不同吗?

编辑:我运行了一个测试,似乎这两种方法返回了两个不同的NER集。我可能只是做错了,但这确实非常有趣,我很好奇为什么会发生这种情况。

共有1个答案

杨无尘
2023-03-14

确认一下:你指的是斯坦福CoreNLP(与Apache OpenNLP相反),对吗?

SentenceDocument之间的CoreNLP Simple API的主要区别是标记化。Sentence将强制将整个文本视为单个句子,即使它有标点符号。Document将首先将文本标记为句子列表,然后对每个句子进行注释。

请注意,对于像选区分析器这样的注释器,很长的句子将需要很长的时间进行注释。另外,请注意,共指仅适用于文档,而不适用于句子。

 类似资料:
  • 我是斯坦福核心NLP的新手。我想用它来从英语,德语,法语的文本中拆分句子。这是哪一个班的工作?提前谢谢。

  • 有人能让我知道核心NLP的区别吗 http://stanfordnlp.github.io/CoreNLP/ 斯坦福大学NLP http://nlp.stanford.edu/

  • 试图运行示例,但我一直无法打开“english-left3words-distsim.tagger”文件可能丢失。文件没有丢失,目录指向模型jar文件的位置,路径:edu\stanford\nlp\模型\pos-tagger\english-left3word在jar文件中是正确的。 我使用3.7.0,安装从nuget在视觉工作室2015. 代码如下: 我确实在Stack上看到了一个类似的问题,他

  • Stanford NLP是否为提供了一种训练方法,使其能够用自己的语料库进行训练,并创建自己的句子拆分模型? 我正在与德语句子工作,我需要创建我自己的句子拆分任务的德语模型。因此,我需要训练句子拆分器。 我有办法做到吗?

  • 我对这两个软件包做了一些比较,不确定应该朝哪个方向发展。我想简要介绍的是: 命名实体识别(人员、地点、组织等) 据我所知,OpenNLP和Stanford CoreNLP公开了非常相似的功能。然而,斯坦福大学的CoreNLP看起来有更多的活动,而OpenNLP在过去六个月里只有几次提交。 根据我所看到的,OpenNLP似乎更容易训练新的模型,仅仅因为这个原因可能更具吸引力。然而,我的问题是,其他人

  • 斯坦福NLP中的和,比如之间有什么区别?