当前位置: 首页 > 知识库问答 >
问题:

斯坦福Corenlp-Dases

万博涛
2023-03-14

我在使用Stanford pipeline(CoreNLP的最后一个版本)解析BNC时遇到了一个问题。

解析器只是停留在这个句子中,它甚至不会抛出错误。句子在web界面中得到正确的解析。

我尝试了标记器的选项,但没有结果。

我添加了我正在使用的命令行:java[...]edu.stanford.nlp.pipeline.stanfordCorenlp-注释器tokenize,ssplit,pos,depparse-tokenize.whitespace false-ssplit.eolonly true-parse.model edu/stanford/nlp/models/parser/nndep/english_sd.gz-file$inputfile

提前多谢!

凯碧

共有1个答案

曾成天
2023-03-14

在OS X 10.10.4上使用Stanford CoreNLP V.3.5.2运行时,我无法重现此问题。给出的示例字符串被解析得很好。

可能有问题,但如果是这样的话,这是微妙的,您需要类似地提供更多关于斯坦福NLP版本、操作系统和版本的信息,并将一个不起作用的文本文件粘贴到某个地方下载,以确保问题不是像在网页上粘贴文本时丢失的行尾那样。

 类似资料:
  • 我假设我试图将输出转换成的格式是旧版本的CorenLP的默认输出。有什么方法可以得到所需格式的输出吗?

  • 试图运行示例,但我一直无法打开“english-left3words-distsim.tagger”文件可能丢失。文件没有丢失,目录指向模型jar文件的位置,路径:edu\stanford\nlp\模型\pos-tagger\english-left3word在jar文件中是正确的。 我使用3.7.0,安装从nuget在视觉工作室2015. 代码如下: 我确实在Stack上看到了一个类似的问题,他

  • 这是意料之中的行为吗?我在前面运行完整的管道吗?

  • 我对这两个软件包做了一些比较,不确定应该朝哪个方向发展。我想简要介绍的是: 命名实体识别(人员、地点、组织等) 据我所知,OpenNLP和Stanford CoreNLP公开了非常相似的功能。然而,斯坦福大学的CoreNLP看起来有更多的活动,而OpenNLP在过去六个月里只有几次提交。 根据我所看到的,OpenNLP似乎更容易训练新的模型,仅仅因为这个原因可能更具吸引力。然而,我的问题是,其他人

  • 问题内容: 我正在努力让我了解Stanford CoreNLP API。我希望得到一个简单的句子,使用以下代码将其标记化: 这是从Stanford NLP网站本身上摘下来的,所以我希望它能开箱即用。遗憾的是没有,因为它在以下位置给了我NullPointerException: 问题答案: 您从Stanford NLP网站上获得的代码将对text变量执行所有注释。为了执行特定的注释,您必须相应地更改

  • 我正在注释和分析一系列文本文件。 pipeline.annotate方法每次读取文件时都会变得越来越慢。最终,我得到了一个OutOfMemoryError。 管道初始化一次: 然后,我使用相同的管道实例处理每个文件(如SO和斯坦福大学在其他地方推荐的)。 明确地说,我希望问题出在我的配置上。但是,我确信失速和内存问题发生在pipeline.annotate(file)方法上。 在处理每个文件后,我