当前位置：首页 > 面试题库 >

将斯坦福pos标记器导入到nltk时遇到麻烦

史淳

2023-03-14

问题内容：

这可能是一个非常琐碎的问题。我试图通过给予NLTK使用斯坦福POS恶搞这里的问题是，我NLTK的lib犯规包含斯坦福模块。因此，我将其复制到相应的文件夹中并进行了编译。现在，当我尝试运行示例时，将检测到模块，但未检测到模块内的类。谁能告诉我我要去哪里错了吗？同样，这可能是非常愚蠢的。

>>> from nltk.tag import stanford 
>>> st = StanfordTagger('bidirection-distsim-wsj-0-18.tagger')

我使用py_compile编译stanford.py文件。我错过了什么吗

问题答案：

您仅在导入stanford。要访问，StanfordTagger您需要使用以下任一方法：

>>> from nltk.tag.stanford import StanfordTagger

（假设`StanfordTagger没有进一步嵌套在模块中）或通过以下方式访问它

>>> st = stanford.StanfordTagger('bidirection-distsim-wsj-0-18.tagger')

类似资料：

斯坦福德NLP标记器

我使用StanfordNLP来标记用智能手机编写的一组消息。这些文本有很多拼写错误，不遵守标点符号规则。通常，空格缺失会影响标记化。例如，以下句子漏掉了“California.This”和“university，founded”中的空格。斯坦福大学位于加利福尼亚州，这所大学是一所伟大的大学，创建于1891年。标记器返回： {“斯坦福”、“大学”、“是”、“位于”、“加利福尼亚州”。这个”、“
斯坦福NLP:OutOfMemoryError

我正在注释和分析一系列文本文件。 pipeline.annotate方法每次读取文件时都会变得越来越慢。最终，我得到了一个OutOfMemoryError。管道初始化一次：然后，我使用相同的管道实例处理每个文件（如SO和斯坦福大学在其他地方推荐的）。明确地说，我希望问题出在我的配置上。但是，我确信失速和内存问题发生在pipeline.annotate（file）方法上。在处理每个文件后，我
斯坦福Corenlp-Dases

我在使用Stanford pipeline（CoreNLP的最后一个版本）解析BNC时遇到了一个问题。解析器只是停留在这个句子中，它甚至不会抛出错误。句子在web界面中得到正确的解析。我尝试了标记器的选项，但没有结果。我添加了我正在使用的命令行:java[...]edu.stanford.nlp.pipeline.stanfordCorenlp-注释器tokenize,ssplit,pos,
斯坦福CoreNLP输出

我假设我试图将输出转换成的格式是旧版本的CorenLP的默认输出。有什么方法可以得到所需格式的输出吗？
斯坦福NLP CoreNLP。网的

试图运行示例，但我一直无法打开“english-left3words-distsim.tagger”文件可能丢失。文件没有丢失，目录指向模型jar文件的位置，路径：edu\stanford\nlp\模型\pos-tagger\english-left3word在jar文件中是正确的。我使用3.7.0，安装从nuget在视觉工作室2015. 代码如下：我确实在Stack上看到了一个类似的问题，他
斯坦福CorenLP：引用anotator

这是意料之中的行为吗？我在前面运行完整的管道吗？

将斯坦福pos标记器导入到nltk时遇到麻烦

相关阅读

相关文章

相关问答

相关工具

相关文档