当前位置: 首页 > 知识库问答 >
问题:

Stanford pos标记器文件错误

常翰
2023-03-14

我正在用c#进行一个项目,我必须集成斯坦福pos tagger API,虽然我已经完成了,但是当我编译代码时,我得到了一个错误

stanford-postagger-3.6.0.dll中发生了类型edu.stanford.nlp.io.RuntimeIOExcure的异常,但用户代码中没有处理

其他信息:加载标记器模型时出错(可能缺少模型文件)

在我的代码中,此错误所指向的行是:

var tagger = new MaxentTagger(@"..\..\..\..\paket-files\nlp.stanford.edu\stanford-postagger-full-2015-12-09\models\wsj-0-18-bidirectional-distsim.tagger");

注意:我是如何安装pos tagger的?右键单击我的解决方案,然后单击“manage nuget.org packages”,搜索斯坦福nlp tagger并安装它的?我从这里复制了代码:https://sergey-tihon.github.io/Stanford.NLP.NET/StanfordPOSTagger.html

共有1个答案

尚阳炎
2023-03-14

95%的可能性是您在类路径中丢失了CoreNLP模型jar。您不仅需要包含代码jar,还需要包含模型jar;两者都包含在标准分布中。例如,在Maven中,您需要:

<dependencies>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
</dependency>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
    <classifier>models</classifier>
</dependency>
</dependencies>

(顶部是代码,底部是模型)。

 类似资料:
  • 我正在为一个项目使用POS标记器,当它从我的计算机(项目文件夹)读取标记器文件时,它会成功工作。但是我需要先上传tagger文件,然后从URL读取tagger文件。为此,我上传了POS-tagger文件,并试图通过向MaxentTagger方法的构造函数提供URL来读取tagger文件:(我的代码是C#,我已经重写了MaxentTagger类,因此它的构造函数如下所示: 公共标记器(){ JAVA

  • 当eclipse试图根据其DTD验证XML时,我总是在TestNG XML配置文件中的test tag(在test name=“bing-search-sample....行)得到这样的错误。该文件运行良好,似乎没有问题: 元素类型“test”的内容必须匹配“(方法选择器?、参数*、组?、包?、类?)”。 由于XML运行良好,我想知道TestNG DTD是否存在问题,或者在使用Eclipse进行X

  • 问题内容: 我正在尝试使用Java读取CSV文件。有些文件的开头可能有字节顺序标记,但不是全部。如果存在,字节顺序将与第一行的其余部分一起读取,从而导致字符串比较出现问题。 是否存在一种跳过字节顺序标记的简单方法? 问题答案: 你正在以这种方式使用它:

  • 如果我将.icon替换为.seticon,那么整个新的MarkerOptions()都是红色的,并且我得到了这个错误,不能在原语类型void上调用title(String)。我该怎么办?

  • 我正在尝试使用Apache OpenNLP API创建一个标记器。我已经从他们的网站中提取了代码,但在Tokenize类中,以下代码行出现了“不兼容类型”错误: Tokenize Tokenizer=new TokenizerME(模型); 有人知道这个错误的原因吗?因为看起来他们不应该不兼容? 这是主要类: 这是具有错误的Tokenize类:

  • 需要显示pdf、docx、ppt、图像等内容。使用iframe标记。 当我们使用时,就像这个文件被下载。而不是下载,我们需要显示的内容在浏览器本身。 试用了另一个示例来查看计算机中本地存在的文档https://view.officeapps.live.com/op/view.aspx?src=c%3a%5cusers%5c123456%5cdesktop%5cttk.docx,这导致显示错误页。