有人知道我在哪里可以找到如何在OpenNLP库中使用SimpleMematizer()类的示例,以及在哪里可以找到示例英语词典吗?文件中似乎没有。
拉维没有完全回答这个问题:
在autodoc中看不到SimpleMematizer的原因是它实际上并不存在。
改用DictionaryLemmatizer。
opennlp。工具。柠檬酒。字典编辑程序
您可以从这里下载字典-en-lemmatizer.dict
示例:
import opennlp.tools.lemmatizer.SimpleLemmatizer;
private static SimpleLemmatizer lemmatizer;
private String lemmatize(String word, String postag) throws IOException {
if (lemmatizer == null) {
InputStream is = getClass().getResourceAsStream("/models/en-lemmatizer.dict");
lemmatizer = new SimpleLemmatizer(is);
is.close();
}
String lemma = lemmatizer.lemmatize(word, postag);
return lemma;
}
示例代码取自此处-DocumentTaggerService
我试图使用官方OpenNLP网站手册示例来训练一个新模型,以下是示例: 问题出在2º线上, 帮我说:不赞成。改用PlainTextByLineStream(InputStreamFactory,Charset)。但是我不知道如何使用这个构造函数。我想举一个例子,使用同一个语料库文件使用这个未弃用的构造函数。 我已经编写了下一段代码,使用opennlp帮助和两种使用train方法的方法,不推荐的和建
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。
OpenNLP是一个关于自然语言处理的Apache项目。NLP程序的目的之一是解析一个句子,给出其语法结构的树。例如,句子“天空是蓝色的”可能被解析为 其中是句子,是名词短语,是动词短语。等效地,上面的树可以写成一个带括号的字符串,如下所示: 我试图使用OpenNLP从句子中获取带括号的字符串,但我无法让示例代码正常工作。 特别是,我正在遵循本教程的最后一部分,我的代码在初始化时卡住了。 我已经从
我正在尝试使用OpenNLP训练一个名称实体模型,但得到这个错误时,我不知道缺少了什么。我是这个OPENNLP的新手,任何人请帮忙,可以提供培训。txt文件(如果需要) 我的密码是
我正在使用斯坦福大学的openNLP引擎在30000个文档集合中查找名词,在这样做的同时,我在java中遇到了OutofMemory错误,尽管我在文档的特定部分中检测到了所有名词,这意味着我只将一部分文本传递给openNLP中的MaxentTagger,我应该如何纠正这个错误?
我目前正试图在代码中使用一个经过定制培训的OpenNLP名称查找器模型。我的项目使用OpenNLP1.6.0,并使用EclipseIDE开发。该模型还使用OpenNLP 1.6.0进行了训练。 然而,我遇到了一个恼人的错误: 这里有人问了一个类似的问题,答案说问题是由于OpenNLP模型使用与使用中的版本相同的版本进行训练(即,使用1.6.0训练模型,并在同样使用1.6.0的项目中使用它)。然而,