当前位置: 首页 > 知识库问答 >
问题:

OpenNLP:找不到Lemmatizer的模型文件

袁泓
2023-03-14

摘要:找不到用于Lemmatizer(english-lemmatizer.bin)的模型文件

详细信息:OpenNLP工具模型似乎是Apache OpenNLP库的不同组件使用的各种模型的综合存储库。但是,我无法在lemmatizer中找到模型文件。垃圾箱,与柠檬汁机一起使用。Apache OpenNLP开发人员手册为柠檬化步骤提供了以下代码片段:

InputStream dictLemmatizer = null;

try (dictLemmatizer = new FileInputStream("english-lemmatizer.bin")) {

}

但是,与其他模型文件不同,我无法找到此模型文件的位置。任何指点都将不胜感激。

共有2个答案

唐珂
2023-03-14

你想要柠檬汁。而不是英国柠檬酒。txt

贡俊
2023-03-14

Richard M. Reese的《自然语言处理Java食谱》一书提供了一个很好的答案。由于某种原因en-lemmatizer.bin无法从网上直接下载,但可以使用以下步骤创建:

>

转到Lemmatizer训练文件的URL并将文本内容保存为en-lemmatizer.dict

转到bin目录(从步骤1开始,解压后)并执行以下命令:

opennlp LemmatizerTrainer ME模型en-lemmatizer.binlang en数据 /path/to/en-lemmatizer.dict编码UTF-8

注意:准备好处理以下错误:

计算事件计数...线程“main”中的异常java.lang.OutOfMemoryError:Java堆空间

 类似资料:
  • 我目前正试图在代码中使用一个经过定制培训的OpenNLP名称查找器模型。我的项目使用OpenNLP1.6.0,并使用EclipseIDE开发。该模型还使用OpenNLP 1.6.0进行了训练。 然而,我遇到了一个恼人的错误: 这里有人问了一个类似的问题,答案说问题是由于OpenNLP模型使用与使用中的版本相同的版本进行训练(即,使用1.6.0训练模型,并在同样使用1.6.0的项目中使用它)。然而,

  • 当开始使用模型时,我得到了以下错误 未找到类帖子。 我所做的一切: -使用命令 -尝试使用

  • 错误:光电控制器中存在FatalErrorException。php第17行:找不到类“App\Http\Controllers\photo” 此代码出现异常-

  • 我试图通过Django制作一个新网站的主页。我的应用程序名称是“博客”,主页是home.html当我去http://127.0.0.1:8000/blog/home/时,我仍然收到错误模板不存在 我确保在settings.py中将“blog”添加到我的模板中,并在主目录中以及通过blog/templates/blog/home.html添加文件夹模板 myproject/blog/views.py

  • 我正在尝试使用OpenNLP在手册中的一个示例(第一次使用它)。 出于某种原因: 获取一个错误: 我一点也不知道为什么会这样。。。这里说,OpenNLP的0.0.0-SNAPSHOT版本在加载任何模型时都不会失败。 到目前为止,我还没有找到关于这个错误的任何其他信息。可能是我用进口货做的?或者我正在使用的模型(我从OpenNLP网站下载了它——找不到任何其他版本)?不管怎样,我不知道怎么了。。。

  • 我正在使用OpenNLP 1.5.3,我想对英文文本中的位置名称执行NER。为此,我从下一个url下载了相应的模型(en ner location.bin): http://opennlp.sourceforge.net/models-1.5/ 问题是,当我尝试使用以下命令使用此模型在文本中执行NER时: 我得到以下错误: 我的命令中有什么错误吗?还是OpenNLP 1.5.3中的这个模型有缺陷?