当前位置: 首页 > 知识库问答 >
问题:

如何在OpenNLP中培训“乌尔都语”的NER模型?

邵沛
2023-03-14

我想使用Apache OpenNLP为我的母语乌尔都语训练NER模型。我已经准备好了train.txt中的训练数据。制作训练模型(. bin)的下一步是什么,就像我们在模型下载部分的OpenNLP站点上找到的那样。

共有1个答案

黄凌龙
2023-03-14
opennlp TokenNameFinderTrainer -model model.bin -lang en -data train.txt -encoding UTF-8

使用此命令,您可以创建model.bin

有关更多信息,请参阅文档!

 类似资料:
  • 我正在研究为一名日本人创建训练数据。 想知道我是否需要预先标记训练数据,或者是否有办法在模型创建期间指定标记器? 在下面的示例中,日语没有任何空格: 这对培训模型有用吗?还是我需要提供标记化的培训句子?

  • 我想训练自己的自定义模型。我可以从哪里开始? 我使用这个样本数据来训练一个模型: 基本上,我想从给定的输入中找出一些无意义的文本。 我尝试了opennlp开发文档中给出的以下示例代码,但出现了错误:Model与name finder不兼容!

  • 我刚开始使用OpenNLP。我需要创建一个简单的训练模型来识别名称实体。

  • 我想训练用于提取人名的模型(NER系统的一部分),但我想使这个模型无大小写(我的意思是,该模型不会考虑字母大小写,大写字母和小写字母之间没有区别),因为我有嘈杂的文本。 那么训练步骤中是否有任何参数可以做到这一点,或者任何其他方式?

  • OpenNLP中的NER培训是否有“最佳”标记化?我注意到OpenNLP提供了一个最大熵标记器,允许您基于经过训练的模型进行标记。我还注意到OpenNLP提供了一个简单的标记器。如果我在运行时使用与训练模型相同的标记器,那么使用哪个标记器重要吗? 我宁愿在我的应用程序中使用简单的标记器。

  • 这是我的培训代码 滚轮编号。火车 结果训练 当我使用这段代码测试它时。 给出了如下结果。有些时候是错的。