当前位置: 首页 > 知识库问答 >
问题:

开放式nlp模型的培训数据-结果1和模型与finder不兼容

澹台华晖
2023-03-14

我目前在使用opennlp工具包培训新的ner模型时遇到了一个问题。我在网上找到了一个关于训练药物名称新模型的例子。用于培训的样本数据如下所示

<START:medicine> Augmentin-Duo <END> is a penicillin antibiotic that contains two medicines - <START:medicine> amoxicillin trihydrate <END> and <START:medicine> potassium clavulanate <END>.

我试图训练一个识别物种名称的模型,并设法创建了一个大约35000个句子的样本数据集。每句话都包含至少一个物种名称,我根据药物样本数据对其进行了相应的标记。看起来像这样

A flatfish is a member of the order <START:sname> Pleuronectiformes </END> of ray-finned demersal fishes, also called the Heterosomata, sometimes classified as a suborder of Perciformes.

现在是有趣的部分。如果我开始训练,我会得到这个信息

结果数:1

线程"main"java.lang.IllegalArgumentException中的异常:模型与名称查找器不兼容!

出于“测试”的目的,我在句子列表的开头复制了药物示例的一句话,突然我得到了“结果数:2”。

现在我不知道为什么我的样本只被认为是一种结果。在我的样本数据中,每个物种的名称只允许出现一次吗?还有什么问题?我必须在一句话中至少标记两个物种名称吗?我不知道为什么我的代码可以处理药物的样本数据,但不能处理我的数据,希望有人能在这里帮助我。

提前感谢!!

共有1个答案

昝卓
2023-03-14

这可能是因为您错误地标记了数据集。

你已经完成了

/可能就是这样,确保您正确地给出了所有空格,并且您在训练数据中的一行中拥有每个句子。

如果这不起作用,发布你的训练数据。

 类似资料:
  • 我正在为我的一个项目使用Apache OpenNLP。我正在创建一个新模型来识别位置,因为预训练模型(en-ner-location.bin)没有这个位置。 这是代码: } 到目前为止,它运行良好。 问题是我无法将其他位置添加到我创建的自定义模型中。所以,我浏览了OpenNLP-README文档。 在那里,它说,“注意:为了训练模型,您需要所有的训练数据。目前没有一种机制可以用额外的数据更新随项目

  • 我想训练自己的自定义模型。我可以从哪里开始? 我使用这个样本数据来训练一个模型: 基本上,我想从给定的输入中找出一些无意义的文本。 我尝试了opennlp开发文档中给出的以下示例代码,但出现了错误:Model与name finder不兼容!

  • 我一直在尝试与斯坦福核心NLP合作。我希望训练我自己的NER模型。从论坛上的SO和官网上描述了如何使用一个属性文件来实现这一点。我将如何通过API实现它?。 怎么做

  • 我最近不得不向听众解释数据模型和数据格式之间的区别。他们想解释为什么我们不使用xml来完成RDF的基本工作。虽然我可以解释很多东西,比如分布式数据模型,推理等等。我在某种程度上能够解释数据模型和数据格式之间区别。 丹尼

  • 无论是MVC、MVP或者MVVP,都离不开这些基本的要素:数据、表现、领域。 数据 信息源于数据,我们在网站上看到的内容都应该是属于信息的范畴。这些信息是应用从数据库中根据业务需求查找、过滤出来的数据。 数据通常以文件的形式存储,毕竟文件是存储信息的基本单位。只是由于业务本身对于Create、Update、Query、Index等有不同的组合需求就引发了不同的数据存储软件。 如上章所说,View层

  • 我训练OpenNLP NER模型来检测一个新实体,但当我使用这个模型时,我遇到了以下异常: 我使用的是OpenNLP 1.6.0版,源代码如下: 谁能帮我解决这个问题。。