我目前在使用opennlp工具包培训新的ner模型时遇到了一个问题。我在网上找到了一个关于训练药物名称新模型的例子。用于培训的样本数据如下所示
<START:medicine> Augmentin-Duo <END> is a penicillin antibiotic that contains two medicines - <START:medicine> amoxicillin trihydrate <END> and <START:medicine> potassium clavulanate <END>.
我试图训练一个识别物种名称的模型,并设法创建了一个大约35000个句子的样本数据集。每句话都包含至少一个物种名称,我根据药物样本数据对其进行了相应的标记。看起来像这样
A flatfish is a member of the order <START:sname> Pleuronectiformes </END> of ray-finned demersal fishes, also called the Heterosomata, sometimes classified as a suborder of Perciformes.
现在是有趣的部分。如果我开始训练,我会得到这个信息
结果数:1
线程"main"java.lang.IllegalArgumentException中的异常:模型与名称查找器不兼容!
出于“测试”的目的,我在句子列表的开头复制了药物示例的一句话,突然我得到了“结果数:2”。
现在我不知道为什么我的样本只被认为是一种结果。在我的样本数据中,每个物种的名称只允许出现一次吗?还有什么问题?我必须在一句话中至少标记两个物种名称吗?我不知道为什么我的代码可以处理药物的样本数据,但不能处理我的数据,希望有人能在这里帮助我。
提前感谢!!
这可能是因为您错误地标记了数据集。
你已经完成了
/
可能就是这样,确保您正确地给出了所有空格,并且您在训练数据中的一行中拥有每个句子。
如果这不起作用,发布你的训练数据。
我正在为我的一个项目使用Apache OpenNLP。我正在创建一个新模型来识别位置,因为预训练模型(en-ner-location.bin)没有这个位置。 这是代码: } 到目前为止,它运行良好。 问题是我无法将其他位置添加到我创建的自定义模型中。所以,我浏览了OpenNLP-README文档。 在那里,它说,“注意:为了训练模型,您需要所有的训练数据。目前没有一种机制可以用额外的数据更新随项目
我想训练自己的自定义模型。我可以从哪里开始? 我使用这个样本数据来训练一个模型: 基本上,我想从给定的输入中找出一些无意义的文本。 我尝试了opennlp开发文档中给出的以下示例代码,但出现了错误:Model与name finder不兼容!
我一直在尝试与斯坦福核心NLP合作。我希望训练我自己的NER模型。从论坛上的SO和官网上描述了如何使用一个属性文件来实现这一点。我将如何通过API实现它?。 怎么做
我最近不得不向听众解释数据模型和数据格式之间的区别。他们想解释为什么我们不使用xml来完成RDF的基本工作。虽然我可以解释很多东西,比如分布式数据模型,推理等等。我在某种程度上能够解释数据模型和数据格式之间区别。 丹尼
在我使用自己的图像数据集使用object_detection\model_main重新训练了预先训练好的ssd mobilenet v1模型之后。py脚本,我导出了两个.pb冻结图(使用export_inference_graph.py脚本) 和 .tflite 图形(带有export_tflite_ssd_graph.py脚本和tflite_convert)。 Pb图似乎工作得很好,但tflit
我训练OpenNLP NER模型来检测一个新实体,但当我使用这个模型时,我遇到了以下异常: 我使用的是OpenNLP 1.6.0版,源代码如下: 谁能帮我解决这个问题。。