当前位置: 首页 > 知识库问答 >
问题:

Apache OpenNLP,如何训练或制作新模型?

鱼渝
2023-03-14

例如,en name finder没有找到一些名称,我想向现有数据模型添加新数据。我找到了这个点击这里的答案,但我不明白

什么是en-ner-person.train?是en-ner-person.bin的克隆吗?

我们应该加载现有模型并从文件中添加新数据?什么类型的信息应该包含txt文件

共有2个答案

柯苗宣
2023-03-14

你可以查看这个链接,他使用维基百科有一个语料库(一组文档)来训练你的模型。

仲孙向明
2023-03-14

en-ner-person.train是训练文件,en-ner-person.bin是模型。

训练文件由训练模型时使用的训练数据组成。

文本文件应包含要以适当格式添加的培训数据。看看这个,它解释了如何训练一个模型

 类似资料:
  • 因此,主要的问题是:如何保留已有的模型数据并将新的数据添加到模型中? 谢谢

  • 在之前的描述中,我们通常把机器学习模型和训练算法当作黑箱子来处理。如果你实践过前几章的一些示例,你惊奇的发现你可以优化回归系统,改进数字图像的分类器,你甚至可以零基础搭建一个垃圾邮件的分类器,但是你却对它们内部的工作流程一无所知。事实上,许多场合你都不需要知道这些黑箱子的内部有什么,干了什么。 然而,如果你对其内部的工作流程有一定了解的话,当面对一个机器学习任务时候,这些理论可以帮助你快速的找到恰

  • 在之前的描述中,我们通常把机器学习模型和训练算法当作黑箱子来处理。如果你实践过前几章的一些示例,你惊奇的发现你可以优化回归系统,改进数字图像的分类器,你甚至可以零基础搭建一个垃圾邮件的分类器,但是你却对它们内部的工作流程一无所知。事实上,许多场合你都不需要知道这些黑箱子的内部有什么,干了什么。 然而,如果你对其内部的工作流程有一定了解的话,当面对一个机器学习任务时候,这些理论可以帮助你快速的找到恰

  • 我使用的OpenNLP模型如下: 我想把我的数据附加到训练数据集中,这些模型就是在这个数据集中训练的。那么请告诉我从哪里可以得到原始数据集?

  • 我正在尝试训练名称查找器模型来检测名称,但它没有给出正确的结果。这是代码。 这是iam得到的输出: 检测到的名称:[07-20 19:35:47.516 8799:8799 I/Adreno EGL] en-ner-person.train内容是: 请帮忙。

  • 我仍在学习Python和创建模型,对使用Spacy的NLP非常陌生。我曾经https://spacy.io/usage/training#ner培训Spacy现有的模式——en_core_web_sm。 我用我的领域特定实体训练了这个模型。 现在我假设我会在输出目录中找到一个模型文件。相反,我有4个子文件夹——词汇表、ner、标记器、解析器。还有2个文件meta.json和标记器。ner子文件夹有