当前位置: 首页 > 知识库问答 >
问题:

OpenNLP NameFinder自定义功能生成

毋宸
2023-03-14

我想训练自己的模型,以便在OpenNLP NameFinder中使用。

搜索了很多,最终找到了一个训练模型的工作代码,但并不准确。文件还说,你需要15000个句子才能有一个准确的模型。

所以你需要有15000个句子,每个句子都有一个好的上下文和名字

我做了一些进一步的搜索来训练一个模型,而不需要自己编写所有的代码,然后开始了OpenNLP的自定义功能生成。http://opennlp.apache.org/docs/1.8.1/manual/opennlp.html#tools.namefind.training.tool

但它并没有说明如何使用它。文件给出了以下信息:

AdaptiveFeatureGenerator featureGenerator = new CachedFeatureGenerator(
     new AdaptiveFeatureGenerator[]{
       new WindowFeatureGenerator(new TokenFeatureGenerator(), 2, 2),
       new WindowFeatureGenerator(new TokenClassFeatureGenerator(true), 2, 2),
       new OutcomePriorFeatureGenerator(),
       new PreviousMapFeatureGenerator(),
       new BigramNameFeatureGenerator(),
       new SentenceFeatureGenerator(true, false)
       });

有人知道怎么用这个吗?或者更好的是,是否有人已经成功地为OpenNLP-NER训练了自己的模型,而不需要在数据集中键入自己的代码?

提前谢谢。


共有1个答案

易自珍
2023-03-14

您仍然需要带注释的训练文本。训练期间使用特征生成器来创建更好的模型。不幸的是,没有任何东西可以替代带注释的训练文本。

 类似资料:
  • 1.1.1. 自定义功能 1.1.2. 拦截器 1.1.3. 入口词多样化 1.1.4. 场景化技能 1.1.1. 自定义功能 本文将讲解除了Rokid技能创建平台上面提供的技能开发工具外,平台独有的一些自定义功能。 目录 一、拦截器 二、入口词多样化 三、场景化技能 1.1.2. 拦截器 拦截器接口文档 语义理解(NLP)的拦截器(interceptor),可以允许开发者在进入Rokid NLP

  • 我正在尝试使用OpenNLP为命名查找器API生成的自定义功能。 http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html 我通过留档,但我无法理解如何指定不同的功能。 它只是说: 但是,您如何实际使用这些不同的功能生成器来创建我自己的自定义功能呢。有人能发布一个定义这些特征生成器的示例代码吗?我们如何使用它来生成自定义特征

  • 问题内容: 使用我正在尝试在模板中使用自己的功能之一。不幸的是,我无法使用go模板的功能映射功能。我得到的只是以下错误: 简化的测试用例如下所示(): 我有以下简单模板(): 这是1.1.1。 问题答案: IIRC,必须在解析模板之前定义模板功能图。下面的代码似乎有效。

  • 问题内容: 我想使用Django建立一个简单的热门问题列表。我有一个函数,可以根据一些参数评估每个问题的“ 热度 ”。 功能看起来与此类似(此处为完整功能) 我的问题和投票模型(相关部分) 现在,它是正数或负数。热功能会收到正面投票数和负面投票数以及问题的创建日期。 我已经尝试过类似的方法,但是它不起作用。 我得到的错误是: 我理解该错误,但是我没有正确的方法。 问题答案: 您不能将python函

  • 本文向大家介绍Android自定义闹钟功能,包括了Android自定义闹钟功能的使用技巧和注意事项,需要的朋友参考一下 Android闹钟alarmManager+PendingIntent的使用方法,供大家参考,具体内容如下 这次给大家分享两种闹钟: 第一种是当到达闹钟时间后执行一次相应的操作 alarmManager.set(AlarmManager.RTC_WAKEUP,c.getTimeI

  • 注意:“自定义CDN”功能需在“应用防护管理”中开启对应的防护(Web防护/Nginx自编译/RASP)才可使用。 CDN的全称是Content Delivery Network,即内容分发网络。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,实时根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。使用户