当前位置: 首页 > 知识库问答 >
问题:

在eclipse中重新训练stanford nlp pos标记器

龚德本
2023-03-14

我是nlp的新手,我正在尝试找出pos标签。目前我正在试用斯坦福nlp pos标签,url:http://nlp.stanford.edu/software/tagger.shtml

从上面的链接中,有这样一句话:

只要该语言有POS注释的培训文本,就可以对标记者进行任何语言的再培训。

然而,我无法让它工作。我现在所能做的就是给它一个文本文件来标记。例如,String test=“这是一个测试” 将返回我这个是测试。

我怎样才能开始重新培训标签工?假设我希望返回上面的字符串,因为它是测试?

谢谢你的回答。


共有1个答案

马胜泫
2023-03-14

除非你有一个带有许多你想要纠正的现象/现象的POS标记语料库,否则你很可能无法成功地重新训练标记模型。澄清一下,根据我对Stanford工具进行训练的预期,没有添加单个示例来改变模型的机制。你需要有一个完整的语料库并重新训练。

如果你确实有一个语料库,那么我会参考这个之前发布的问题,以获得关于文件格式的详细信息和训练斯坦福CoreNLP模型的正确步骤。

否则,最好编写一些覆盖行为的后处理规则/正则表达式模式。这些规则的一个用途是确保单词列表中的人和地点被标记为专有名词(NNP)。

祝你好运

 类似资料:
  • 我正在尝试训练opennlp词性标记器,它会根据我的特定词汇在句子中标记单词。例如: 正常词性标注后: 句子:NodeManager/NNP失败/VBD to/TO start/VB the/DT server/NN 使用我的词性标注模型后: 句子:NodeManager/AGENT失败/其他到/其他启动/其他/其他服务器/对象 其中AGENT,OTHER,OBJECT是我定义的标签。 所以基本上

  • 编辑1:主要的问题是在训练完一个NER模型后,我将它应用到令牌上。因此,它不会识别“轮滑”,因为在代币中,它们以“轮滑”和“滑冰”的形式出现,而NER模型现在无法识别这个爱好。

  • 训练视图 浏览训练视图 上下滑动屏幕。 或 将手腕向内再向外轻快移动。 观看如何在训练期间使用 Polar 应用程式的相关视频教程。 您在训练视图上看到的信息取决于您对所选的运动内容的编辑。您可以在 Polar Flow 应用程式或 Polar Flow 网络服务中对每项运动内容进行设置。 例如,训练视图可提供以下信息: 您的当前心率 心率 ZonePointer 训练时长 训练期间到目前为止完成

  • 几种重新培训MobileNet以便与TensorFlow.js一起使用的方法对我来说都失败了。有没有办法用TensorFlow.js来使用重新训练的模型? 使用基于hub的现代教程和使用似乎都失败了。 null null 目的是加载mobilenet,使用自定义数据重新训练,并在TensorFlow.js中使用它。遵循这两个教程似乎都失败了。这可以在Node.js内部完成吗?还有别的办法吗?我在哪

  • 使用 Polar Verity Sense 记录训练前,需要注册并链接到 Polar Flow 账户。该操作已在设置期间完成。有关详细信息,请参见设置 Verity Sense。 按下按钮以打开 Verity Sense。 短按按钮进行切换,直至箭头图标旁的 LED 灯亮起,以选择记录模式。选中记录模式时,侧边的状态 LED 灯亮绿色。 选择完成后,等待所有六个 LED 灯全部亮起。然后,传感器就

  • 我正在尝试训练实例分割模型。Im使用以下代码生成tfrecord。 我用来训练的数据集有37个带有图像和遮罩的类。数据集在这里 然而,当我尝试训练时,我得到了以下错误。 回溯(最近一次调用last):tf中第167行的文件“train.py”。应用程序。run()文件“/anaconda3/envs/conda/lib/python3.6/site packages/tensorflow/pyth