当前位置: 首页 > 知识库问答 >
问题:

如何在Stanford NER上使用IOB标签?

沈凯康
2023-03-14

似乎有几种不同的设置:

iobtags
iobTags
entitySubclassification (IOB1 or IOB2?)
evaluateIOB

我应该使用哪种设置,如何正确使用?

我试过这样贴标签:

1997    B-DATE
volvo   B-BRAND
wia64t  B-MODEL
highway B-TYPE
tractor I-TYPE

但在培训输出上,似乎认为B型和I型是不同的课程。

我正在使用2013-11-12版本。

共有1个答案

赖鸿羲
2023-03-14

如何做到这一点目前(2013版)有点混乱,因为两个不同的DocumentReaderAndWriter实现有两组不同的标志。很抱歉

CoNLLDocumentReaderAndWriter中找到了对不同IOB样式的最灵活支持。您可以让它将任何IOB/IOE/...注释通过连字符前缀(如您的示例(B-BRAND))完成,而它正在读取带有标志的文件:

-entitySubclassification IOB2

然后将生成的标签集用于训练和分类。这些选项记录在CoNLLDocumentReaderAndWriterentitySub分类()方法中:IOB1, IOB2, IOE1, IOE2, SBIEO, IO。您可以在Tjong Kim Sang和Veenstra 1999中找到关于IOB1与IOB2的讨论。默认情况下,表示在输出时映射回IOB1,因为这是CoNLLconlleval程序中使用的默认值,但您可以将其保留为使用标志映射到的内容:

-retainEntitySubclassification

要使用此DocumentReaderAndWriter,您可以给出如下训练命令:

java8 -mx6g edu.stanford.nlp.ie.crf.CRFClassifier -prop conll.crf.chris2009.prop -readerAndWriter edu.stanford.nlp.sequences.CoNLLDocumentReaderAndWriter -entitySubclassification iob2

或者,ClonDocumentReaderAndWriter是我们在分布式模型中使用的默认DocumentReaderAndWriter。您使用它获得的选项不同,并且略有限制。您有这两个标志:

  • -mergeTags将使用普通(“品牌”)或类似CoNLL(“I-BRAND”)的标签,并将其向下映射到一个无前缀的IO标签(“品牌”),并将其用于培训和分类

在序列模型中,对于像IOB2这样的任何标签方案,标签都是不同的类。这就是这些标签方案的工作原理。“I-”和“B-”等的特殊解释留给人类观察者和实体级评估软件。随附的评估软件仅适用于IOB1、IOB2或无前缀IO编码。

 类似资料:
  • 我在div标签中有一个段落和一个按钮。我想在div标记上使用onlick=“”方法,而不是在div标记内的按钮上。我怎么能这么做。

  • 我正在开发我的第一个真正的flutter项目,我有一个关于资产的问题。我可以使用平台资产加载我的应用图标吗?如果没有,我需要创建flutter资产到我的应用程序。但是,一般图标的推荐大小是多少? 但Android和IOS的屏幕尺寸很多。使用平台资产,我根据平台规范创建所有图标。我在《扑扑》里表现如何?通用图标的规格是什么? 谢谢!

  • 这是我想要自动化的流(用粗体标记)==>>我对selenium很陌生 文件 脚本二: 我已经尝试了Xpath包含的所有选项(text,href),css和linktext,但没有任何效果。 最初,它鼠标移动了第一个元素(文件),但它在以后的进程中堆积了…! 有关此错误的文档,请访问:http://seleniumhq.org/exceptions/invalid_selector_exceptio

  • 我正在开发一个用于从MIFARE标签读取和写入数据的应用程序。我买了一个可以使用NFC技术读取和写入MIFARE标签操作的设备。 NFC屏蔽 我一直在使用MIFARE ultralight标签,但在尝试验证特定内存地址时遇到了问题。由于这个原因,我不能开始阅读。这是我的Arduino代码: 此读取代码是为Arduino Mega 2560和Seeedstudio NFC Shield v1.0和M

  • 本文向大家介绍如何在BigDecimal上使用>,=,相关面试题,主要包含被问及如何在BigDecimal上使用>,=,时的应答技巧和注意事项,需要的朋友参考一下 Class的每个对象都有一个可用来将其与另一个BigDecimal进行比较的方法。然后比较的结果,或者根据需要进行比较。阅读文档,您将找到答案。 运营商,,等只能在基本数据类型等中使用,,或它们的包装类等和。 从以下文档中: 将其与指定

  • 问题内容: 如何使用或搭配标签?下面是我尝试实现的代码,但未按预期工作。 注意:域对象列表在JSP页面中的位置。 如何修改它以检测到已选择了一个选项? 问题答案: 标签既不支持也不支持事件。前者是指选择文本(即通过单击+在文本字段上拖动),因此只能与和标记一起使用。该事件可以与标记一起使用- 但是,您可能正在寻找最好使用该事件的功能,而不是。 此外,通过标记的外观,您还尝试在纯HTML文档中使用J