当前位置: 首页 > 知识库问答 >
问题:

用JAPE注释文档

段干博涉
2023-03-14

我一直在寻找一个解决这个问题的几个星期,我有一些文件(约95)我正试图使用Gate分类。我已经将它们放在一个名为training_corpus的语料库中,但是,在ANNIE注释了语料库之后,我必须返回到每个文件中,选择文档中的所有标记,并创建一个名为manite的注释,使用feature type和value to the class for document。例如:

键入开始结束id功能
提及0 700 00 258 8{type=neg}

不管怎样,有没有用jape自动做到这一点?基本上,我想选择所有标记并创建一个新的带有feature(type=class)的注释。此外,类也被追加到文档中。由于有很多文档,可以JAPE从文档名称中提取类,并将其设置为Mentions特性的值。示例文档名为neg_data1.txt,因此注释将是mention.type=neg?

任何帮助都将不胜感激。谢谢

共有1个答案

董联
2023-03-14

我想你自己回答了你的问题。如果课文作业仅仅基于文本中的一个标记--为什么不简单地在门外处理文本呢?例如,创建一个类似:text的xml文件,然后在培训过程中使用它。此外,您还可以创建一个简单的JAPE规则,它将:a)将在文档边界内获取文本(请参见后面的gate.utils.length方法)b)基于您的令牌的存在将创建一个具有必要特性的新注释实例。一个抽象示例:

Phase: Instance
Input: Token
Options: control = once

Rule:Instance
(
  {Token}
):instance
-->
{
   AnnotationSet instances = outputAS.get("INSTANCE_ANNOTATION");
    FeatureMap featureMap = Factory.newFeatureMap();
    if (instances!=null&&!instances.isEmpty()){
       featureMap.put("features when annotation presented in doc");
     }else{
       featureMap.put("features when annotation not in doc");
     }
    outputAS.add(new Long(0), new Long(documentLength), "Mention", featureMap);

}
 类似资料:
  • 我有一个GATE文档,其字符串如下所示:

  • 嗨,我正试图解析文档或pdf文件中的文本。每当我尝试使用:

  • 主要内容:Javadoc标签,Javadoc命令,DOS命令生成API帮助文档 ,MyEclipse生成API帮助文档,文档注释的格式Java 支持 3 种注释,分别是单行注释、多行注释和文档注释。文档注释以 开头,并以 结束,可以通过 Javadoc 生成 API 帮助文档,Java 帮助文档主要用来说明类、成员变量和方法的功能。 文档注释只放在类、接口、成员变量、方法之前,因为 Javadoc 只处理这些地方的文档注释,而忽略其它地方的文档注释。 Javadoc 是 Sun 公司提供的一种工

  • 我需要提取word文档评论和他们评论的文本。下面是我当前的解决方案,但它无法正常工作 输出为(不正确): 预期产出为: 请帮我一个更好的方法来显示word文档评论和他们评论的文本。如果你需要额外的细节让我知道我会提供所有所需的细节

  • 我有一把刀: 问题是,当我试图使用DAO进行加载调用时,使用DynamoDBMapper以field d1作为哈希键来获取项目,它会抛出一个DynamoDBExc0019,说:为公共DAO. getField2()找到了空键,但实际上表的值对应于field d2。问题,这是因为Lombok注释而不是手动突变代码,还是一般来说我们一起使用Lombok和DynamoDBAnnotions?

  • 有没有办法从一个巨大的xml文件中删除注释( 两者,根元素前的注释 和内的注释 最好的解决方案是使用xPath。我试过了 它适用于DOM,但不适用于vtd xml 这是我选择评论的代码 但此处的屏幕上打印的是nothing。 有没有办法用vtd xml做到这一点? 谢谢你的帮助。