问题：

如何使用CorenLP的regexner检测具有超过1个单词的命名实体？

钱繁

2023-03-14

吉尔伯特综合征

第一个会被检测到，但是每个单词都会得到批注DRUG_CLASS，而且似乎没有办法将这些单词链接起来，就像两个单词都有的NER id一样。

第二种情况根本检测不到，这可能是因为标记器将Gilbert后面的撇号作为一个单独的标记。由于RegexNER将标记化作为一个依赖项，所以我真的无法绕过它。

有什么解决这些案件的建议吗？

共有1个答案

仉联

2023-03-14

如果您使用EntityMentions注释器，该注释器将从具有相同ner标记的连续令牌中创建实体提及。有一个缺点是，如果两个相同类型的实体并排在一起，它们将被连接在一起。我们正在改进ner系统，所以我们可能会包括一个新的模型，在这些情况下找到不同提及的边界，希望这将进入斯坦福CorenLP3.8.0。

下面是访问所提到的实体的一些示例代码：

package edu.stanford.nlp.examples;

import edu.stanford.nlp.pipeline.*;
import edu.stanford.nlp.ling.*;
import edu.stanford.nlp.util.*;

import java.util.*;

public class EntityMentionsExample {

  public static void main(String[] args) {
    Annotation document =
        new Annotation("John Smith visted Los Angeles on Tuesday.");
    Properties props = new Properties();
    props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,entitymentions");
    StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
    pipeline.annotate(document);

    for (CoreMap entityMention : document.get(CoreAnnotations.MentionsAnnotation.class)) {
      System.out.println(entityMention);
      System.out.println(entityMention.get(CoreAnnotations.TextAnnotation.class));
    }
  }
}

如果您只是用与标记器相同的方式标记规则，那么它将很好地工作，例如，规则应该是Gilbert's syndrome。

类似资料：

使用regexner覆盖现有命名实体，同时维护EntityStations的问题

我正在运行Java版本1.8.0_101的Mac上使用斯坦福CoreNLP 3.9.1。我已经运行了CoreNLP，并且能够利用大多数注释器。我试图微调我的命名实体识别，但在使用现有映射时遇到了问题。以下是属性文件的内容：#此文件通过以下命令启动：#Marks-MacBook-Pro-4:stanford-corenlp-full-2018-02-27 moranmarkd$java-cp“*”
在单词的顺序中："Word1， Word2， Word3"：如何在"Word1"上有1个且只有1个超链接

想象一个随机排列的单词序列：
如何使用具有相同类名/命名空间的2个react-native包

我有一个react-native应用程序，带有react-native购买和react-native指示包。他们都有进口品由：java.lang.runtimeException：com.android.builder.dexing.dexarchivEmergerException：合并dex归档时出错：在https://developer.android.com/studio/build/d
如何在MySQL[duplicate]中重命名两个单词（例如，“manager id”）的列名

我试着使用下面的代码将TABLE_name更改为MANAGER_ID；收到错误信息：1064。您的SQL语法有错误；请查看与MySQL服务器版本对应的手册，以了解在第1行0.000秒处使用“MANAGER ID”到“MANAGER_ID”附近的正确语法
java数字超过long.max_value-如何检测？

我在检测两个数的和/乘是否超过长整数的最大值时遇到了问题。示例代码：如果你认为这不对就告诉我。
如何使用Python检查单词是否为英语单词？

问题内容：我想检查Python程序中英语词典中是否有单词。我相信可能会采用nltk wordnet接口，但是我不知道如何将其用于如此简单的任务。将来，我可能想检查单词的单数形式是否在字典中（例如，属性->属性->英语单词）。我将如何实现？问题答案：要获得更大的功能和灵活性，请使用专用的拼写检查库，例如。有一个教程，或者您可以直接学习：带有一些词典（en_GB，en_US，de_DE，f

如何使用CorenLP的regexner检测具有超过1个单词的命名实体？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档