吉尔伯特综合征
第一个会被检测到,但是每个单词都会得到批注DRUG_CLASS,而且似乎没有办法将这些单词链接起来,就像两个单词都有的NER id一样。
第二种情况根本检测不到,这可能是因为标记器将Gilbert后面的撇号作为一个单独的标记。由于RegexNER将标记化作为一个依赖项,所以我真的无法绕过它。
有什么解决这些案件的建议吗?
如果您使用EntityMentions
注释器,该注释器将从具有相同ner标记的连续令牌中创建实体提及。有一个缺点是,如果两个相同类型的实体并排在一起,它们将被连接在一起。我们正在改进ner系统,所以我们可能会包括一个新的模型,在这些情况下找到不同提及的边界,希望这将进入斯坦福CorenLP3.8.0。
下面是访问所提到的实体的一些示例代码:
package edu.stanford.nlp.examples;
import edu.stanford.nlp.pipeline.*;
import edu.stanford.nlp.ling.*;
import edu.stanford.nlp.util.*;
import java.util.*;
public class EntityMentionsExample {
public static void main(String[] args) {
Annotation document =
new Annotation("John Smith visted Los Angeles on Tuesday.");
Properties props = new Properties();
props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,entitymentions");
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
pipeline.annotate(document);
for (CoreMap entityMention : document.get(CoreAnnotations.MentionsAnnotation.class)) {
System.out.println(entityMention);
System.out.println(entityMention.get(CoreAnnotations.TextAnnotation.class));
}
}
}
如果您只是用与标记器相同的方式标记规则,那么它将很好地工作,例如,规则应该是Gilbert's syndrome
。
我正在运行Java版本1.8.0_101的Mac上使用斯坦福CoreNLP 3.9.1。我已经运行了CoreNLP,并且能够利用大多数注释器。我试图微调我的命名实体识别,但在使用现有映射时遇到了问题。 以下是属性文件的内容:#此文件通过以下命令启动:#Marks-MacBook-Pro-4:stanford-corenlp-full-2018-02-27 moranmarkd$java-cp“*”
想象一个随机排列的单词序列:
我有一个react-native应用程序,带有react-native购买和react-native指示包。他们都有进口品 由:java.lang.runtimeException:com.android.builder.dexing.dexarchivEmergerException:合并dex归档时出错:在https://developer.android.com/studio/build/d
我试着使用下面的代码将TABLE_name更改为MANAGER_ID; 收到错误信息:1064。您的SQL语法有错误;请查看与MySQL服务器版本对应的手册,以了解在第1行0.000秒处使用“MANAGER ID”到“MANAGER_ID”附近的正确语法
我在检测两个数的和/乘是否超过长整数的最大值时遇到了问题。 示例代码: 如果你认为这不对就告诉我。
问题内容: 我想检查Python程序中英语词典中是否有单词。 我相信可能会采用nltk wordnet接口,但是我不知道如何将其用于如此简单的任务。 将来,我可能想检查单词的单数形式是否在字典中(例如,属性->属性->英语单词)。我将如何实现? 问题答案: 要获得更大的功能和灵活性,请使用专用的拼写检查库,例如。有一个教程,或者您可以直接学习: 带有一些词典(en_GB,en_US,de_DE,f