问题：

命名实体识别（Ner）-组织名称数据库

顾琛

2023-03-14

我正在进行我目前的毕业项目，名为“土耳其实体识别”。当我使用人名和地点（有时地点可以是不同的语言，例如塔克西姆/伊斯坦布尔的希尔顿酒店）时，识别器应该捕捉到土耳其语单词。我需要在我的数据集中添加“Hotel”，该数据集充满了特定的位置标签，如Hotel、Restaurant或Mall。但说到组织名称标签。我需要找到一个关于乐队、产品、公司名称的好数据集，但我不知道如何找到或收集这个数据集

在斯坦福nlp工具中：http://nlp.stanford.edu:8080/ner/process

当我输入Facebook、耐克、阿迪达斯等，它可以找到它的组织。那么，有没有办法让组织名称成为数据集呢？

共有2个答案

商天逸

2023-03-14

试着从维基百科上收集它们。这是一个巨大的来源。您可以编写一个解析器，从wiki转储中收集特定类型实体的信息。维基百科有一个对人、地点和组织进行分类的层次结构。

尹钱青

2023-03-14

如果您对具有这些组织名称的数据资源感兴趣。您可以使用一个可用的知识库KBs，例如

DBpedia
雅戈
BabelNet只能在线下载
自由基

它们都有这些组织的名称，而且更多，您需要一些努力，仅使用它们的类型来提取这些组织。例如，YAGO有可下载的文件，其中包含可能的实体及其类型。你可以过滤它，然后你可以使用hasMeansion数据来获取所有可能的名字。

Yago和BabelNet已被用于NER或命名实体消歧系统AIDA和Babelfy。

AIDA提供了一个可能的实体名称的强大数据集，可用于NER。

类似资料：

用于多种语言的名称实体识别（NER）

我正在编写一些代码来执行命名实体识别（NER），这对于英文文本来说非常好。然而，我希望能够将NER应用于任何语言。为此，我想1）识别文本的语言，然后2）将NER应用于识别的语言。对于第2步，我怀疑A）将文本翻译成英语，然后应用NER（英语），或B）将NER应用于所识别的语言。以下是我目前掌握的代码。我想让NER在这种语言首次被识别后，为text2或任何其他语言工作：有人有这方面的经验吗？非常感
Java命名实体识别库

问题内容：我正在寻找Java的简单但“足够好”的命名实体识别库（和字典），我正在处理电子邮件和文档并提取一些“基本信息”，例如：名称，地点，地址和日期我一直在环顾四周，大多数似乎都是沉重的一面和完整的NLP项目。有什么建议吗？问题答案：顺便说一句，我最近遇到了OpenCalais，它似乎具有我要照顾的功能。
如何创建基于地名录的命名实体识别（NER）系统？

我尝试过很多NER工具（OpenNLP、斯坦福NER、LingPipe、Dbpedia Spotlight等）。但我一直回避的是一个基于地名录/词典的NER系统，在该系统中，我的自由文本与预定义实体名称列表匹配，并返回可能的匹配项。这样我就可以拥有各种列表，如PERSON、ORGANIZATION等。我可以动态更改列表并获得不同的提取。这将大大减少训练时间（因为它们中的大多数都基于最大熵模型，
基于自定义语料库的NLTK或Stanford-NER命名实体识别

我正在尝试使用自定义NE（命名实体）字典在印度训练NER模型以进行分块。我分别引用NLTK和Stanford NER： NLTK 我找到了NEChunkParser能够在自定义语料库上进行训练。然而，文档或源代码注释中没有指定训练语料库的格式。在哪里可以找到NLTK中NER的自定义语料库指南？根据这个问题，斯坦福大学NER的FAQ给出了如何训练定制NER模型的方向。主要问题之一是默认的斯坦福
意大利语命名实体识别

我想使用NLP工具从意大利文本中提取名称和数字。遗憾的是，斯坦福德NLP和Apache OpenNLP都没有为意大利人提供模型。我能找到一个，或者找到训练数据来制造一个吗？（至少15000句）
StanfordNLP：用于命名实体识别的ArrayIndexOutOfBoundsException

我正在尝试使用这个简短的实体识别教程来学习NER。但我无法成功运行代码。我在现场提供了一个入口。这里提到的txt文件。我收到错误。请帮帮我。先谢谢你。

命名实体识别（Ner）-组织名称数据库

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档