当前位置: 首页 > 知识库问答 >
问题:

UIMA是只提供一个包装器,还是像StanfordCore NLP和GATE一样?

钱远
2023-03-14

Standford Core NLP和GATE提供各种NLP操作,如NER、词性标注。有一些NLP操作,比如标记器、雪球词干分析器,可以作为UIMA组件使用。那么,UIMA是可以与StandfordCore NLP/GATE相媲美,还是可以用来包装管道中的此类API?

共有1个答案

双志强
2023-03-14

核心UIMA框架不提供特定的NLP工具。它提供了从UIMA兼容组件构建和运行分析工作流的方法。由于要分析的数据在现实世界的应用程序中可能会变得相当大,UIMA将重点放在可伸缩性上,提供像UIMA-As或UIMA-DUCC这样的分布式运行时环境。然而,UIMA不仅在大规模上很有用,而且在将分析嵌入应用程序或在科学环境中构建语言处理实验方面也很有用。

有几个提供NLP工具的UIMA组件集合,通常包装第三方解决方案,例如OpenNLP、Stanford CoreNLP等:

  • ClearTK-用于开发统计NLP组件的框架,还包括一些第三方工具的包装器
  • cTAKES-从电子病历临床免费文本中提取信息
  • DKPro Core-用于NLP的UIMA组件集合,为UIMA包装了许多第三方工具
  • UIMA插件-UIMA团队自己提供的一小部分组件
  • U-Compare-集成文本挖掘/自然语言处理系统

这些是撰写本文时的一些主要藏品。如果搜索UIMA组件,您可能会找到其他源。

核心UIMA框架可与GATE嵌入式相媲美,减去GATE开箱即用提供的任何处理资源。UIMA Ruta工作台可以说是与GATE Developer工作台,或者更具体地说与JAPE密切相关。

UIMA与斯坦福大学的CoreNLP相比并不是很好,因为UIMA并不专注于提供特定的NLP组件,而CoreNLP专注于提供特定的NLP组件。

像CoreNLP这样的NLP工具倾向于包装为UIMA组件,以便在UIMA管道中使用。

像GATE这样的框架通常不会被包装为UIMA组件,但作为GATE插件提供的特定NLP工具可能会被包装。

披露:我从事ApacheUIMA项目和DKPro核心项目。

 类似资料:
  • 问题内容: 我有一对多关系的两个表。假设对于表格中的每一行,表格中可以有0或更多行引用。 客户想要知道引用某行中有多少行,对于中的所有行。 我可以使用以下查询完成此操作: 但是,如果表和很大,该怎么办?假设有100万行,并且有1000万行。我们还要说,其中99%的行的引用计数少于1000行。假设客户通常一次请求大约100行。 我应该将朴素的count()查询与外键上的索引一起使用,还是最好保留一个

  • 问题内容: 我需要了解有关编译servlet所需的serlvet-api.jar的信息。 我正在构建一个简单的servlet,如下所示: 我知道我们需要servlet-api.jar文件来编译这个简单的servlet,如下所示: 现在我的疑惑从这里开始: 什么是servlet-api.jar? 谁提供这个罐子? 每个Web容器是否都提供此jar,例如Tomcat,Jboss,glassfish?每

  • 所以,这是我的第一个学习项目。 说到这里,我正在使用

  • 我正试图确切地理解什么是记忆障碍。根据我目前所知,使用内存屏障(例如:mfence)来防止指令从之前到之后和从之后到之前的重新排序。 这是正在使用的内存屏障的一个示例: 现在我的问题是:mfence指令是否只是一个指示CPU以何种顺序执行指令的标记?或者,它是CPU实际执行的指令,就像它执行其他指令一样(例如:)。

  • 我使用Firebase作为数据库,用户可以上传图像或视频,所以我从我的数据库中提取URL,所以我得到了两个URL,其中一个可以是视频或图像,所以我可以做什么来检测URL。 注意:有些URL没有扩展,比如、、等。我这样说是因为我有一些网址没有与mp4或png等相关的扩展名。

  • 问题内容: 我从一些现有的wsdl中生成了一些WebServices 我使用Maven来做到这一点,但是某些Web服务是通过 和其他人 Jaxb或xjc会自动执行吗?因为我在wsdls中没有任何区别… 问题答案: 当“操作”名称,“消息”名称和“元素”名称在某种形状或形式上不同时,就会生成BARE Web服务。要自动将您的客户端或服务存根生成为WRAPPED,这三个元素都必须相同。 解决方法是编写