当前位置: 首页 > 工具软件 > Apache UIMA > 使用案例 >

Thanslation of Summary of Apache UIMA Capabilities

百里骏
2023-12-01

 

 

1.

模块 描述
UIMA Framework Core

集成了创建、部署、运行和管理UIMA组件核心功能的框架。这些组件包括已配置的和/或者分布式的配置里的分析引擎(AE)和集成处理引擎(Collection Processing Engine)

这个框架包括了传输层适配、CAS管理、工作流管理的核心组件的实现。这些组件是给予便于陈述的详细规格说明(declarative specifications),资源管理,配置管理,登陆和其他功能。

C++和其他变成互操作性

包括C++ CAS,也支持能用内建的JNI适配器部署在UIMA运行时的UIMA兼容的C++组件的创建。

包括创建基于服务的UIMA引擎的支持。这对包装用不同语言编写的现有代码是理想的。

2.

框架服务和API 注意这些组件的接口对于开发者是可得到的,但是在不同的UIMA框架的实现中可能有不用的实现。
CAS这些类为开发者提供到CAS的类型化的(typed acess)入口,包括 类型系统模型(type system schema)、元素、分析的主题(subjects of anolysis : Sofas)和索引。多主题分析机制支持独立的或者并发的对同样的物品(artifact)(e.g. 文件)的多视角的分析,支持多语言(multi-lingual)和多形态(multi-modal)的分析。
JCasCAS的替代接口,为基于Java的分析组件提供本地java对象使用CAS类型和他们的属性和特征,使用JavaBeans getters和setters的习惯。
集成处理管理(Collection Processing Management : CPM)为集成处理引擎(Collection Processing Engine)在已配置的和/或分布式配置里运行的核心功能。CPM提供穿过平行处理管道、检查点、性能监控和可恢复性的可测量性。
资源管理者(Resource Manager)为UIMA组件提供运行时外部处理资源命名、共享和缓存能力。
配置管理者(Configration Manager)为UIMA组件提供运行时配置参数的设置。
记录者(Logger)提供通用日志记录工具。
工具和公共程序(Utilities)
JCasGen

为CAS类型从UIMA XML类型系统定义中生成Java对象模型的公共程序

保存和恢复CAS内容在核心框架中支持用XMI格式保存和恢复CAS内容到流中的API

Eclispe 的 PEAR* 包装器

构建UIMA归档文件来便利出口(porting)、注册、安装和测试组件的工具
PEAR 安装器在安装UIMA中安装和验证UIMA组件归档文件的工具
PEAR 合并器联合多个PEAR成一个的公共程序
组件描述符编辑器为UIMA分析引擎和其他UIMA组件类型(包括集成读者(Collection Reader)和CAS消费者(CAS Consumers))详细说明和配置组件描述符的Eclispe插件。
CPE 配置器为配置集成处理引擎和把这些引擎应用到文档的集成中的图形化工具。
Java 标注查看器(Annotation Viewer)为了浏览标注和相关的CAS数据的查看器
CAS可视化调试器

为开发者提供详细的CAS内容的可视化视图的JAVA GUI 程序。

文档分析器应用分析引擎到一批(sets of)文档中,并在查看器中现实结果的Java GUI 程序
实例分析组件
数据库Writer使用JDBC将选择的CAS类型写入到关系数据库的CAS Consumer。这个代码在cpe/PersonTitleDBWriterCasConsumer文件夹下。
标注(Annotators)一些用于教学目的的简单标注。包括:Date/time, Room-number, Regular expression, Tokenizer, 和Meeting-finder标注。也有可以从opennlp.org获取的标注包装器(wrappers for annotators)。也有CAS Multipliers的示例。
流控制器(Flow Controllers)一个基于白板概念的示例流控制器。它将CAS发送到任何一个还没有处理过它的标注,当那个标注的输入可在CAS上获得时.
XMI集合阅读器(XMI Collection Reader), CAS消费者(CAS Consumer)读写XMI格式的CAS

文件系统集合阅读器(File System Collection Reader)

为了从文件系统中拖出文件并初始化CAS的简单的集合阅读器

3.

可以从www.alphaworks.ibm.com/tech/uima 获得的组件
语义搜索CAS索引器使用语义搜索引擎索引器来建立从CAS流的索引的CAS消费者。需要语义搜索引擎(从同一个地方可以获得)

 

(1)PEAR

An archive file that packages up a UIMA component with its code, descriptor files and other resources required to install and run it in another environment.

 

 类似资料:

相关阅读

相关文章

相关问答