FAST ESP主要是在以下几个方面比IBM Omnifind有显著的优点:
1. 语言学处理(直接影响搜索的精准度和相关度):
IBM没有实体提炼(文档知识挖掘)和上下文感知技术,FAST ESP都具有且很强。
2. 性能和可扩展性:
FAST ESP可以扩展到PB级(1PB=1000TB)数据容量,可以支持到几亿级的文档数量。IBM Omnifind只支持几百万级的记录和最多到4个节点。
3. 排名(排序)控制:
FAST有Ranking Profile的机制来灵活控制排名、排序的个性化和相关度。IBM没有。
4. 可管理性:
FAST搜索管理中心为业务人员提供了手工调节排名、排序规则的能力(如排名推进,可以将突发事件、新闻、领导讲话等推进到搜索结果的最前端)。 而且有一个很好的搜索报告图形界面。而IBM则没有。
5. 架构灵活性:
FAST有一个很强且灵活的文档处理流水线管道(Document Pipeline),它为用户提供了灵活的处理原始数据、丰富元数据、知识挖掘、改善数据质量等能力。而IBM则没有这样的功能。
6. 查询处理:
查询的自动提示填充、查询扩展等,类似Google的"Do you mean by this?" 功能等FAST ESP都有,而IBM Omnifind则没有。
7. 导航:
FAST具有处理大量导航参数和多纬度导航的功能,IBM的导航很有限。
8. 国际化
FAST支持70多种国际语言,且在 CJK语言领域 (中日韩文)较强。FAST支持增强的分词断句(tokenization),也支持N-gram算法。IBM在这方面较弱,从而搜索精准度和相关度较低。
总之,FAST在搜索的准确度和相关性、用户的体验(导航、自动提示、个性化等)、可扩展性、性能、架构的灵活性(易于定制开发)、可管理性等方面比IBM Omnifind有较大的优势。
1. FAST 提供一个模块化、集成的企业搜索平台:
–FAST几千的成功客户案例验证了它的跨越后台到前端的信息采集、集成、处理和展现的能力。
–IBM可能有类似跨越它的各种搜索产品的能力,但不是在一个集成的、模块化的平台中。
2. FAST独立于底层的数据库和应用
–FAST ESP提供现成的连接器和开放API,以连接非结构化和结构化数据源。
–IBM的搜索解决方案很大程度上束缚于它的数据库(DB2), 和J2EE application server(WebSphere), 以及其它的商业系统 (如mainframe STAIRS system)
3. FAST无与匹配的可扩展性和性能
–FAST具有对每秒成千的查询而响应时间在亚秒级的能力。在一般的商用硬件上可以扩展到TB以上的数据量。
–IBM缺乏大容量和高扩展能力的客户案例
4. 不同等级的功能
–FAST提供透明的、可客户化相关性模型,支持结构化和非结构化数据,更全面的语言支持和高级语言学,动态导航,分类管理工具,智能实体提炼和结果聚类,多媒体搜索和一个真正可以定制和客户化的平台。
--IBM Omnifind则不具备或有限地支持以上智能化的功能特点.