原文地址:http://my.oschina.net/ychenIntegration/blog/23807 Pentaho Data Integration (Kettle)是Pentaho生态零碎中默许的ETL对象。经过十分直不雅的图形化编纂器(Spoon),您可以界说以XML花样贮存的流程。在 Kettle运转进程中,这些流程会以分歧的办法编译。用到的对象包孕敕令行对象(Pan),小型效劳器(Carte),数据库存储库 (repository)(Kitchen)或许直接运用IDE(Spoon)。 Talend Open Studio是 Talend 开辟的ETL对象——Talend 是一家主营数据集成和数据治理处理方案的企业。Talend 采用用户敌对型,综合性很强的IDE(相似于Pentaho Kettle 的 Spoon)来设计分歧的流程。这些流程可以在IDE外部测试并编译成Java 代码。您可以随时检查并编纂生成的Java代码,同时完成弱小的节制力和灵敏性。 两者都十分优异,都属于用户敌对型的穿插平台(基于Java的)对象。它们的次要差别在于Kettle 将 ELT 流程编译为 XML 花样,但是Talend Open Studio 则生成 Java 代码。 进修曲线、易用性以及文档 Pentaho Kettle 和 Talend Open Studio 都是用户敌对型对象。它们都拥有优异的数据和数据库治理配景(JDBC,SQL,文件花样化,编程根底,等等),成为高产能的对象指日可待。 Kettle 和 Talend 都供应图形化对象使任务愈加轻便快捷。这些对象可以协助您敏捷设计并测试出牢靠的 ETL 流程。 Pentaho Kettle 学起来非常复杂,但与 Talend 的产物比拟功用略少。Talend Open Studio 更难把握,然则一旦您熟习的它的 IDE,您就可以享用到这个对象弱小的灵敏与效能。运用 Talend Open Studio 的一个要求是准确界说您要处置的数据的 schema,在这个工程中,它的 IDE 年夜有助益。而在这一点上,Kettle 限制更少,因而您可以更快地树立起流程来。并且界说元数据对 Talend 来说是一个主要的功用,由于这会协助您在消费情况中做出更牢靠的流程。 Talend Open Studio 和 Pentaho Kettle 都是用户敌对型,拥有丰厚文档和弱小社区支撑的产物。只不外 Talend Open Studio 需求您投入稍年夜的精神来熟习。然则,一旦您入门了,您就可以享用到这个对象的弱小和潜力。 牢靠、成熟、手艺支撑 Talend 和 Pentaho 都有弱小的社区支撑,并且都是弱小、知名的的企业。开源商务智能是不时开展,而实践运用中的使用顺序正变得越来越相反。 在这个配景下,Talend 和 Pentaho 都供应了它们的开源 ETL 对象,并失掉了普遍地运用。它们在实践运用中开展,同商用软件一样以义务为功用完成的中心。 Talend 更专注于数据集成和数据治理处理方案(当然,如今还要加上 SOA),但是 Pentaho 次要集中于商务智能。Talend Open Studio 失掉了 Talend 十分活泼地开辟,并且该公司曾经树立了一个丰厚的数据集成生态零碎,而 Kettle 是 Pentaho 的一个主要项目,只是比起 Talend 的产物,开辟与扩展方面还略胜一筹。 Pentaho 和 Talend 的处理方案都十分牢靠,成熟,并且开展敏捷。实践运用中两者完成的功用有所趋同。经由订阅您可以取得支撑效劳,也可以依照需求获得直接的征询效劳。组件、手艺与功用 Talend Open Studio 是基于 Eclipse 的 Java 对象。您在图形化编纂器中设计的流程可以运用 Java 言语编译。此时,您可以轻松地运用 Java 悉数的生态零碎 Talend Open Studio 的组件品种和具有的功用十分丰厚,既有通用对象,也有公用对象。在通用对象中,Talend 装备了一套 RDBMS 组件,经过它们您很快就可以把握某个特定 DB 厂商的初级功用。您可以将用到的界说贮存在多个分歧的存储库(repository)中,从而在项目开展中运用这些界说。 Pentaho Data Integration (Kettle) 运用 Java (Swing)开辟。Kettle 作为编译器对 XML 花样书写的流程停止编译。这些功用和组件比起 Talend 在丰厚性方面稍逊一些,然则您树立复杂 ETL 流程需求的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深层地节制对数据的处置。 Talend 功用愈加丰厚,比起 Kettle 拥有愈加灵敏的手艺特点。经过 Talend,您可以轻松地运用完好的 Java 生态和一些DB厂商供应的公用的DB功用。Kettle 对象也很优异,同时愈加专注于 ETL 功用。