当前位置：首页 > 软件库 > 企业应用 > ETL工具框架 >

Apache Hop

数据编排平台

授权协议 Apache

开发语言 Java

所属分类企业应用、 ETL工具框架

软件类型开源软件

地区不详

投递者蔚宏大

操作系统跨平台

开源组织 Apache

适用人群未知

软件官网

软件文档

官方下载

软件概览

Apache Hop（Hop 是 Hop Orchestration Platform 的缩写）是一个灵活、元数据驱动的数据编排、工程和集成平台。

Apache Hop 起源于二十多年前的 ETL 平台 Kettle。从 2020 年 2 月份开始，Kettle 社区在 Kettle 8.2 的基础上创建了一个分支，Hop 正是基于这个分支构建的新项目。

Apache Hop 基于 Java 的可视化设计器、服务器和配置工具易于在众多平台上设置、部署和维护，其被设计用于任何场景：本地、云、裸操作系统、容器、物联网环境、大型数据集等，并支持在 Windows、Linux 和 OSX 平台上运行。

特点包括：

轻量级的“一次设计，处处运行”架构
元数据驱动
可视化开发环境
集成丰富的插件
内置生命周期管理

使用案例

架构：数据系统Apache Hop简介以及与Kettle的异同

Apache Hop（Hop Orchestration Platform 的首字母缩写）是一种数据编排（data orchestration ）和数据工程平台（data engineering platform），旨在促进数据和元数据编制。Hop 可以让我们专注于问题的解决，而不受技术的阻碍。该项目起源于 Kettle，经过数年的重构，并于2020年9月进入 Apache 孵化器；2022年1月
Apache Hop Pipeline Transforms【持续完善中】

Transforms Abort（取消） DESCRIPTION（描述）一旦接收到输入数据，Abort转换就终止正在运行的管道。此转换的主要用例是在发生意外或不想要的情况时抛出错误。例如，您可以使用此转换，以便在经过错误跳的x行流量后中止管道。 OPTIONS（选择项） Option Description Transform name （转化名称） Name of the transform
etl工具中hop工具和kettle工具的对比

ETL(Extract, Transform, Load)工具是一种用于从多个数据源提取数据，转换它们以符合目标数据模型的要求，并将其加载到目标数据库的软件。HOP和Kettle是两种流行的ETL工具。 HOP是开源的ETL工具，由Pentaho(现在是Hitachi Vantara)开发。它是基于Java的，支持跨平台运行，并具有丰富的可视化界面，可以帮助用户轻松地创建和管理ETL作业。HOP还
Apache Hop使用

1、maven 依赖 1.1、本地镜像 <mirror> <id>nexus-aliyun</id> <mirrorOf>jcenter</mirrorOf> <url>https://maven.aliyun.com/repository/central</url> </mirror> 1.2、pom.xml依赖 <?xml version="1.0" encoding
Apache Hop 达到顶级项目状态

作为一个编排平台，Apache Hop 完全用 Java 编写，旨在提供广泛的数据编排工具，包括可视化开发环境、服务器、元数据分析、审计服务等。据外媒报道，Apache Hop 在 2020 年底达到 Apache 孵化器状态后，Apache Hop 在近日被提升为顶级状态，目前已经成为 Apache 软件基金会的顶级项目。

相关资料

数据平台调研

美团大数据平台架构实践同程旅游实时计算的演进携程大数据实践：高并发应用架构及推荐系统案例斗鱼大数据搭建的经验和坑滴滴实时计算平台在运营监控方面的应用
大数据平台之数据存储

主要内容：1.大数据生态技术,2.数据存储,3.数据存储的发展,4.数据存储的方式1.大数据生态技术数据存储处理: 清洗, 关联, 规范化, 组织建模, 通过数据质量的检测, 数据分析然后提供相应的数据服务离线数仓: 实时数仓: 以Kafka, cancal/Maxwell/FlinkCdc为区分, 离线数仓为Hive, Sqoop 实时数仓:分层: Ods, Dwd, Dim, Dwm, Dws, Ads 离线数仓分层: Ods. Dwd, Dws, Dwt, Ads 实
字节-机器学习平台-编排调度一面

记录一下字节处女面 2024.07.23 1. 自我介绍 2. 简历从上到下拷打（30 min） 3. os中进程调度方式 4. os中进程的元信息放置在哪里 5. docker中unionFS、namespace、cgroup 6. cgroup中如何在进程调度中体现 7. 介绍一个k8s中你最熟悉的组件（kube-scheduler） 8. 做题：二叉树两个节点的最短边总体回答的一般般，项目
快手数据平台70min

八股+sql题+算法题
编排

通过Helm编排一键部署虚拟机实例和容器实例。编排使用流程：在Helm仓库中对接虚拟机类型和容器类型等Helm仓库。在应用市场中选择虚拟机类型或容器类型的应用部署。部署容器类型应用前需要在容器中创建容器集群以及命名空间等。部署虚拟机类型应用前请确保平台中有“CentOS-7.6.1810-20190430.qcow2”镜像、可用宿主机或公有云/私有云云账号等。虚拟机实例用于管理通过编
9. 排错指南 - 云平台排错

本章主要介绍在公有云中运行 Kubernetes 时可能会碰到的问题以及解决方法。在公有云平台上运行 Kubernetes，一般可以使用云平台提供的托管 Kubernetes 服务（比如 Google 的 GKE、微软 Azure 的 AKS 或者 AWS 的 Amazon EKS 等）。当然，为了更自由的灵活性，也可以直接在这些公有云平台的虚拟机中部署 Kubernetes。无论哪种方法，一般
Tableau排序数据

工作表中存在的数据可以根据需求进行排序。它可以根据数据源对数据进行排序，例如升序，降序或依赖于任何测量值。下面逐步给出了对数据进行排序的过程：例如，考虑一个数据源：sample-superstore，并且您希望按如下方式对维度和度量字段进行排序。第1步：使用Tableau添加sample-superstore 数据源，并将表拖动到下面屏幕截图中显示的窗格。第2步：转到工作表并将维度类别
Tableau数据排序

在数据源中，可以根据用户要求存储数据。它可以使用数据源顺序进行排序，例如A到Z递增，Z到A递减，A到Z按表升序，Z到A递减每个表。将数据与Tableau连接后，使用“排序字段(Sort Fields)”选项完成数据排序。“排序字段(Sort Fields)”选项存在于“数据源(Data Source)”选项卡中。在Tableau中有两种方法对数据进行排序：手动排序：手动排序是一种排序，它通过

Apache Hop

同类工具

相关阅读

相关文章

相关问答

相关文档