当前位置：首页 > 软件库 > 大数据 > 数据处理 >

Apache SeaTunnel

高性能分布式数据集成平台

授权协议 Apache

开发语言 Java

所属分类大数据、数据处理

软件类型开源软件

地区国产

投递者齐英耀

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

SeaTunnel 是一个非常易用的支持海量数据快速同步的云原生数据集成平台，每天可以稳定高效同步千亿级数据，已在字节、B站、微博、腾讯云及印度电信等数百家公司生产上使用，目前也已经支持过百种数据源。

为什么我们需要 SeaTunnel

SeaTunnel 尽所能为您解决海量数据同步中可能遇到的问题：

数据丢失与重复
任务堆积与延迟
吞吐量低
应用到生产环境周期长
缺少应用运行状态监控

SeaTunnel使用场景

海量数据同步
海量数据集成
海量数据的 ELT/ETL
海量数据聚合
多源数据处理

SeaTunnel 特性

简单易用，灵活配置，无需开发
支持 CDC
离线多源数据全量和增量同步
超高性能、海量数据处理能力
模块化和插件化，易于扩展

SeaTunnel 支持的 Connector

Source

Fake, File, Hdfs, Kafka, S3, Socket, 自行开发的 Input plugin

Transform

Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自行开发的Filter plugin

Sink

Elasticsearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout, 自行开发的 Output plugin

环境依赖

java 运行环境，java >= 8
如果您要在集群环境中运行 SeaTunnel，那么需要以下环境的任意一种：

SeaTunnel Zeta
Spark
Flink

如果您的数据量较小或者只是做功能验证，也可以仅使用 local 模式启动，无需集群环境，SeaTunnel 支持单机运行。

下载

可以直接运行的软件包下载地址：https://seatunnel.apache.org/download

快速入门

快速入门：https://seatunnel.apache.org/docs/2.3.0/start-v2/locally/quick-start-seatunnel-engine

关于 seatunnel 的详细文档

生产应用案例

微博, 增值业务部数据平台微博某业务有数百个实时流式计算任务使用内部定制版 seatunnel，以及其子项目Guardian做 seatunnel On Yarn 的任务监控。
新浪, 大数据运维分析平台新浪运维数据分析平台使用 seatunnel 为新浪新闻，CDN 等服务做运维大数据的实时和离线分析，并写入 Clickhouse。
搜狗，搜狗奇点系统搜狗奇点系统使用 seatunnel 作为 ETL 工具, 帮助建立实时数仓体系

更多案例参见: https://seatunnel.apache.org/user

贡献观点和代码

提交问题和建议：https://github.com/apache/incubator-seatunnel/issues

贡献代码：https://github.com/apache/incubator-seatunnel/contribute

使用案例

通过apache seatunnel将mysql数据和hive同步

Flink集群部署安装 Standalone模式部署 Flink 安装部署需要准备 3 台 Linux 机器。具体要求如下：系统环境为 CentOS 7.5 版本。安装 Java 8（略）。环境变量，（部署完成） export JAVA_HOME=/bigdata/opt/jdk/jdk1.8.0_211 export JRE_HOME=${JAVA_HOME}/jre export CLA
apache seatunnel介绍，github star数量，使用的公司

Apache Seatunnel 是一个开源的WebSocket代理，它可以让你连接到Websocket服务器并且转发消息到其他服务器。Github 上的星星数量为 120。它被多家公司使用，比如：Google，IBM，微软，亚马逊，谷歌，英特尔等。
Apache SeaTunnel 同步MySQL 数据到 Apache Kafka （SeaTunnel Engine）

Apache SeaTunnel 简介下一代高性能、分布式、海量数据集成框架核心特性组件丰富:内置丰富插件，支持各种数据产品方便快捷的传输和集成数据高扩展性:基于模块化和插件化设计，支持热插拔，带来更好的扩展性简单易用:特有的架构设计下，使得开发配置更简单，几乎零代码，无使用成本成熟稳定:经历多家企业，大规模生产环境使用和海量数据的洗礼，稳定健壮一、准备工作首先安装并设置Java（

Apache SeaTunnel

为什么我们需要 SeaTunnel

SeaTunnel使用场景

SeaTunnel 特性

SeaTunnel 支持的 Connector

环境依赖

下载

快速入门

生产应用案例

贡献观点和代码

同类工具

相关阅读

相关文章

相关问答

相关文档