当前位置: 首页 > 软件库 > 大数据 > 数据处理 >

Pulsar-Flink Connector

允许 Flink 向 Pulsar 读写数据
授权协议 Apache-2.0
开发语言 Java
所属分类 大数据、 数据处理
软件类型 开源软件
地区 国产
投 递 者 宇文学博
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户、持久化存储、多机房跨区域数据复制,具有强一致性、高吞吐、低延时及高可扩展流数据存储特性。

Apache Flink是一款面向数据流处理和批量数据处理的分布式的计算引擎,它可以用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时地处理一些实时数据流,实时地产生数据的结果;也可以用来做一些基于事件的应用。

Apache Pulsar 能以不同的方式与 Apache Flink 融合: 使用流式连接器(Streaming Connectors)支持流式工作负载,或使用批式源连接器(Batch Source Connectors)支持批式工作负载。

Pulsar 还提供了对 Schema 的原生支持,可以与 Flink 集成并提供对数据的结构化访问。例如,使用 Flink SQL 在 Pulsar 中查询数据, 另外还能将 Pulsar 作为 Flink 的状态后端。由于 Pulsar 具有分层架构(Apache Bookkeeper 支持下的 Streams 和 Segmented Streams),因此可以将 Pulsar 作为存储层并存储 Flink 状态。

Pulsar Flink Connector 集成了 Apache Pulsar 和 Apache Flink(数据处理引擎),允许 Apache Flink 向 Apache Pulsar 读写数据。Pulsar 支持 Flink 的批流融合计算计算,无需用户再进行多余的操作。
 

使用前提

  • Java 8 及以上版本

  • Flink 1.9.0 及以上版本

  • Pulsar 2.4.0 及以上版本

  • Pulsar Java Client Maven依赖 <dependency> <groupId>org.apache.pulsar</groupId> <artifactId>pulsar-client-all</artifactId> <version>2.8.1</version> </dependency> 租户操作 public class Creat

  • 背景介绍 本地有一个Pulsar集群(已配置kerberos安全认证),版本为2.7.0; 有一个Flink集群,版本为1.12.4; pulsar-client-auth-sasl(与kerberos安全认证相关),版本为2.7.0; pulsar-flink-connector,版本为1.12.4.0; 相关的pom如下: <dependency> <groupId>io.streamnat

  • Apache Flink 持续保持高速发展,是 Apache 最活跃的社区之一。Flink 1.16 共有 240 多个 Contributor 热情参与,共完成了 19 个 FLIP [1] 和 1100 多个 issue,给社区带来非常多振奋人心的功能。 Flink 已经是流计算领域的领跑者,流批一体的概念逐渐得到大家的认可,并在越来越多的公司成功落地。之前的流批一体更强调统一的 API 和统

  • 前言 Flink和Pulsar是当前大数据常用的组件,他们的优势和特点在此不在赘述。可参考Flink官网和Pulsar官网。 我使用的Flink版本为1.12,Pulsar版本为2.9.1。 此文章的背景为Canal采集MySQL中的binlog数据,写入Pulsar,由Flink解析Pulsar中的Json数据,写入到存储中。 一、确定写入pulsar中的数据结构 在pulsar的目录下执行以下

  • 官网 https://nightlies.apache.org/flink/flink-docs-release-1.15/release-notes/flink-1.15 变化的依赖概况 在Flink 1.15中有几个变化,当从早期版本升级时,需要更新依赖项名称,主要包括从非Scala模块中选择排除Scala依赖项,以及重新组织表模块。 一个快速的依赖变化清单如下: 对以下模块的任何依赖都需要更

  • Pulsar Pulsar: No such ledger exists on Metadata Server Pulsar: Please check your java.security.login.auth.config (=null) for section header: PulsarBroker Pulsar-Flink-Connector Pulsar-Flink-Connector

  • 版本: pulsar:2.7.1 flink:1.12.2 maven依赖: <!-- flink-pulsar依赖--> <dependency> <groupId>io.streamnative.connectors</groupId> <artifactId>pulsar-flink-connector_2.11</artifactId> <ver

 相关资料
  • Pulsar 是一个事件驱动的框架,用于监控 Linux 设备的活动。它允许你通过其模块从 Linux 内核收集运行时活动事件,并根据你自己的安全策略集评估每个事件。Pulsar 由 eBPF 提供支持并用 Rust 编写,设计轻巧且安全。 Pulsar 是一个高度模块化、基于事件的运行时安全框架。Pulsar 专为物联网和边缘计算而设计,针对性能、运行时成本和边缘安全性进行了优化。 Pulsar

  • Pulsar 是 eBay 开源的实时大数据分析平台。 作为全球性的商务平台和支付行业领先者,拥有海量的用户行为数据。基于现有的hadoop大数据处理,已经不能够满足业务上对实时性的需求。基于过去的大数据处理的经验和对最新技术的运用,探索出一个对海量的数据流进行实时的收集,处理,分发和分析的平台。并于2015年2月底开源此平台: Pulsar。 Pulsar 作为一个复杂事件处理平台,具有快速,准

  • Pulsar Manger 是由 StreamNative 公司开源并捐献给 Apache 基金会的 Apache Pulsar 的管理端。它是基于 Web 的 GUI 管理工具,支持多种环境的动态配置,主要面向的用户群体是 Pulsar 的管理员,用于管理和监控 Pulsar。通过 Pulsar Manager, 可管理 tenants、namespaces、topics、subscriptio

  • Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体。该系统源于 Yahoo,最初在 Yahoo 内部开发和部署,支持 Yahoo 应用服务平台 140 万个主题,日处理超过 1000 亿条消息。Pulsar 于 2016 年由 Yahoo 开源并捐赠给 Apache 软件基金会进行孵化,2018 年成为 Apach

  • Pulsar 是 Appley Maps 显示脉冲星动画效果的通用解决方案。 Pulsar 基于 CALayer, 兼容任意的 UI 空间和任意的 UIView。 Pulsar 包括基于 CALayer 简单的类,提供一站式服务的 builder 模式: 定制时间和重复计算 定制线宽 定制背景或者边界颜色 定制路径 (可选)

  • Eclipse Pulsar 是一个基于 Eclipse 平台的手机应用程序开发工具。该项目由Eclipse成员Genutec、IBM、摩托罗拉、诺基亚、Research In Motion以及索爱共同发起。它是一个通用的工具,开发者无需再为各种不同的移动平台而下载不同的SDK。