当前位置：首页 > 软件库 > 服务器软件 > 分布式应用/网格 >

Apache Samza

分布式流处理框架

授权协议 Apache

开发语言 Java

所属分类服务器软件、分布式应用/网格

软件类型开源软件

地区不详

投递者冉绯辞

操作系统跨平台

开源组织 Apache

适用人群未知

软件概览

Samza是近日由LinkedIn开源的一项技术，它是一个分布式流处理框架，专用于实时数据的处理，非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop，而且使用了LinkedIn自家的Kafka分布式消息系统，并使用资源管理器 Apache Hadoop YARN 实现容错处理、处理器隔离、安全性和资源管理。。

使用案例

在Linux上怎么安装和配置Apache Samza

samza是一个分布式的流式数据处理框架（streaming processing），它是基于Kafka消息队列来实现类实时的流式数据处理的。(准确的说，samza是通过模块化的形式来使用kafka的，因此可以构架在其他消息队列框架上，但出发点和默认实现是基于kafka) Apache Kafka主要是用来控制发消息的 Apache Hadoop YARN会提供错误信息，隔离处理器，安全和资源管理
【Apache Samza 系列】实时流数据处理框架Samza中文教程（二）-- 背景

背景本章介绍了关于流式计算的一些背景，描述了什么是samza，以及samza为什么会被构建出来。什么是消息？消息系统是实现近实时的异步计算的流行方式。当有消息产生时可以被放入一个消息队列（ActiveMQ，RabbitMQ）、发布-订阅系统（Kestrel，Kafka）或者日志聚合系统（Flume、Scribe）。下游消费者从这些系统中读取信息，并对其进行处理，或基于该消息的内容执行下一步操
Samza---一个开源、分布式的流处理框架

Apache Samza是一个开源、分布式的流处理框架，它使用开源分布式消息处理系统Apache Kafka来实现消息服务，并使用资源管理器Apache Hadoop YARN实现容错处理、处理器隔离、安全性和资源管理。近日，从Apache官方博客中得知，开源的分布式流处理框架Samza历经18个月的孵化期后终于升级成为Apache的顶级项目。Samza由LinkedIn于2013年9月开源并作为
【大数据】计算引擎之五：Samza处理框架

这里主要还是说kafka的事情，samza依赖kafka。 1.是什么？ Apache Samza是一种与Apache Kafka消息系统紧密绑定的流处理框架。虽然Kafka可用于很多流处理系统，但按照设计，Samza可以更好地发挥Kafka独特的架构优势和保障。该技术可通过Kafka提供容错、缓冲，以及状态存储。 2.怎么干？　　 Samza可使用YARN作为资源管理器。这意味着默认情况下需要具

Apache Samza

同类工具

相关阅读

相关文章

相关问答

相关文档