Tigon 是一个开源的、实时的、低延迟、高吞吐量的流处理框架。基于 Apache Hadoop 和 Apache HBase 构建。Tigon 严重依赖开源项目 Tephra 和 Apache Twill 提供紧密的集成到已有的 Hadoop/HBase 集群中。
Tigon 应用 这就是“流”,在逻辑上表示为有向无环图(Directed Acyclic Graph),每个节点代表一个处理单元,这些处理单元就是 Flowlet,使用队列来处理单元之间的数据流。
Flows 对于 Tigon 而言相当于 Twill 对于 YARN 容器。提供了运行时弹性的可伸缩性。
Flowlets 可以存储在 HBase ,如果需要可使用 Tephra 的 ACID 属性。
TigonSQL 是 Tigon 附带的一个内存中的流处理库。可利用它来攫取大量的数据流到 Hadoop/HBase 集群中,并执行类 CEP 的查询语句,使用类似 SQL 的语言进行查询。
Tigon 支持不同运行时和环境,你可以运行在单一计算机或者是分布式 Hadoop 集群中,提供直观的命令行接口帮助用户管理 Tigon 流。
要使用 Tigon 必须有:
JDK 6 or JDK 7 (用来运行 Tigon)
GCC
G++
Apache Maven 3.0+ (用来构建示例程序)
Tigon 是一个开源的、实时的、低延迟、高吞吐量的流处理框架。基于 Apache Hadoop 和 Apache HBase 构建。Tigon 严重依赖开源项目 Tephra 和 Apache Twill 提供紧密的集成到已有的 Hadoop/HBase 集群中。 文章转载自 开源中国社区 [http://www.oschina.net]
References http://blog.cask.co/2014/10/introducing-tigon-real-time-streaming-for-the-real-world/ http://tigon.io/
本文向大家介绍分析Python的Django框架的运行方式及处理流程,包括了分析Python的Django框架的运行方式及处理流程的使用技巧和注意事项,需要的朋友参考一下 之前在网上看过一些介绍Django处理请求的流程和Django源码结构的文章,觉得了解一下这些内容对开发Django项目还是很有帮助的。所以,我按照自己的逻辑总结了一下Django项目的运行方式和对Request的基本处理流程。
你现在拥有了一个远程 Git 版本库,能为所有开发者共享代码提供服务,在一个本地工作流程下,你也已经熟悉了基本 Git 命令。你现在可以学习如何利用 Git 提供的一些分布式工作流程了。 这一章中,你将会学习如何作为贡献者或整合者,在一个分布式协作的环境中使用 Git。 你会学习为一个项目成功地贡献代码,并接触一些最佳实践方式,让你和项目的维护者能轻松地完成这个过程。另外,你也会学到如何管理有很多
我在Cloudera CDH5.3集群上运行Spark,使用YARN作为资源管理器。我正在用Python(PySpark)开发Spark应用程序。 我正在运行一个提交命令,如下所示: 如何确保作业在集群中并行运行?
我想分散加工大批量。这个想法是使用Spring Batch在云中激发一堆AMQP消费者,然后加载廉价的任务(如项目ID)并将它们提交给AMQP交换。结果的书写将由消费者自己完成。 null
ShardingSphere-Proxy 支持使用 SPI 方式接入分布式治理,实现配置和元数据统一管理以及实例熔断和从库禁用等功能。 Zookeeper ShardingSphere-Proxy 默认提供了 Zookeeper 解决方案,实现了注册中心功能。 配置规则同 ShardingSphere-JDBC YAML 保持一致。 其他第三方组件 详情请参考支持的第三方组件。 使用 SPI 方式
使用治理功能需要指定配置中心和注册中心。 配置将全部存入配置中心,可以在每次启动时使用本地配置覆盖配置中心配置,也可以只通过配置中心读取配置。