Firestorm

分布式远程 Shuffle 服务
授权协议 Apache-2.0
开发语言 Java
所属分类 服务器软件、 终端服务器/远程连接
软件类型 开源软件
地区 国产
投 递 者 祁绪
操作系统 跨平台
开源组织 腾讯
适用人群 未知
 软件概览

Firestorm 是一个远程 Shuffle 服务,它为 Apache Spark 应用程序提供了在远程服务器上存储 shuffle 数据的能力。

特性:

  • 支持多种集群部署模式。Firestorm将Shuffle数据存储在了远程,因此计算集群将不再需要大量存储空间。同时,大数据集群的部署模式也变得更加灵活,基于Firestorm,计算存储分离,计算存储混布,在线离线混布等部署模式都得到很好的支撑。
  • 支持Shuffle数据聚合。Firestorm通过服务端对Shuffle数据进行分拣操作,从而达到了数据聚合的目的,大幅降低了在Shuffle过程中对于磁盘的随机访问。同时,Firestorm在客户端和服务端都使用了数据缓存机制,最大化利用内存资源,从而降低了磁盘访问的性能损耗。
  • 灵活适配各种计算引擎和存储方式。Firestorm在实现上采用了计算引擎和存储方式的解耦,因此能通过实现引擎侧接口,灵活支持各类计算引擎(如Spark,MR等)。同样,对于Shuffle数据的存储方式也能支持,如本地文件,HDFS文件及混合模式等。
  • 支持Shuffle数据的正确性校验。Firestorm以Block为单位存储Shuffle数据,对于每个Block都会存储CRC值等元数据。基于这些元数据,不但能过滤无效数据,还能检测数据在整条链路的传递过程中是否缺失,完整,保障计算任务执行过程中的数据正确性。
  • 支持整体架构多活模式。Firestorm采用了主从架构,能更好的管理集群的状况,在任务调度过程中也能采用更灵活的调度方式,提高整体集群资源利用率。为了满足服务高可用,对于主节点还增加了主-备多活模式,提升了集群服务的稳定性。
  • 支持多种指标监控。Firestorm对于集群的运行状况,采集了大量的运行时指标,基于这些指标能实时掌握集群的负载及健康状况,在使用过程中及时准确地发现问题,便于问题的排查。
  • 支持服务在线升级。Firestorm具备节点黑名单功能,客户端和服务端也采用了版本匹配机制。基于这些特征,Firestorm能实现在生产环境在线升级,同时做到应用无感知,增强了生产的实用性。
  • 11月4日,在2021腾讯数字生态大会上,腾讯宣布将开源自主研发的分布式远程Shuffle服务Firestorm。该服务的开源不但可以助推分布式计算的云原生部署,还能解决大数据分布式计算过程中的痛点,提升计算资源的利用率。 在分布式计算领域,Shuffle过程由于存在着磁盘IO随机读写问题,一直是分布式计算任务的性能瓶颈,除了降低计算任务的运行效率,还降低硬件资源的利用率。同时,由于Shuffle

  • Firestorm是一个用JAVA写的代码生成工具,可以替你节省很多的代码量,可以说同类软件中功能最强的一个。 你可以在网上下载到最新的3.0试用版本,同时网站会发给你一个试用的license文件。既然是试用, 那么在使用上肯定有一定的限制。主要限制有3个:     1.只能最多生成3张表的DAO;     2.有时间限制;     3.不能自己定制代码生成; 今天在网上打到一个教程(http:/

  • 本次破解的版本是:FireStorm/DAO 3.2.1.   FireStorm/DAO是一款可以通过访问关系数据库,自动生成Java源代码的工具软件。新版本中增加了Hibernate支持JDBC、JDO和EJB CMP   1. 下载附件中的“FireStormDAO破解文件.rar ”,并解压。   2. 使用“fscommon.jar”覆盖 “FireStormDAO-3.2\jars\f

  • FireStorm/DAO是一个java持续层代码生成器,它利用数据库的Schema定义或者直接通过JDBC连接数据库,从而生成基于DAO模式的完整的数据持久化层代码。 2.X版本可以生成基于CMP,JDO的持续层代码以及针对JBoss、BEA WebLogic 和 IBM WebSphere 等j2ee服务器的jsp代码。 最新的3.0版本还可以生成基于hibernate的持续层代码,同时可以生

  • Firestorm的破解[转]                                        Firestorm是一个用JAVA写的代码生成工具,可以替你节省很多的代码量, 可以说同类软件中功能最强的一个。 Firestorm是一个用JAVA写的代码生成工具,可以替你节省很多的代码量, 可以说同类软件中功能最强的一个。 你可以在网上下载到最新的2.3试用版本,同时网站会发给你一个试

 相关资料
  • 问题内容: 您将使用哪种分布式锁定服务? 要求是: 可以从不同的进程/机器看到的互斥(锁定) 锁定…释放语义 超时后自动释放锁-如果锁持有人死亡,它将在X秒后自动释放 Java实现 很高兴拥有:.Net实现 如果免费:死锁检测/缓解 易于部署,请参阅下面的注释。 我对诸如“可以通过数据库完成”或“可以通过JavaSpaces完成”之类的答案不感兴趣-我知道。我对现成的,现成的,经过验证的实现感兴趣

  • 链接 Web API Controllers 动态WebApi层 集成OData 集成Swagger UI ASPNET Core 集成OData

  • 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。 Python的multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者,将任务分布到其他多个进程中,依靠网络通信。由于managers模块封

  • 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。 Python的multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者,将任务分布到其他多个进程中,依靠网络通信。由于managers模块封

  • 你现在拥有了一个远程 Git 版本库,能为所有开发者共享代码提供服务,在一个本地工作流程下,你也已经熟悉了基本 Git 命令。你现在可以学习如何利用 Git 提供的一些分布式工作流程了。 这一章中,你将会学习如何作为贡献者或整合者,在一个分布式协作的环境中使用 Git。 你会学习为一个项目成功地贡献代码,并接触一些最佳实践方式,让你和项目的维护者能轻松地完成这个过程。另外,你也会学到如何管理有很多

  • 5.3 ABP分布式服务 - 集成OData 5.3.1 简介 开放数据协议(Open Data Protocol,缩写OData)是一种描述如何创建和访问Restful服务。你可以在Abp中使用OData,只需要通过Nuget来安装Abp.Web.Api.OData. 5.3.2 安装 1. 使用Nuget安装 首先应该使用Nuget安装Abp.Web.Api.OData到我们的WebApi项目