当前位置: 首页 > 软件库 > 大数据 > 数据处理 >

YTsaurus

Yandex 开源大数据平台
授权协议 Apache-2.0
开发语言 C/C++
所属分类 大数据、 数据处理
软件类型 开源软件
地区 不详
投 递 者 潘安邦
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

YTsaurus 是一个分布式存储和处理大数据的平台,支持 MapReduce 模型,带有一个分布式文件系统和一个 NoSQL 键值数据库。

平台优势:

  • 多租户生态
    • 一套相互关联的子系统:MapReduce、SQL 查询引擎、job 调度、用于 OLTP 工作负载的键值存储。
    • 支持大量用户,消除多次安装并简化硬件使用
  • 可靠性和稳定性
    • 没有单点故障
    • 服务器之间的自动复制
    • 更新时不损失计算进度
  • 可扩展性
    • 多达 100 万个 CPU 内核和数千个 GPU
    • 不同介质上的 EB 级数据:HDD、SSD、NVME、RAM
    • 数万个节点
    • 自动服务器扩展和缩减
  • 丰富的功能
    • 扩展 MapReduce 模块
    • 分布式 ACID 事务
    • 各种 SDK 和 API
    • 计算资源和存储的安全隔离
    • 用户友好且易于使用的用户界面
  • 由 ClickHouse 提供技术支持的 CHYT
    • 众所周知的 SQL dialect 和熟悉的功能
    • 快速分析查询
    • 通过 JDBC 和 ODBC 与流行的 BI 解决方案集成
  • 由 Apache Spark 提供支持的 SPYT
    • 一组用于编写 ETL 过程的流行工具
    • 启动并支持多个迷你 SPYT 集群
    • 轻松迁移现成的解决方案

 

 相关资料
  • 主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E

  • 2023/10/10 平安科技 大数据开发(37min) (1)自我介绍 (2)对于平安科技的数据开发岗的理解和认为它是做什么的?和自己的契合度是怎么样的? (3)数据库学习到哪些东西,学了多久,什么时候学的,有实践过吗? (4)sql分哪几类,违反主键约束会出现什么问题,索引什么情况下回失效,有自己去安装过吗?(之前没准备数据库的内容,答得很差,后边的面试才好好看了数据库的东西) (5)使用sq

  • 已OC,评论区有意向群大家可以加入交流 一面: 挺走流程的,项目+八股+性格 二面: 项目+做题+性格,题目是一个实时指标,一个离线指标,居然要求在web上写flink,然我选择用SQL写离线,题目是统计一个直播间的最大在线人数,感觉挺好的,但是说方向偏业务,问了我的意向,我没表达出兴趣。 三面: 1.自我介绍 2.项目介绍 3.Hudi项目难点 1).FlinkJob怎么配置采集表的个数:个数太

  • 1.1.2.开源平台 Android是一个开放源码的平台。它的整个架构,从底层的Linux模块、原生库,到高层的开发框架乃至完整的应用程序,都是完全开放的。 而且,Android选择了对商业行为比较友好的许可证(Apache/MIT),从而允许他人在自由的扩展之余,更可以合法地用作其它用途。为保证整个架构的开放,Android甚至重写了一些三方库,并按照新的许可证重新发布。 因此作为开发者,你有权

  • 主要内容:1.大数据生态技术,2.数据存储,3.数据存储的发展,4.数据存储的方式1.大数据生态技术 数据存储处理: 清洗, 关联, 规范化, 组织建模, 通过数据质量的检测, 数据分析然后提供相应的数据服务 离线数仓: 实时数仓: 以Kafka, cancal/Maxwell/FlinkCdc为区分, 离线数仓为Hive, Sqoop 实时数仓:分层: Ods, Dwd, Dim, Dwm, Dws, Ads 离线数仓分层: Ods. Dwd, Dws, Dwt, Ads 实

  • 一面6.14 45min 挖简历项目 机器学习线性模型口诉原理(简历提到机器学习) 手写最大子数组和(ac通过),要求nlogn复杂度。(提示递归,未答出) 无八股 二面6.18 1h 挖简历项目(详细介绍项目、随口问了下springboot与jdk版本 、MongoDB原理,elasticsaerch等) 场景题:抢购平台,有哪些与异常相关的字段,比如用户订单等信息。如何设计异常检测大数据平台

  • 本文向大家介绍开源数据库,包括了开源数据库的使用技巧和注意事项,需要的朋友参考一下 开源数据库是具有开源代码的数据库,即任何人都可以查看,研究甚至修改代码。开源数据库可以是关系(SQL)或非关系(NoSQL)。 为什么要使用开源数据库? 为任何公司创建和维护数据库都非常昂贵。在软件总支出中,很大一部分用于处理数据库。因此,切换到低成本开源数据库是可行的。从长远来看,这可以为公司节省很多钱。 使用中

  • 1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的