当前位置: 首页 > 软件库 > 大数据 > 其他 >

Apache Gobblin

分布式数据集成框架
授权协议 Apache-2.0
开发语言 Java
所属分类 大数据、 其他
软件类型 开源软件
地区 不详
投 递 者 郗河
操作系统 跨平台
开源组织 Apache
适用人群 未知
 软件概览

Gobblin 是 Hadoop 通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,rest APIs,filers,等等。Gobblin 处理日常规划任务需要所有数据摄取 ETLs,包括作业/任务规划,任务分配,错误处理,状态管理,数据质量检测,数据发布等等。

Gobblin 通过同样的执行框架从不同数据源摄取数据,在同一个地方管理所有不同数据源的元数据。同时结合了其他特性,比如自动伸缩,容错,数据质量保证,可扩展和处理数据模型改革等等。Gobblin 变得更容易使用,是个高效的数据摄取框架。

  • 本文由 「AI前线」原创,原文链接: Apache新成员:LinkedIn分布式数据集成框架Gobblin 作者|Abhishek Tiwari 译者|核子可乐 编辑|Emily AI 前线导读:”LinkedIn 又向 Apache 基金会贡献了一个新的开源项目:Apache Gobblin!” 下文转载翻译自 LinkedIn Engineering 博客: Gobblin 是一套分布式数据集

  • 一、下载编译 解压后查看目录下是否存在gradle/wrapper/gradle-wrapper.jar 文件 使用 ./gradlew build -x findbugsMain -x test -x rat -x checkstyleMain 编译项目(因网络因素可能有几次失败) 编译后文件apache-gobblin-incubating-bin-0.14.0.tar.gz 二、配置编写 启

  • 文件名大小更新时间 incubator-gobblin-master02018-03-06 incubator-gobblin-master\.github02018-03-06 incubator-gobblin-master\.github\PULL_REQUEST_TEMPLATE.md11762018-03-06 incubator-gobblin-master\.gitignore792

 相关资料
  • 5.3 ABP分布式服务 - 集成OData 5.3.1 简介 开放数据协议(Open Data Protocol,缩写OData)是一种描述如何创建和访问Restful服务。你可以在Abp中使用OData,只需要通过Nuget来安装Abp.Web.Api.OData. 5.3.2 安装 1. 使用Nuget安装 首先应该使用Nuget安装Abp.Web.Api.OData到我们的WebApi项目

  • 主要内容:并行化集合,外部数据集RDD(弹性分布式数据集)是Spark的核心抽象。它是一组元素,在集群的节点之间进行分区,以便我们可以对其执行各种并行操作。 有两种方法可以用来创建RDD: 并行化驱动程序中的现有数据 引用外部存储系统中的数据集,例如:共享文件系统,HDFS,HBase或提供Hadoop InputFormat的数据源。 并行化集合 要创建并行化集合,请在驱动程序中的现有集合上调用的方法。复制集合的每个元素以形成

  • 分布式支持 数据访问层支持分布式数据库,包括读写分离,要启用分布式数据库,需要开启数据库配置文件中的deploy参数: return [ // 启用分布式数据库 'deploy' => 1, // 数据库类型 'type' => 'mysql', // 服务器地址 'hostname' => '192.168.1.1,19

  • Map Redisson 分布式的 Map 对象,实现了 java.util.concurrent.ConcurrentMap 和 java.util.Map 接口。 Map 的大小由 Redis 限制为 4 294 967 295。 RMap<String, SomeObject> map = redisson.getMap("anyMap"); SomeObject prevObject =

  • 集群策略插件化 分布式集群策略采用插件的方式实现,通过SPI的形式发布,通过配置文件激活。 zookeeper分布式策略

  • 5.4 ABP分布式服务 - 集成SwaggerUI 5.4.1 简介 从官网得知,开启Swagger,你可以获得一个交互式的文档,生成和发现客户端SDK。 5.4.2 ASP.NET Core 1. 安装 你可以很容易的集成Swagger到基于ASP.NET Core的 ABP项目。 2. 安装Nuget包 安装 Swashbuckle nuget包到你的Web项目。 3. 配置 在 Start

  • 一个成功的技术,现实的优先级必须高于公关,你可以糊弄别人,但糊弄不了自然规律。 ——罗杰斯委员会报告(1986) 在本书的第一部分中,我们讨论了数据系统的各个方面,但仅限于数据存储在单台机器上的情况。现在我们到了第二部分,进入更高的层次,并提出一个问题:如果多台机器参与数据的存储和检索,会发生什么? 你可能会出于各种各样的原因,希望将数据库分布到多台机器上: 可扩展性 如果你的数据量、读取负载、写

  • 5.5 ABP分布式服务 - ASPNET Core 集成OData 5.5.1 简介 开放数据协议(Open Data Protocol,缩写OData)是一种描述如何创建和访问Restful服务。你可以在Abp中使用OData,只需要通过Nuget来安装Abp.AspNetCore.OData. 5.5.2 安装 1. 使用Nuget安装 首先应该使用Nuget安装Abp.AspNetCore