一、Azkaban 介绍 1.1 背景 一个完整的大数据分析系统,必然由很多任务单元 (如数据收集、数据清洗、数据存储、数据分析等) 组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题: 如何定时调度某个任务? 如何在某个任务执行完成后再去执行另一个任务? 如何在任务失败时候发出预警? ...... 面对这些问题,工作流调度系统应运而生。Azkaban 就是其
一、简介 ApacheKafka 是一个分布式的流处理平台。它具有以下特点: 支持消息的发布和订阅,类似于 RabbtMQ、ActiveMQ 等消息队列; 支持数据实时处理; 能保证消息的可靠性投递; 支持消息的持久化存储,并通过多副本分布式的存储方案来保证消息的容错; 高吞吐率,单 Broker 可以轻松处理数千个分区以及每秒百万级的消息量。 二、基本概念 2.1 Messages And Ba
一、Hadoop的局限 HBase 是一个构建在 Hadoop 文件系统之上的面向列的数据库管理系统。 要想明白为什么产生 HBase,就需要先了解一下 Hadoop 存在的限制?Hadoop 可以通过 HDFS 来存储结构化、半结构甚至非结构化的数据,它是传统数据库的补充,是海量数据存储的最佳方法,它针对大文件的存储,批量访问和流式访问都做了优化,同时也通过多副本解决了容灾问题。 但是 Hado
一、简介 Spark 于 2009 年诞生于加州大学伯克利分校 AMPLab,2013 年被捐赠给 Apache 软件基金会,2014 年 2 月成为 Apache 的顶级项目。相对于 MapReduce 的批处理计算,Spark 可以带来上百倍的性能提升,因此它成为继 MapReduce 之后,最为广泛使用的分布式计算框架。 二、特点 Apache Spark 具有以下特点: 使用先进的 DAG
从去年开始,我陆续翻译了一些Kivy官方文档中的开发指南的内容,地址在这里。 然后我又觉得有必要找一个更大的平台,以便于能给更多人提供一点便利,所以我又开了一个知乎专栏。 然而新年这一阵,我做了个手术,身体状况不太好,感觉理解能力和表达能力也有所下降(其实本来也不行),所以我就想,不如按照之前ThinkPython的中文翻译那样,直接把翻译稿开源放到Github吧,地址在这里。虽然我并没有想出来这
这一章我们简要地介绍 Lua 语言的基础知识,特别地,我们会有意将讨论放置于 OpenResty 的上下文中。同时,我们并不会回避 LuaJIT 独有的新特性;当然,在遇到这样的独有特性时,我们都会予以说明。我们会关注各个语言结构和标准库函数对性能的潜在影响。在讨论性能相关的问题时,我们只会关心 LuaJIT 实现。 Lua 是什么? 1993 年在巴西里约热内卢天主教大学(Pontifical
OpenResty(也称为 ngx_openresty)是一个全功能的 Web 应用服务器。它打包了标准的 Nginx 核心,很多的常用的第三方模块,以及它们的大多数依赖项。 通过揉和众多设计良好的 Nginx 模块,OpenResty 有效地把 Nginx 服务器转变为一个强大的 Web 应用服务器,基于它开发人员可以使用 Lua 编程语言对 Nginx 核心以及现有的各种 Nginx C 模块
什幺是模板,你可能会问? 模板是一个文件,它可以让我们使用一致的格式来展示不同的信息— —例如,您可以使用模板来帮助你写一封信,虽然每封信可以包含不同的消息和发送给不同的人,但他们使用相同的格式。 Django模板的格式是由HTML(也就是我们在第一章 互联网是如何工作的 中提到的 HTML )语言来描述的。). HTML 是什幺? HTML 是一种简单的代码,由 Web 浏览器解释—如 Chro
本章的部分内容基于 Geek Girls Carrots (https://github.com/ggcarrots/django-carrots) 的教程。 让我们现在就开始写代码 ! Python 提示符 要玩转 Python,首先需要打开您的计算机上的 命令行 。 这一点,你应该已经掌握了——你在 命令行入门这一章已经学习过。 如果你准备好了,那幺请按照以下说明进行操作。 在 Windows
1 GraphX的优势 GraphX是一个新的Spark API,它用于图和分布式图(graph-parallel)的计算。GraphX通过引入弹性分布式属性图(Resilient Distributed Property Graph): 顶点和边均有属性的有向多重图,来扩展Spark RDD。为了支持图计算,GraphX开发了一组基本的功能操作以及一个优化过的Pregel API。另外,Grap
JavaScript 语言的核心特性是由 ECMA-262 标准定义的,而这个标准定义的语言被称为 ECMAScript,你所熟悉的在浏览器或者是在 Node.js 中运行的 JavaScript 其实是 ECMAScript 的一个超集。浏览器及 Node.js 通过额外的对象和方法添加了更多的功能,但是核心部分和 ECMAScript 仍保持一致。 总的来讲 ECMA-262 的持续发展是 J
本文向大家介绍pytorch简介,包括了pytorch简介的使用技巧和注意事项,需要的朋友参考一下 一.Pytorch是什么? Pytorch是torch的python版本,是由Facebook开源的神经网络框架,专门针对 GPU 加速的深度神经网络(DNN)编程。Torch 是一个经典的对多维矩阵数据进行操作的张量(tensor )库,在机器学习和其他数学密集型应用有广泛应用。与Tensor
本文向大家介绍JavaScript简介,包括了JavaScript简介的使用技巧和注意事项,需要的朋友参考一下 本文不是参考手册式文章,仅适用于对JS产生一个大致的认知,如需JS的详细语法与应用请移步w3school JavaScript是什么? JavaScript的诞生 在1995年前后,当时世界上的主流带宽为28.8Kbps,现在世界平均下载带宽为21.9Mbps(数据来源于http://w
JavaScript 有什么特点 JavaScript 使网页增加互动性。JavaScript 使有规律地重复的HTML文段简化,减少下载时间。JavaScript 能及时响应用户的操作,对提交表单做即时的检查,无需浪费时间交由 CGI 验证。JavaScript 的特点是无穷无尽的,只要你有创意。 Java 与 JavaScript 有什么不同 很多人看到 Java 和 JavaScript 都
协议 Activiti是基于Apache V2协议发布的。 下载 http://activiti.org/download.html 源码 发布包里包含大部分的已经打好jar包的源码。 如果想找到并构建完整的源码库,请参考 wiki “构建发布包”。 必要的软件 JDK 6+ Activiti需要运行在JDK 6或以上版本上。 进入 Oracle Java SE 下载页面 点击 "下载 JDK"按