主要内容:Ant历史,Ant成功的关键因素Apache Ant(Another Neat Tool)是由Apache软件件基金会启动的一个开源项目。 Ant是一个Java库和一个软件工具,用于自动化软件构建过程,如编译,运行,测试和组装Java应用程序。 它由Apache软件件基金会设计和开发,最初于2000年7月19日发布。 它是Unix的Make构建工具的更好替代品。 Ant是用Java编写的,需要JVM来构建Java项目。Ant使用
主要内容:Apache Spark历史,Apache Spark的功能,Spark的使用Apache Spark是一个开源集群计算框架。其主要目的是处理实时生成的数据。 Spark建立在Hadoop MapReduce的顶部。它被优化为在内存中运行,而Hadoop的MapReduce等替代方法将数据写入计算机硬盘驱动器或从计算机硬盘驱动器写入数据。因此,Spark比其他替代方案更快地处理数据。 Apache Spark历史 Spark由Matei Zaharia于2009年在加州大学
prototype.js 是什么? 万一你没有使用过大名鼎鼎的prototype.js,那么让我来告诉你,prototype.js是由Sam Stephenson写的一个javascript类库。这个构思奇妙,而且兼容标准的类库,能帮助你轻松建立有高度互动的web2.0 特性的富客户端页面。 如果你最近尝试使用它,你大概了解到文档并不是作者的一个强项。和在我以前使用这个类库的不少开发者一样,一开始
一、Azkaban 介绍 1.1 背景 一个完整的大数据分析系统,必然由很多任务单元 (如数据收集、数据清洗、数据存储、数据分析等) 组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题: 如何定时调度某个任务? 如何在某个任务执行完成后再去执行另一个任务? 如何在任务失败时候发出预警? ...... 面对这些问题,工作流调度系统应运而生。Azkaban 就是其
一、简介 ApacheKafka 是一个分布式的流处理平台。它具有以下特点: 支持消息的发布和订阅,类似于 RabbtMQ、ActiveMQ 等消息队列; 支持数据实时处理; 能保证消息的可靠性投递; 支持消息的持久化存储,并通过多副本分布式的存储方案来保证消息的容错; 高吞吐率,单 Broker 可以轻松处理数千个分区以及每秒百万级的消息量。 二、基本概念 2.1 Messages And Ba
一、Hadoop的局限 HBase 是一个构建在 Hadoop 文件系统之上的面向列的数据库管理系统。 要想明白为什么产生 HBase,就需要先了解一下 Hadoop 存在的限制?Hadoop 可以通过 HDFS 来存储结构化、半结构甚至非结构化的数据,它是传统数据库的补充,是海量数据存储的最佳方法,它针对大文件的存储,批量访问和流式访问都做了优化,同时也通过多副本解决了容灾问题。 但是 Hado
一、简介 Spark 于 2009 年诞生于加州大学伯克利分校 AMPLab,2013 年被捐赠给 Apache 软件基金会,2014 年 2 月成为 Apache 的顶级项目。相对于 MapReduce 的批处理计算,Spark 可以带来上百倍的性能提升,因此它成为继 MapReduce 之后,最为广泛使用的分布式计算框架。 二、特点 Apache Spark 具有以下特点: 使用先进的 DAG
从去年开始,我陆续翻译了一些Kivy官方文档中的开发指南的内容,地址在这里。 然后我又觉得有必要找一个更大的平台,以便于能给更多人提供一点便利,所以我又开了一个知乎专栏。 然而新年这一阵,我做了个手术,身体状况不太好,感觉理解能力和表达能力也有所下降(其实本来也不行),所以我就想,不如按照之前ThinkPython的中文翻译那样,直接把翻译稿开源放到Github吧,地址在这里。虽然我并没有想出来这
这一章我们简要地介绍 Lua 语言的基础知识,特别地,我们会有意将讨论放置于 OpenResty 的上下文中。同时,我们并不会回避 LuaJIT 独有的新特性;当然,在遇到这样的独有特性时,我们都会予以说明。我们会关注各个语言结构和标准库函数对性能的潜在影响。在讨论性能相关的问题时,我们只会关心 LuaJIT 实现。 Lua 是什么? 1993 年在巴西里约热内卢天主教大学(Pontifical
OpenResty(也称为 ngx_openresty)是一个全功能的 Web 应用服务器。它打包了标准的 Nginx 核心,很多的常用的第三方模块,以及它们的大多数依赖项。 通过揉和众多设计良好的 Nginx 模块,OpenResty 有效地把 Nginx 服务器转变为一个强大的 Web 应用服务器,基于它开发人员可以使用 Lua 编程语言对 Nginx 核心以及现有的各种 Nginx C 模块
什幺是模板,你可能会问? 模板是一个文件,它可以让我们使用一致的格式来展示不同的信息— —例如,您可以使用模板来帮助你写一封信,虽然每封信可以包含不同的消息和发送给不同的人,但他们使用相同的格式。 Django模板的格式是由HTML(也就是我们在第一章 互联网是如何工作的 中提到的 HTML )语言来描述的。). HTML 是什幺? HTML 是一种简单的代码,由 Web 浏览器解释—如 Chro
本章的部分内容基于 Geek Girls Carrots (https://github.com/ggcarrots/django-carrots) 的教程。 让我们现在就开始写代码 ! Python 提示符 要玩转 Python,首先需要打开您的计算机上的 命令行 。 这一点,你应该已经掌握了——你在 命令行入门这一章已经学习过。 如果你准备好了,那幺请按照以下说明进行操作。 在 Windows
1 GraphX的优势 GraphX是一个新的Spark API,它用于图和分布式图(graph-parallel)的计算。GraphX通过引入弹性分布式属性图(Resilient Distributed Property Graph): 顶点和边均有属性的有向多重图,来扩展Spark RDD。为了支持图计算,GraphX开发了一组基本的功能操作以及一个优化过的Pregel API。另外,Grap
JavaScript 语言的核心特性是由 ECMA-262 标准定义的,而这个标准定义的语言被称为 ECMAScript,你所熟悉的在浏览器或者是在 Node.js 中运行的 JavaScript 其实是 ECMAScript 的一个超集。浏览器及 Node.js 通过额外的对象和方法添加了更多的功能,但是核心部分和 ECMAScript 仍保持一致。 总的来讲 ECMA-262 的持续发展是 J
本文向大家介绍pytorch简介,包括了pytorch简介的使用技巧和注意事项,需要的朋友参考一下 一.Pytorch是什么? Pytorch是torch的python版本,是由Facebook开源的神经网络框架,专门针对 GPU 加速的深度神经网络(DNN)编程。Torch 是一个经典的对多维矩阵数据进行操作的张量(tensor )库,在机器学习和其他数学密集型应用有广泛应用。与Tensor