大数据入门指南
Hadoop | Hive | Spark | Storm | Flink | HBase | Kafka | Zookeeper | Flume | Sqoop | Azkaban | Scala |
Spark Core :
Spark SQL :
Spark Streaming :
1. cloudera官网 http://www.cloudera.com/ 2. cloudera文档 http://www.cloudera.com/documentation.html 3. 文档分为三个部分 3.1 cloudera enterprise: cdh, cloudera manger, search, impala, spark。 3.2 cloudera direc
-- 安装需要的软件包: # yum -y install rlwrap unzip -- 解压软件: # unzip OGG_BigData_Linux_x64_12.3.2.1.1.zip Archive: OGG_BigData_Linux_x64_12.3.2.1.1.zip inflating: OGGBD-12.3.2.1-README.txt inflating: O
数据缺失与共线性 在ZestFinsnce , Ondeck以及海量风控建模中一般使用来自申请书报告,政府数据,征信报告,网站和APP数据采集。企业合作,互联网公开数据资源,体现出维度特别高,来源特别广,数据结构特别复杂的特征。多种原始数据的聚合(data——fusion)的方法。在参考使用中出现大量的数据确实和数据间相关性太强,这样出现过拟合问题。 一旦关键变量缺失,在逻辑回归中这类线性模型便会
一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
MathJax允许你在你的网页中包含公式,无论是使用LaTeX、MathML或者AsciiMath符号,这些公式都会被javascript处理为HTML、SVG或者MathML符号。 这里有三种方法获取MathJax:最简单的方法就是使用分布式网络服务中的MathJax的副本,它位于 cdn.mathjax.org ,但是你也可以下载并安装一个MathJax的副本到你的服务器,或者使用在你本地硬盘
让我们开始 Rust 之旅!在本章中,我们会讨论:
第一个 Tendermint 应用 作为一个通用的区块链引擎,Tendermint 与您想要运行的应用程序无关。因此,要运行一个完整的区块链来做一些有用的事情,您必须启动两个程序:一个是 Tenderint Core,另一个是您的应用程序,它可以用任何编程语言编写。回想一下介绍 ABCI, Tendermint Core 处理所有的 p2p 和协商一致的东西,当它们需要验证时,或者当它们准备提交到
入门指南 我们首先介绍如何配置开发环境,编译流程,以及代码规范。 开发环境 在Ubuntu 14.04下安装最新版的Rust: $ curl -sSf https://static.rust-lang.org/rustup.sh | sh -s -- --channel=nightly 为Atom编辑器安装Rust语法高亮支持: $ apm install language-rust 如果需要一个
使用当前稳定版本的 PHP (7.1) 如果你刚开始学习 PHP,请使用最新的稳定版本 PHP 7.1。相对于老版本的 5.x 来说,PHP 7.1 非常新,并且增加了很多令人惊喜的 新特性 。由于底层引擎大部分被重写了,现在新版本的 PHP 比老版本运行得更快。 通常你会在将来的工作中遇到还在使用 PHP 5.x 的情况,5.x 系列的最新版本是 5.6。虽然这个版本也还不坏,但是你应当尽量升级