Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的notebook
Zeppelin提供了数据可视化的框架
可实现你所需要的
当前最新版为 0.10.1 版本,官方提供两种安装包,一种是包含所有解析器的(1.6G),另一种是带有 spark 和网络下载解析器的包(568M)
支持的解析器
wget --no-check-certificate -c \
https://dlcdn.apache.org/zeppelin/zeppelin-0.10.1/zeppelin-0.10.1-bin-all.tgz
tar xf zeppelin-0.10.1-bin-all.tgz
zeppelin 部署依赖 java 环境
yum install -y java-1.8.0-openjdk
cd zeppelin-0.10.1-bin-all
cp conf/zeppelin-env.sh.template conf/zeppelin-env.sh
vim conf/zeppelin-env.sh
官方给出的配置文件模板是全注释的,这里标注几个需要注意的参数
# 定义 java 命令所在路径,yum 安装的可以不写,下载的 Oracle java 需要配置一下
export JAVA_HOME=
# zeppelin 访问地址,如果不配置,默认值 127.0.0.1,也可以写 0.0.0.0
export ZEPPELIN_ADDR=
# zeppelin web 页面访问的端口,默认值 8080,如果和本机端口冲突,可以修改这里的参数
export ZEPPELIN_PORT=
# sh 解析器绑定的机器 ip,只能写一个,不写的话,会在本机随机获取一个 ip 地址 [多网卡或者有 docker 就比较尴尬了]
export ZEPPELIN_LOCAL_IP=
# zeppelin 日志目录,默认是当前路径
export ZEPPELIN_LOG_DIR=
# zeppelin pid 记录目录,默认记录在 ${ZEPPELIN_HOME}/run 目录下
export ZEPPELIN_PID_DIR=
# notebook 存储路径
export ZEPPELIN_NOTEBOOK_DIR=
修改 xml 配置文件
cp conf/zeppelin-site.xml.template conf/zeppelin-site.xml
vim conf/zeppelin-site.xml
没特殊需求,可以不配置
<property>
<name>zeppelin.search.index.path</name>
<value>/tmp/zeppelin-index</value>
<description>path for storing search index on disk.</description>
</property>
false
- 表示关闭匿名模式
true
- 表示开启匿名模式
<property>
<name>zeppelin.anonymous.allowed</name>
<value>false</value>
<description>Anonymous user allowed by default</description>
</property>
cp conf/shiro.ini.template conf/shiro.ini
vim conf/shiro.ini
配置
<用户名> = <密码>,<角色>
更多细节可以查看官方文档:Apache Shiro Configuration
admin = admin,admin
bash bin/zeppelin-daemon.sh start
通过浏览器访问配置的 ip 加端口来访问 zeppelin