bdp-platform

授权协议 GPL-3.0 License
开发语言 Python
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 不详
投 递 者 楚意
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

总项目 https://github.com/wlhbdp/bdp-ecology

0、大数据生态解决方案数据平台

数据平台:
	bdp-platform:基于大数据、数据平台、微服务、机器学习、商城、自动化运维、DevOps、容器部署平台、数据平台采集、数据平台存储、数据平台计算、数据平台开发、数据平台应用搭建的大数据解决方案。
数据来源:
	商城:使用SpringBoot,Java,Vue,React,Android开发多端商城,包括网站、App、微信小程序;
	日志:使用Java开发服务端日志、客户端日志收集系统,使用DataX实现数据的导入导出系统;
	爬虫:爬虫平台支持可配置的爬取公网数据的任务开发;
数据存储:
	分布式文件系统使用HDFS,分布式数据库使用HBase,Mongodb、Elasticsearch,内存数据库使用redis;
数据计算:
	使用Hive、MR、HiveSQL、ETL开发离线计算系统;
	使用storm、flink、spark streaming开发实时计算系统;
	使用kylin, spark开发多维度分析系统;
数据开发:
	任务管理系统:负责调度、分配、提交任务到数据平台;
	任务运维系统:查看Task运行情况;
数据应用:
	使用python,ml,spark mllib实现个性化推荐系统;
	使用python,scrapy,django,elasticsearch实现搜索引擎;
	使用scala,flink开发反作弊系统;
	使用FineReport,scala,playframework开发报表分析系统;
DevOps:
	使用ELK技术栈搭建日志搜索平台;
	使用skywalking,Phoenix实现监控平台;
	使用scala、playframework,docker,k8s,shell实现云容器平台,包含服务管理(查看docker容器配置,添加容器实例,授权记录,操作记录,历史版本回溯,k8s启停服务,操作记录,对比yaml配置,更新服务)、任务管理、配置管理、镜像构建(包括环境变量和参数配置)、应用日志
	使用自动化运维平台CoDo开发system-devops;
    	使用Kong开发统一网关入口系统system-api-gateway;
    	使用vue、scala、playframework、docker、k8s、Prometheus、grafana开发监控告警平台system-alarm-platform;
    	使用Apollo开发system-config配置中心;

2、数据平台展示

2.1 商城图片展示:

商城App:https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/samples/mall-shopping-03.png

商城小程序:https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/samples/shopping-app-04.png

商城移动端:https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/samples/shopping-app-05.png

商城PC端: https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/samples/shopping-app-06.png

商城后台管理:https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/samples/shopping-app-07.png

2.2 compute-mr

1、mr-website-analyse: 
    1.1 主要做的事情:
	hadoop HA集群搭建部署;
	mapreduce基础掌握;
	使用 oozie进行任务调度;
	使用 hive保存数据到hdfs,以及从hdfs导出到 mysql;
	使用hbase结合mapreduce处理业务,如用户行为分析;
	使用flume,nginx模拟收集日志,从java sdk端和js 网站端收集数据等; 
    1.2 主要模块
	用户基本信息分析
	浏览器分析
	地域分析
	浏览深度分析
	搜索引擎分析
	事件分析
	订单分析

2、mr-website-sdk
    2.1 java服务端sdk采集
    2.2 JS前端页面的数据模拟采集  

3、mr-website-view
    3.1 数据可视化显示
    3.2 主要使用highcharts,html,css, js显示mr-website-analyse数据处理的统计数据,存在mysql

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2791587557292_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2801587557292_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2811587557292_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2821587557292_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2831587557293_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2841587557293_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/mr/2851587557293_.pic.jpg

2.3 compute-realtime:

1、compute-realtime-spark: 
    1.1 主要做的事情:
	基于Javee平台展示的Spark实时数据分析平台
	hadoop HA集群搭建部署;
	基于zookeeper的kafka HA集群搭建部署;
	HA: 本地搭建时共5个节点,2个namenode,3个datanode;
	spark core, spark sql, spark streaming基础掌握;
	kafka实时模拟生成数据并使用spark streaming实时处理来自kafka的数据;
	实时处理分析结果保存到mysql, 由highcharts动态刷新;
	highcharts实时展示统计分析结果,以及spark sql算子执行结果;
    1.2 主要模块
	广告点击流量分析
	广告点击趋势分析
	各省份top3热门广告分析
	各区域top3热门商品统计
	页面单跳转化率
	用户访问session分析
	Top10热门品类分析
	Top10用户session分析

2、compute-realtime-view
    2.1 数据可视化显示,定时模拟kafka消息队列的数据
    2.2 主要使用highcharts,html,css, js显示compute-realtime-spark数据处理的统计数据,存在mysql

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/spark/2871587557435_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/spark/2881587557459_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/spark/2891587557479_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/spark/2901587557498_.pic.jpg

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/spark/2911587557535_.pic.jpg

3、数据来源

商城前台:
	mall-shopping-app: 商城App
	mall-shopping-app-service: 商城App服务
	mall-shopping-wc: 商城小程序
	mall-shopping-mobile: 商城前台
	mall-shopping-pc: 商城pc端
	mall-shopping-pc-service: 商城pc端服务
	mall-shopping-service: 商城前台服务(小程序和前台接入此接口)
商城后台:
	mall-admin-web: 商城后台
	mall-admin-service: 商城后台服务

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/microservice.png
https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-api-gateway01.png
https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-api-gateway02.png
https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-apm.png

4、数据收集

log-collect-server: 
	服务端日志收集系统
log-collect-client: 
	支持各app集成的客户端SDK,负责收集app客户端数据;
data-import-export: 
	基于DataX实现数据集成(导入导出)
data-spider:
	爬虫平台支持可配置的爬取公网数据的任务开发;
https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/Prometheus.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/apollo.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/log-collect.png

5、数据存储

分布式文件系统:hdfs
分布式数据库:hbase、mongodb、elasticsearch
分布式内存存储系统:redis

6、数据计算

compute-mr(离线计算): Hive、MR
compute-realtime(流计算): storm、flink
multi-dimension-analysis(多维度分析): kylin, spark

7、数据开发

task-schedular: 任务调度
task-ops: 任务运维

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-deploy.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-deploy02.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-devops.png

8、数据产品

data-face: 数据可视化
data-insight: 用户画像分析

9、数据应用

system-recommender: 推荐
system-ad: 广告
system-search: 搜索
system-anti-cheating: 反作弊
system-report-analysis: 报表分析
system-elk: ELK日志系统,实现日志搜索平台 
https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-elk.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-elk(2).png
system-apm: skywalking监控平台
system-deploy: k8s,scala,playframework,docker打包平台。
job-schedule: 任务提交平台

10、启动配置教程

10.1 启动前,打包dubbo-servie项目,进入dubbo-service目录,执行mvn clean package -DskipTests=TRUE打包,然后执行mvn install.

10.2 启动dubbo-service项目,配置tomcat端口为8091

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/61.png

10.3 启动商城项目的多个子系统

后台:访问http://localhost:8090

10.3.1、前端:启动mall-admin-web项目,进入项目目录,执行npm install,然后执行npm run dev;

10.3.2、后端:启动mall-admin-service/mall-admin-search项目,配置tomcat端口为8092,接着启动mall-manage-service项目,tomcat端口配置为8093;

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/62.png

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/63.png

前台:小程序手机预览,移动端访问:http://localhost:6255

10.3.3、小程序和移动端

10.3.3.1、前端:商城小程序,启动mall-shopping-wc项目,安装微信开发者工具,配置开发者key和secret,使用微信开发者工具导入即可,然后点击编译,可以手机预览使用。

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/66.png

10.3.3.2、前端:商城移动端,启动mall-shopping-mobile,进入项目目录,执行npm install和npm run dev;

10.3.3.3、后端:小程序和移动端用的是同一个后台服务,启动mall-shopping-service项目,进入项目目录,配置tomcat端口8094

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/64.png

10.3.4、商城PC端 访问http://localhost:8099

10.3.4.1、前端:启动mall-shopping-pc项目,进入项目目录,执行npm install和npm run dev;

10.3.4.2、后端:启动mall-shopping-pc-service项目,配置tomcat端口为8095;

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/65.png

11 开发计划

https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/%E5%BC%80%E5%8F%91%E8%AE%A1%E5%88%92v1.0.png

12 架构1.0

 #1、数据平台架构
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/1571898118926.png

 #2、电商
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/%E7%94%B5%E5%95%86.png

 #3、微服务
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/microservice.png
 
 #4、容器化部署system-deploy
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-deploy.png
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-deploy02.png
 
 #5、自动化运维平台system-devops
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-devops.png
 
 #6、使用Kong作为调用中心网关入口system-api-gateway
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-api-gateway01.png
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-api-gateway02.png
 
 #7、日志中心system-elk
 
 https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-elk.png
 
 #8、告警平台system-alarm-platform
 
     8.1 监控系统
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/Prometheus.png
 
     8.2 数据采集
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/log-collect.png
 
     8.3 数据展示
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-elk%20%282%29.png
 
 #9、监控中心system-apm
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/system-apm.png
 
 #10、使用Apollo作为配置中心system-config
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/apollo.png
 
 #11、数据平台开发规划
 
     https://my-macro-oss.oss-cn-shenzhen.aliyuncs.com/mall/images/design/%E5%BC%80%E5%8F%91%E8%AE%A1%E5%88%92v1.0.png
 相关资料
  • base 武汉(java) 一面 (40min) 大学学习过程、实习时间等 介绍项目 项目中遇到的问题和解决方式(面试官提前看了项目的源码,跟我拉扯了很久.......) 从零搭建一个项目的流程 Redis 的数据类型和使用场景 Mysql 索引、事务、存储引擎 Linux 常用命令 怎么查看 tomcat 进程 TCP / IP 模型哪几层、对应层的协议有哪些 用过哪些注册中心、消息队列、网关

  • 问题内容: 运行上面的代码后,未执行,我的意思是文本字段未将其文本设置为“ START”, 为什么? 如何解决呢? 问题答案: 请记住,该按钮在JavaFX线程上被调用,因此您实际上将UI线程暂停了5秒钟。在这五秒钟的末尾取消冻结UI线程时,将同时应用这两个更改,因此最终只能看到第二个。 您可以通过在新线程中运行以上所有代码来解决此问题:

  • 问题内容: 我正在尝试使用Smack库在Android上进行Facebook聊天。我已经从Facebook上阅读了Chat API ,但是我不明白如何使用此库向Facebook进行身份验证。 谁能指出我如何做到这一点? 更新 :根据no.good.at.coding的答案,我将此代码改编为Asmack库。一切正常,除了我收到登录响应:未经授权。这是我使用的代码: 这就是与服务器之间通过已发送和已接

  • 问题内容: 我有一个表示形式类,它存储一个XYChart.Series对象,并通过观察模型对其进行更新。通过使用Platform.runLater(…)完成系列更新 我要对此进行单元测试,确保runLater中的命令正确执行。如何告诉单元测试等待runLater命令完成?现在我要做的就是在测试线程上使用Thread.Sleep(…),给FXApplicationThread时间来完成,但这听起来很

  • 问题内容: 我只是在Windows 8中安装cordova 3.3,当我使用命令“ cordova platform add android”时,我收到此错误消息 这是我的JAVA_HOME C:\ Program Files (x86)\ Java \ jdk1.7.0_25 \ bin的系统变量,对于路径,我添加了一个C:\ Program Files (x86)\ Java \ jdk1.7

  • 问题内容: 此代码示例属于Stopwatch类的一部分,该类属于一个较大的项目的一部分,该更大的项目的目的是成为模仿Android Clock的桌面gui应用。我具有秒,分钟,小时等标签,这些标签应该从计时器任务内部的无限while循环中更新,而该计时器任务在布尔状态为true时运行。while循环应该实时更新GUI标签。我让计时器任务每毫秒执行一次。为什么我的GUI在程序更新第一个Label后立