当前位置：首页 > 专题 >

《大数据开发面经》专题

杭州广立微大数据开发，1面+2面+hr面已offer
23.9.21 广立微共计半小时在阿里做的项目介绍一下充电场站项目。。。用户画像项目详细介绍 java大数据去重的方法 python数据清洗用的什么方法你们阿里的数据中台中表是以什么格式存储的模型的评级标准是什么样的 python直接取一行数据 hive窗口函数，一个省一个市，取人口最多的两个城市 hive的行转列和列转行用什么函数 lead和lag是干什么的 mysql不同的关键字的
字节大数据开发提前批凉经
介绍项目，细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据，hbase能不能（这块问的我没太听明白） mysql两种表引擎对事务有什么理解，举个例子大数据协同算法，保持一致性举几个算法例子有什么要反问的大概就是这些问题可能差一两道忘了，hbase
博时基金数据开发面经
粉丝投稿，两年数据开发经验，面试博时基金的数据开发岗位。开局是亘古不变的自我介绍，和面试官寒暄几句就开始面试了。 1、能简单介绍下你们的组织架构？ 2、你们数据相关的都有什么系统？ 3、你们团队有多少人？ 4、数仓的数据量多大？ 5、除了o层，数仓有多少任务？ 6、数仓的任务要跑多久？ 7、外部数据平台数据的流向？ 8、外部数据平台有哪些数据入到数仓？ 9、数据交换平台的应用场景？ 10、你们大
蚂蚁集团数据开发面经
一面（技术面）1小时自我介绍；介绍一下实习； Flink数据倾斜的原因？ Flink如何保证数据不丢失？介绍一下数据流和数仓架构？解释一下被压？介绍一下CheckPoint机制？团队的工作和你的工作？什么是AB测试？现在的架构是什么？如何保证实验层之间的正交？产出的核心指标是什么？实验的显著性如何计算？实验的合规问题？合规改造问题的设计思路？二面（综合面）45分钟自我
字节数据开发一面凉经
本人24届某211大数据专业，字节也是本人的第一个面试。首先是一个自我介绍，然后问了项目的东西，比如用的是维度建模嘛，用了什么事实表，用了什么业务，事实表有哪几种分类项目中的数据域是怎么划分的。然后问了MapReduce的执行流程，问了一个Map阶段的数据切分函数（没答上来），又问了MapReduce可以不要map嘛。接着问了spark，问了spark和Hadoop有什么区别。 hiv
美团数据开发秋招面经
9.14一面数仓维度建模离线数仓和在线数仓的构建流程 MapReduce过程三道编程题： java无重复字符的最长字串（我实习也撕这个）行列转换（一行变为多行，用mysql，不会。。。）窗口函数序号函数三个（简单）问我有没有收到其他公司的offer 将近1h，居然过了，我以为我挂了 9.21二面这个面试官感觉说话慢悠悠的，然后不怎么问问题，我觉得是KPI来着项目经历实习经历数仓
猫眼娱乐数据开发面经
Timeline： 9.15 投递 9.25 一面 9.25 一面 53min： 1.常见数据结构 2.TCP三次握手四次挥手 3.Java基本数据类型包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型反射集合 9.Arraylist和linkedlist异同 1
浙商银行-数据开发-面经
1，自我介绍。 2，两端实习经历详细讲讲。 3，事务的隔离级别。 4，sql中文乱码，怎么解决，更改编码的命令。 5，sql中日志相关。 6，查询内外连接，查询优化。 7，反问。 8，是否接受调剂？是否了解银行和子公司？
京东物流数据开发面经
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目：深挖，包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗？怎么处理？产生原因？ 6.t检验与z检验的区别？二面很快约二面后因为面试撞了往后调（！！最好不要随意换时间） 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法？怎么学习的？ 5.实习情况，有无转正.
招银网络数据开发面经
# 一面9.8 自我介绍离线项目用到什么架构实习使用的是什么开发语言实习做的是哪一层的开发阿里数仓分层是怎么做的 Mysql的索引是用的什么为什么用B+树索引一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别数据倾斜有哪些是怎么处理的给题说思路 1. 统计主键出现次数 2
同程旅行数据开发面经
Timeline： 9.1 投递 9.14 笔试 9.25 一面 11.1 二面技术+HR面 9.25 一面 23min： 1.项目经历 2.数仓分层 3.数仓执行引擎 4.Sql关键字执行顺序 5.Mysql索引引擎 6.Innodb和myisam区别 7.Flink基本算子 8.Map和flatmap 9.Keyby 10.数据倾斜怎么定位 11.Hive分区表和非分区表 12.增加或删
美团数据开发实习面经
26届Java选手，面了很多大厂后端实习基本都挂了，稀里糊涂接了大数据的实习，总体比较顺利，先去沉淀了 9.27 美团数开一面 30min 介绍一个项目项目中的难点 sql 求每月最大和最少的订单数量二分查找面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引介绍一下Hadoop HDFS有几个个副本，为什么深挖Shuffle原理 sql 面试官自
面经|蔚来-数据开发实习
一面： 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的，应该是偏向平台开发那边，所以没问八股二面（5.13）已OC
美团一面凉经 | 数据开发
笔试 90min 选择题+sql*1+算法*2 简单sql，困难算法一面共 50min 自我介绍 sql 3小问 15min 实习经历项目经历数仓分层的意义从hdfs如何到ODS层介绍维度表和事实表有没有使用zookeeper hadoop节点之间如何进行联系 hive sql脚本是在哪里运行一共有多少张表，都是自己写的吗做数仓的时候遇到了哪些困难，怎么解决的在实习期间的困难和
网易云音乐大数据开发工程师 1面
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别，分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的，有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么？怎么学习？反问 1. 部门做什么业

首页

10

11

12

13

14

15

16

17

18

尾页

最新发布

面经 | 快手数据研发-主站（实习）哈啰测开（上海）日常实习面经百度测开-凉经-记24年最后一面蔚来整车集成测试一面 b站测开一面日常实习面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 大家好，请问是否有常用的PySide Snippets呢？mvc - MVC开发模式下，比如有2个组件的Model共享底层数据，其中一个更新之后，另外一个如何即时得到更新呢？python - 关于Flask接口离谱的Bug、Win上正常、linux上400？javascript - 拖拽dom节点，如何找到最近的节点？前端 - 如何在使用getDisplayMedia或desktopCapturer时获取最小化的窗口？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

helios Ushahidi CBStoreHouseRefreshControl URule spring-schedule-admin（SSA）Everest Precuro Python Director

文档资料

Selenium Webdriver 简易教程 Linux 操作系统下 C 语言编程入门 Android 开发教程 AngularJS 入门教程 Node.js 基础教程