当前位置：首页 > 专题 >

《大数据开发面经》专题

汇量科技大数据开发一面（凉经）
9.22 一面 1h 自我感觉挺好的还，9.26挂了 1）自我介绍 2）两个项目介绍 3）Hadoop的元数据存在哪里？ 4）什么是缓慢变化维？拉链表的数据具体是怎么更新？并举例 5）Kafka的零拷贝机制？ 6）对RDD的了解 7）哪些情况下会发生索引失效？手撕代码 1）无重复字符的最长子串双指针+map 2）求出数组中最小的n个数 3）求出每个部门的薪资前三的用
ACCESS大数据开发实习一面凉经（20min）
自我介绍问对hadoop各个组件的了解解释下mapreduce的过程问有没看过谷歌的GFS论文问项目里数据库咋建模设计的对维度建模的了解对数仓的了解，数仓一般咋分层 GGGG，这之前只关注框架底层了，，没看过数仓的东西#大数据开发面经##实习生[话题]##access#
欢聚大数据开发实习面经（已offer）
首先做了三道SQL题，主要涉及分组聚合、窗口函数。 3.3 一面 28min： 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min： 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
03/22 美团大数据开发一面凉经
总共33min，凉透了，可能因为我是第一次面试，没经验，被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢？ 7、协同过滤的常用算法有了解吗？ 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql：统计最近下单的用户是在去年12月份的用户数量 11、
深智城-大数据开发工程师-面经
#国企#一面约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的？ - 数据分片是怎么做的？ - 如何保证节点间数据的一致性？ - 如果有节点挂掉会怎么办？ 1. 地理数据如何索引？ 2. 喜欢用什么开发语言？二面约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗？解释一下分布式事务是做什么的 - 如何保证分布式事务的原
美团优选大数据开发timeline和面经
秋招第一个意向感恩团子！二面和hr面感觉自己发挥得并不是很好，一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向一面 60min: jvm了解哪些垃圾回收了解哪些主线程和另外十个线程，怎样使主线程最后执行完毕（join、await） flink checkpoint kafka有序和不丢如何保证算法题链表
众安保险大数据开发一面凉经
1、自我介绍 2、实习经历介绍 3、实习项目难点介绍 4、你比别人的优势是什么 5、hive相比与传统数据库的优势是什么 6、hive集成了mapreduce，如何将hive语句转换为mapreduce 7、hive on spark和spark on hive的区别 8、spark调优你做过哪些？ 9、数据倾斜调参和不调参的方法你知道有哪些 10、数仓的存储介质有哪些 11、数仓建模的话你会如何
京东-大数据开发凉经
110分钟，全程无项目和算法，全是八股深挖，被拷打惨了 1、谈一谈你对java面向对象的理解，什么时候用接口，什么时候用抽象类，从本质上讲一下区别？ 2、都有了解过哪些设计模式？创建对象的设计模式有哪些？工厂模式和建造者模式分别在什么场景下使用，举一个具体的例子 3、java的hashmap在1.8之前链表中采用的头插法的方式，为什么1.8之后改成尾插法？头插法的方式可能会极限情况连成一个环，举一
58同城大数据开发工程师面经（一面）
开局自我介绍，然后问我两段实习经历，分别做了什么？照实回答，问我有没有接触过BI工具，我说是内部封装好的；日常工作，处理的数仓规模，人员规模，主要负责内容，处理的数据的大小。之后让我写一道题目，求连续三天消费金额大于100的用户ID，不想用排序函数再写了所以用了LAG函数来写，面试官给了我一个不置可否的表情（坏了可能写错了......）然后说我明白你的思路了，我解释说因为不想用排序函数来写所以尝试
天翼云大数据开发工程师二面面经
投递岗位：大数据开发工程师（广州）时间线：9.5投递，9.13技术一面，9.17技术+hr二面，9.19测评，10.7 意向 JD如下，岗位偏数据平台建设，非数仓面经技术自我介绍项目中最大的收获是什么，数据治理讲一下 hive分区表怎么创建（具体到关键字），分区的好处，怎么设计分区 hive分桶表怎么创建（具体到关键字），分桶的好处 hive外部表建表语句（具体到关键字） hive s
联通数科大数据开发
一面（11/3）自我介绍拷打项目然后问了一个Flink反压的问题二面（11/10）自我介绍拷打项目问了前端展示大量数据，如何考虑？（可能大佬就是前端的）问了用了哪些数据库？问了Kafka 和 Flume 的应用场景？（可能时间比较紧张，所以问的比较急，二面没有遇到反问环节了）
58同城大数据开发
#互联网公司爆料# 58笔试通过但面试没有过，面试我的人首先问的还是数仓建模，我当时这方面还是刚学，不是很懂，问的建模细节还是不会，直接挂了，但整体还是可以的，薪资估计16起步吧，双非本科估计就是最低的白菜价
孤波大数据开发 1h
Java的设计模式 100g的数据在小内存里如何排序（spark） Spark为什么比mr快 Hbase的适用场景 Hbase为什么快和Clickhouse一样的数据库 Clickhouse底层数据结构 Clickhouse为什么快（很细）两个sql（难度较大） Hadoop的高可用触发后，会发生什么（面试官说不要背八股，详细说里面的流程） Flink水位线激活函数有哪些（sigmoid，r
天翼云大数据开发
timelime 9.5投递 9.13一面 9.17二面 9.19测评 10.7 21:00 收到意向邮件。 ---------------------------------------------- 防定位，面经先匿了。 #晒一晒我的offer##天翼云##大数据##秋招##国企#
某小厂大数据开发
30min 自我介绍项目：介绍一下项目几层。每层干了什么。去掉一层可以吗（又来） dwd和dws和ads都可以去掉 balabala 数据量千万级别数据怎么同步？业务datex+maxwell，行为直接flume拉。多久同步一次？一天一次。 Ads层怎么接到可视化看板？手拉（这边傻逼了，忘记说接clickhouse同步然后接到可视化软件上了） Zk在kafka里的作用？保留of

首页

2

3

4

5

6

7

8

9

10

尾页

最新发布

面经 | 快手数据研发-主站（实习）哈啰测开（上海）日常实习面经百度测开-凉经-记24年最后一面蔚来整车集成测试一面 b站测开一面日常实习面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 大家好，请问是否有常用的PySide Snippets呢？mvc - MVC开发模式下，比如有2个组件的Model共享底层数据，其中一个更新之后，另外一个如何即时得到更新呢？python - 关于Flask接口离谱的Bug、Win上正常、linux上400？javascript - 拖拽dom节点，如何找到最近的节点？前端 - 如何在使用getDisplayMedia或desktopCapturer时获取最小化的窗口？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

hulu ts-monorepo KGPG TimberX libcstl DeepLearning.scala Spring Data JDBC Extensions DynamoDB

文档资料

Understanding ECMAScript 6 中文版 Sass Guidelines 编写规范 Markdown 入门参考 Docker 简明教程 Pandas 官方教程