当前位置：首页 > 专题 >

《字节跳动大数据开发面经》专题

蚂蚁数据开发一面 40min
不知道的还以为是HR面呢，基本没有专业问题 1、base杭州能否接受，有无考研想法 2、自我介绍（要求说优缺点，特长，经历） 3、希望我证明我在学校是一个比别人优秀的人，问我怎么回答 4、补充回答自己的软实力如协调、沟通、分析能力，对自己如何评价 5、觉得大三的自己和大一有什么区别 6、如何自学 7、素质测评写了哪些题，你对哪些题有优势，哪些有劣势 8、你觉得你和别人沟通时，说服能力怎么样 9、讲
3.21 美团数据开发一面
- 美团：到店事业群--平台技术部（暑期实习一面） - 上来面试官说看你简历挺匹配的，I'm like whaaaaat - 自我介绍 - 为什么去读研了 - 你们团队多少人 - 你们数仓怎么分层 - 你主要负责哪几层 - ODS 数据从哪来，怎么接入数仓 - ODS 表是什么事实表类型？更新方式？ - ODS 到 DWD 做了哪些处理？ - DWD 有哪些表，事实表如何设计的？ - 你提到了数据
星环数据库开发一面
一面前还有笔试两道算法题挺简单本来以为进去要转c++的在自我介绍阶段就没怎么聊java 都在说自己不怎么会c++ 结果最后反问才知道原来是分布式数据库 java是作为计算层的主要实现语言怪不得这面试官这么了解java 1. jvm调优有啥常见参数 2. 常见设计模式 3. docker如何打包镜像 4. mmap系统调用然后基本上都在问项目面试官对电商业务好像还挺了解聊了大概35分
星环数据库开发二面
简单介绍一下项目项目里一些点随便聊了一下没问几个问题算法实现一个HashMap 问了面试官是要拉链法还是可以用最简单的开放寻址回答都可以然后我就整了个开放寻址随便写了个测试样例没出啥问题就过了总时长30min
8.21 快手-数据开发-一面
面试时间：50min 自我介绍实习内容工作部门是数据中台，数据中台是什么？和数据仓库有什么区别？项目用什么采集数据？原理？还了解过其他采集工具吗？对数仓分层的理解？你们是按什么标准分主题的？用的什么数仓模型？ MR的工作流程？ Spark原理？和MR的区别？ RDD依赖关系？ Job、stage、task划分？ Hive介绍，原理？Hsql转换到MR的过程？ Hive的文件存储格式？知
快手数据开发一面 70min
感觉自己和快手的相性不是很好，每次都和面试官不和，感觉应该是无缘快手 1.自我介绍，大数据组件是自学的吗 2.工作内容，定位，成果介绍 3.前期调研也是你做的吗，怎么调研出的指标体系，耗时多久 4.复购率是几日复购率，为什么选择这个天数不选择15天，你这个调研不够深刻，调研他的打法和业务目标不才是第一步要做的事吗 5.有多少个维度和指标，为什么用grouping sets不用cube，介绍coun
京东数据开发三面 30min
1.自我介绍 2.学校大数据有哪些课程，做了哪些实践 3.你觉得大数据是什么，对于社会的帮助 4.大数据和大模型的联系，你在实习或者写sql的时候有没有用过大模型 5.你觉得大模型可以取代你做的这些数据开发工作吗，把大模型甩给业务人员，他们可以用大模型完成数据开发吗 6.针对大模型和大数据，总结一下，从短期来看和长期来看 7.对于spark3.0的新特性了解吗 8.spark的join有几种，和M
华为数据开发一面 55min
1.十分钟自我介绍 2.项目最难点和最有技术的点 3.一句话总结你的问题解决方案 4.一句话总结你的项目的价值 5.手撕：合并k个有序链表 6.问机试题目思路大部分时间在写算法，感觉面试官对大数据相关的技术栈不太感兴趣，问大数据相关问题就像走过场一样，最后也没有反问，emmmm有点难评 #数据人的面试交流地#
8.16shein数据开发一面（已oc
自我介绍为什么这么快找实习离线数仓介绍数据哪里来的有什么数据实时数仓和离线数仓的数据是用的同一份数据吗有什么需要去聚合的指标做这个项目有什么收获,难点 sql题第二大薪水排序秒了 8.19 oc
京东数据开发二面 90min
1.自我介绍 2.jvm的gc全流程，为什么要分这么多区，标记整理等算法对于gc的优缺点，遇到过哪些gc的实际例子，怎么定位这样的问题 3.同一个进程中有三个线程，一个线程发生了内存溢出，另外两个会怎么样，为什么 4.线程共享数据怎么实现的，一致性怎么保证 5.手撕：判断完全二叉树，反转链表 6.sql：窗口函数 7.hdfs架构，读写数据流程，datanode在写数据的时候挂了怎么办 8.小文件
唯品会数据开发一面
场景题：上游订单数据有问题，时间也是错误的，你怎么从 ODS 中找到这张订单表的位置？（不会）第一种思路：全表扫描第二种思路：做一张表，对表id进行hash，表中存储该表id对应的分区 DWS 层能不能没有（答：模型设计中我们一般要做到公共处理逻辑的下沉和单一，所以一般我们会把汇总逻辑放到DWS层，不把它暴露到APP层去实现，所以一般总会设计DWS层的） FlinkCDC MySQL 连接器的
阿里云数据开发面试
#软件开发2024笔面经# 阿里云数据开发岗位面试公司名称:阿里云面试岗位:大数据开发整个是大数据开发，我以为是数仓开发，结果问的全是Spark问题，被搞自闭了。1，自我介绍 2，park中RDD的Task数量由什么决定?3，Spark怎么实现算子中的变量共享?4，Spark共享变量的使用条件? 5，可序列化?连接池实例是在算子内还是在算子外? 我一开始没想好，先回答了连接池的作业:是为了连接
5.9荣耀面试数据开发
一个小姐姐打电话告诉我会议号的。进去之后，先自我介绍，然后让我讲项目。 hdfs的读写机制雪花模型星型模型的区别和适用场景小文件的弊端又在问项目 20分钟结束了，反问环节都没有。。。
联通数科大数据研发（西安）面经
面试10分钟不到，等了快半小时 1 自我介绍 2 项目介绍 3 hdfs读数据流程 4 linux vim命令 5 热门商品topN指标编写 6 为什么选择西安 7 期望薪资
大华Java开发面试
更新啦 10.13 上午突然打电话hr面 1.自我介绍 2.介绍项目 3.做项目有什么收获，是实际开发的项目还是练手的 4.科研项目是自己完成的，还是和别人一起完成的 5.未来的职业规划，工作地点 6.家庭情况 7.期望薪资大概就是这些啦，就是随便聊聊，大概十几分钟的样子，最后面试官说因为最近刚刚开始线上面试，人比较多，所以不好说什么时候会有结果，可能需要等一等 10.10收到一面邮件 10.

首页

55

56

57

58

59

60

61

62

63

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档