当前位置：首页 > 专题 >

《数据分析工程师》专题

字节跳动-数据分析/数据科学-日常实习
已经入职一个多月了，才想起来写篇面经，有些面试细节记得不太清楚了，大家仅供参考。总体来说面试体验挺好，问的问题也没有很刁钻（可能是急缺人手），废话不多说直接上干货一面 1. 自我介绍 2. 项目介绍-主要关于我在美团实习做的项目，AB实验，如何确保用户画像相似，观察的核心指标等等 3. t检验和z检验 4. p值的意义 5. sql：求用户留存 6. 逻辑回归背后的核心原理 7. 随即森林和xg
快手-数据研发工程师-一面
8.26 50min左右首先自我介绍，然后问了许多项目的问题然后问了mr的原理和运行流程 hive如何确定reduce的数量 Spark和mr的区别数仓分层数仓维度建模问题什么是维度表和事实表数据库的三范式做题首先是一个sql题，很简单，但是我只刷了大量的java题不会sql的呜呜呜以后一定多刷然后写了一个归并排序面试官人超好，特别有耐心上天保佑让我一面过吧！ #快手面试
浪潮数据开发工程师一面
2022.10.14 10min 感觉自己被kpi了... 三个面试官一个hr + 两个技术（其中一个全程在工作没有看过摄像头） 1.自我介绍 2.你用过hadoop 说一下hadoop各组件干嘛用的 3.实时项目处理了多少数据另一个技术没有问题 HR: 1.工作地点填写的全国怎么考虑的 2.应聘期望薪资 (看offershow给的挺低的,就随便报了个10k) 3.反问哎虽然面试很轻松
ihandy 大数据开发工程师面经
一面：主要还是挖简历自我介绍问项目经历，聊聊过往开发的项目（聊了很久）聊聊MySQL的事务细聊ACID 隔离级别 innodb默认级别 innodb的底层数据存储对比mysql和hive kafka为什么吞吐量大场景题目：100个G的文件，保存用户id和看的bookid，求top10阅读量的书反问
快手数据研发工程师面经
一面：80min 1、自我介绍 2、介绍部门情况 3、介绍下部门的数仓建设情况 4、简述实习里的三个实习做的项目，聊背后的逻辑聊了好久好久 5、聊聊在字节认为部门最厉害的技术是什么 6、聊聊自己的爱好 7、觉得自己有什么有优点 8、团队协作和个人工作区别是什么，各自的优点和缺点 9、一道sql题，有两个数组，展开数据，角标相对应的取出数据 10、sql的job和stage划分，窗口函数是否会sh
百度数据研发工程师面经
一面：无自我介绍环节，直接开问 1、聊实习项目，很细，聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark，为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题，字符串相关的 9、反问 ps.好多过程不记得了二面：三个模块开发大数据算法不想回忆了，直接自闭，一点都不会但是
TCL实业大数据工程师面经
9.11 一面 35min： 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
京东数据开发工程师一面
我记得我没有投递过这个部门，但是约的面试是数据开发部门。面试官很好，是我这两周最好的面试官了。 1.自我介绍 2.实习具体工作 3.觉得实习工作有哪些价值 4.自己认为自己有哪些比别人强的优势 5.http/https区别，端口是否可修改 6.get/post区别 7.mysql为什么使用b+树索引 8.秋招目标反问。面试官直接告诉我京东基本没有C++技术栈，90%是java 所以感觉大概
美团数据研发工程师面经
到店业务有点久远一直忘了写，就记得这么多一面： 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目，聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写，这次写细点儿哈，里面涉及到的一些知识点，具体项目就不聊了数仓模型设计方法数据质量如何判断如何保障下游查出时间对于重要程度不同的任务如何合理分配资源 dwd层建模方法，考虑哪些东西 spark任务调参逻辑和常用参数 c
关键数据结构和相关函数分析
关键数据结构和相关函数分析对于第一个问题的出现，在于实验二中有关内存的数据结构和相关操作都是直接针对实际存在的资源--物理内存空间的管理，没有从一般应用程序对内存的“需求”考虑，即需要有相关的数据结构和操作来体现一般应用程序对虚拟内存的“需求”。一般应用程序的对虚拟内存的“需求”与物理内存空间的“供给”没有直接的对应关系，ucore是通过page fault异常处理来间接完成这二者之间的衔接。
Google云数据流工作线程
奇怪的csig数据工程timeline
一面 09.05 1h多 1.自我介绍 2.实习内容 3.指标建设与数仓的对应关系 4.指标怎么管理的 5.指标报警怎么设置 6.你会怎么管理所有指标体系 7.手撕重复字符串二面 09.07 接近2h 1.自我介绍 2.数理知识：拉格朗日函数、贝叶斯函数的损失函数，对缺失值的影响，卡方与t与z检验的区别 3.大数据相关：mapreduce中map task与reduce task个数、hive
腾讯数据工程面经（1）
从今年暑期实习开始直到秋招一共五次面试，转了四个部门，记录一下实习篇 # IEG一面4.6 自我介绍项目用的是什么计算方案，技术组件有用到云服务吗讲一讲你在项目中遇到的问题项目中计算内存不足调yarn内存，为什么不是spark内存能讲一讲spark的相关概念吗（讲了基本架构，说任务提交流程太紧张没说完）面试官提醒讲RDD的容错机制小表join大表怎么优化的多小可以叫做小表数仓当中
腾讯数据工程面经（2）
秋招篇 # PCG 8.24 一面秋招并没有投腾讯，是直接被捞起来面的自我介绍讲实习内容讲实习当中做的最好的工作面试官总结了一下我刚才讲的（好像觉得做的不够难。。）介绍spark RDD spark程序里面不写action算子，程序会执行吗（肯定的答会。。）数据倾斜有哪几种 mysql数据库索引有哪些数据库事务介绍平常mysql用的多吗有了解过doris、clickhouse这
腾讯IEG 数据工程凉经
一段大厂数开实习感觉面试官比较喜欢有数据中台经验的项目基本没怎么深挖重点问了数据源的接入＆处理 sql题算科目最高分学生 java题返回有序数组中第一次出现指定数字的位置要求复杂度最低 #数据人的面试交流地#

首页

13

14

15

16

17

18

19

20

21

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Spiped OPMS Apache Lucy JQuery4JSF react-native-context-menu-view IndieLib CLTableWithFooterViewController worktop

文档资料

Aurelia 中文教程 Java Web 从入门到精通 Apache Groovy 中文教程 FullCalendar 中文文档 ionic 2.0 文档中文翻译