当前位置：首页 > 专题 >

《大数据研发实习》专题

metaApp 数据研发工程师面试
一面难绷，上来就问hashmap 我说先自我介绍吧，面试官说啊对对对介绍完了，开始问项目，问实习，全程听完之后，好，下一个问题哈，瞟一眼出题，然后八股，问了十几分钟我也懒得答太详细了就给我出题，反转链表精彩部分来了，他不知道哪里把题目发给我，也不知道让我在哪里写，我说不用发题目给我，我在聊天框写，写了一会发现格式难调，他就让我口述，口述完之后，他就说你有什么想问的吗，我说我没什么想问的，
杭州银行-数据研发一面
2022.10.9 一面共15分钟 1.自我介绍：大概两分钟 2.问答： a.实习经历-sql是如何优化的答得不好，明明是准备好了的，一是优化整体逻辑，二是语句优化，只答了第一点，一定要清楚面试官问问题的内在目的，不要回答那么表面。 b.实习经历-窗口函数，三个排序(row_number, rank, dense_rank)的区别，答得不好，明明也是知道的，就按准备好的说，不要现场发挥啊……
硕磐数据研发一面（避坑）
动不动就被打断！！！！！面试体验感太差了，好几次都想骂回去了而且招什么数据开发，改成全干工程师好了 11.9 一面 1h zookeeper选举机制 zookeeper分布式锁？手撕二分查找（递归、非递归：两个函数参数问的不一样，还得问我为什么用不一样的参数名，有啥区别.....）对Yarn的理解？Yarn工作机制？（说到一半又被打断，让用程序来实现）手撕Mapreduce程序 Spark的
快手数据研发1面+2面
23.5.30快手一面 1、介绍项目这里都根据个人项目去聊的，问了很久 2.数据怎么来的（ods层数据同步问题）ads层下游怎么做，数据怎么来的报表直接查的ads层吗数据抓过来存在哪 3.hadoop了解吗hdfs有那些组件， 4.聊聊mapreduce进行几次排序一个sql题，按分数进行排序 count(*) count(1) count(col)三者有什么区别数据倾斜 pv值 23.5
快手数据研发一面面经
整体的面试内容会结合项目和实习经验进行提问，面试官人很好，问题也是由浅入深。有监督学习和无监督学习的区别过拟合的处理方法梯度下降法原理损失函数作用实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理还问了一些数仓的知识没答上来数学建模模型的类型(记得好像是这样一道简单算法题反问
字节飞书数据研发一面
自我介绍接下来就是问一堆奇怪的问题夹杂着八股行式存储vs列式存储 MapReduce流程 Spark流程 Yarn流程 Kafka流程维度建模数仓分层你写没写过MR源码？你怎么看流批一体？ sql 求视频累计观看数答的一般感觉凉了 #数据人的面试交流地#
阿里控股数据研发一面
刚面完，面试官挺和蔼的开头自我介绍+项目+追问细节看我还没做笔试，就没问算法相关的，说做完笔试再说一道情景题，如何对网上言论的质量进行分级，尤其是一些专业领域内的言论可能因为我是非科班本科生吧，就没考八股，亏我准备了那么久的hadoop 最后说笔试之后再约一次面试反问
滴滴-数据研发-日常一面
数仓理论，项目，问我从哪了解的数仓，我说项目学习和大数据之路，面试官笑了“谁推给你的这本书” 然后sql题反问实习生干什么～指标搭建，应用层简单建模，可视化 18分钟解决。。。大厂的实习总是这么迷惑，小米按校招流程给我又是sql又是算法一顿鞭策，这个15分钟告诉我结束了，而且这位好像是负责我的业务导师。。
快手数据研发一面凉经
背景：985本硕，无实习，自学大数据相关技术栈，尚硅谷离线+实时数仓，实验室项目。 hdfs读写流程 mapreduce shuffle maptask和reducetask数目如何确定小文件过多对namenode有什么影响 mr优化有哪些点进程和线程 hive sql转换为mr的过程离线数仓项目：项目流程，思考，价值如何保证数据一致性如何衡量两个数仓的优劣两道题： 1-1000的递增
阿里-数据研发-1面2面
CTO（现爱橙科技）- 外部数据暑期实习一面自我介绍实习做了哪些工作，介绍一下在学校主要研究方向是什么，用的什么编程语言 python掌握得怎么样 juc 乐观锁，悲观锁 mysql哪些字段应该建索引一张很大的表，如何优化查询效率如果kafka数据丢失，可能是哪些原因数据仓库分层讲一下开放题：不限制条件，器材，方法，求解西湖的水有多少升？（一脸懵逼）二面自我介绍数仓项目介绍
蚂蚁-数据研发-1面2面
CTO-数据产品与技术部暑期实习一面自我介绍是保研的吗实习做了哪些工作为什么想做数据开发研究生的方向本科学过哪些计算机专业课栈和队列的区别,应用场景二叉树了解吗, 平衡二叉树了解吗了解哪些排序算法, 分别说下原理和时间复杂度快排的最差时间复杂度, 为什么，怎么优化 TCP三次握手, 为什么不是两次 MapReduce运行流程说一下 udf,udaf,udtf区别 spark
字节大数据开发实习一二HR面
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储，为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
网易大数据开发日常实习已oc
部门：网易云 8.23约面，8.25 一面 8.29 二面。8.30 hr面一面： 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询，项目里是怎么做的。 4.四道sql，十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
ACCESS大数据开发实习一面凉经（20min）
自我介绍问对hadoop各个组件的了解解释下mapreduce的过程问有没看过谷歌的GFS论文问项目里数据库咋建模设计的对维度建模的了解对数仓的了解，数仓一般咋分层 GGGG，这之前只关注框架底层了，，没看过数仓的东西#大数据开发面经##实习生[话题]##access#
欢聚大数据开发实习面经（已offer）
首先做了三道SQL题，主要涉及分组聚合、窗口函数。 3.3 一面 28min： 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min： 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran

首页

2

3

4

5

6

7

8

9

10

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10