当前位置：首页 > 专题 >

《大数据开发实习生》专题

【华为云3面】大数据开发
1面：写题目easy+问基础知识+抓只线程池一直问到了系统资源分配，解答部门做大数据的解决方案，不涉及开发 2面：写题目easy+问简历，全程我在讲，然后没了，反问对我的了解，还说部门主要做解决方案 3面：聊人生，主管很好，推荐一下解决方案部门，感觉主管很年轻，然后给了我意见说做非技术不一定不好，校招生不要带着偏见。整体：3面都是我单方面开摄像头，整个流程很简单，主管面也挺好的，唯一就是不搞技术
大数据开发，顺丰一面，23min
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中，说说Action算子和Transform算子的区别？常见的行动算子有哪些？ 4. 这个项目有考虑使用Flink处理吗？ 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议，说说他们的作用 9. 如果
深圳递四方大数据开发
#互联网公司爆料# 这个公司也是搞物流的吧，估计是做国外的，面试我的第一面是大数据组长，应该是数仓的组长，主要是数仓建模，hive基础，以及spark，以及数据服务以及做的项目的细节，整体面试还可以，终面是技术最高负责人，估计是个副总有40多岁，问了我大数据集群怎么搭建的，服务器是怎么设计的，对于大数据的架构的分布等等吧，感觉是以架构师来问的，薪资好像是15乘14，年终估计拿不满吧，终面还挂了，好
美团大数据开发一面（1h40min）
一面 4.23 当天下午约二面（点错成周四4.27了摔😤 lz面过最长时间的面试，足足1h40min，10:15开始，结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历团子的面试官好像对我的实习经历非常感兴趣，一直在深挖，问得非常非常细，到具体什么指标、数据是多少这样子，这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴，
4.6 美团大数据开发二面
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的？为什么选的是实时? 3、大数据专业有没有学过flink相关课程，你是自动化学院的，如果我招你来你会不会只是学一下就算了，毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久，后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink，相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
阿里云大数据开发一面
上来20min先做题，两道sql，一道数学，一道概率问数据相关，接触过什么数据库，数据体量，mysql优劣势，mapresduce数据倾斜，hive，sql内置函数自定义函数复盘：熟悉应用场景问答风格无八股，侧重于考察真正理解程度寄。
9.15-华橙网络-大数据开发
最开始发来的邮件说是电话面，当天走完了一面二面，中间只间隔了二十多分钟，当晚HR面，第二天看状态结束了。。。。凉凉这次幸亏是电话面，手机直接录音了，记录的详细一些。一面面试时间：20min 自我介绍？实习工作介绍，实习内容，所用的技术栈。。。怎么和同事配合的？自己有开发了那些？有什么提高？你们这个项目，你觉得还有那些地方可以做优化？离线和实时结合，未来发展的一些看法？ Hive的组成
美团大数据开发二面 30min
30min拷打项目，其他八股一点没问，算法和sql也没做。跟我说如果还有后续的话还有一个hr面。怎么就三十分钟啊？不会KPI了吧，许愿许愿许愿
完美氪大数据开发面经
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别，并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式，说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快，为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
中科软-大数据开发-二面
1.去公司线下面试，有笔试题 1.填资料，个人信息，以及有关职业发展问题 1.比如，你的缺点和优点是什么，对你个人产生怎样的影响？ 2.如果你和他人有不同的观点，你该如何和他人讨论？等等，基本就是情商面笔试题 1.中科软是一家主做保险的外包公司，所以用到的sql主要是oracle, 选择题有几道oracle的题， 2.然后有简答题，也比较简单面试环节 1.自我介绍 2.对于shell部分的提
某公司-大数据开发面经
处女面，很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等（项目上写的组件
Shopee 虾皮大数据开发一面
9.21号下午一面的，忘记发牛客了，现在补上一个年轻并且非常友好的面试官，沟通也比较顺畅，完全按照我的简历一条条过，八股很少，问也只会问涉及项目的八股 - 介绍实习部门的业务，数仓架构 - 以下内容都是我简历具体的内容，可能没啥参考意义，中间穿插的一些细节问题有点忘了： - Cube表性能优化，还有其他优化的方法吗 - 表分桶优化，一般表关联还能怎么优化 - 小文件治理 - SLA治理 - 数据
大数据开发面试题【MapReduce篇】
25、MR工作原理 Input Spliting：输入的数据被拆分成更小数据块（Input Splits：将大文件切割成适合并行处理的小块数据，每个小块数据称为一个分片，一个分片作为MR处理的基本单元）Mapping：mapper节点将分配到数据块执行map操作，产生中间结果（k,v）键值对并写入到本地磁盘Shuffling and Sorting：Mapper节点会根据Key进行排序，并将相同K
多益大数据开发提前批
主要问经历，问项目的比较多 hdfs的角色有哪些，功能 hdfs的写流程 Java的线程安全是什么最熟悉的集合是什么？详细描述一下 Arraylist为什么长度可变 python的装饰器用过没？是什么东西？手撕python编程题，给定一段字符串，统计出每个单词的频率，频率相同的按降序排序外部表和内部表的区别？为什么选择多益？对游戏的流失人数进行分析？有没有拿到其他公司的OFFER
9.3 汇量科技大数据开发
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置三个字段完全一样的去重，sql怎么做scala怎么做挑选同个人最后一个时间戳的记录，sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查，怎么处理不能只提八股，要完善分情况的答 8.两数之和 9.小数之和 10.反问，写sca

首页

7

8

9

10

11

12

13

14

15

尾页

最新发布

西门子AIGC应用开发京东，面试聊天北京四达时代校招运维滴滴-产品与用户运营顾问-春招上岸科大讯飞-产品运营实习面经+实习体验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

有没有开源的仓库管理系统，支持小程序或公众号的？go - Go 怎么基于 chan 实现低延迟队列？vue.js - KeepAlive和携带key属性的RouteView同时使用，routerView初始没有匹配路由，手动跳转页面为什么渲染失败？javascript - Vue3 中使用 import() 和模板字符串时为何找不到模块？前端 - uniapp 本地创建数据库并存储?

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

nativescript-pdfbox Dexie.js isort JeeSite4 Mobile Uni-App CWPopup jwwui Firetable RBDirView

文档资料

百度 Web Uploader 中文文档 LeetBook LeetCode 题解开源书 CTF 竞赛权威指南 Pwn 篇 LocaSpace Viewer 帮助文档百度统计分析云使用手册