当前位置：首页 > 专题 >

《大数据开发工程师》专题

阿里云大数据开发一面
上来20min先做题，两道sql，一道数学，一道概率问数据相关，接触过什么数据库，数据体量，mysql优劣势，mapresduce数据倾斜，hive，sql内置函数自定义函数复盘：熟悉应用场景问答风格无八股，侧重于考察真正理解程度寄。
9.15-华橙网络-大数据开发
最开始发来的邮件说是电话面，当天走完了一面二面，中间只间隔了二十多分钟，当晚HR面，第二天看状态结束了。。。。凉凉这次幸亏是电话面，手机直接录音了，记录的详细一些。一面面试时间：20min 自我介绍？实习工作介绍，实习内容，所用的技术栈。。。怎么和同事配合的？自己有开发了那些？有什么提高？你们这个项目，你觉得还有那些地方可以做优化？离线和实时结合，未来发展的一些看法？ Hive的组成
美团大数据开发二面 30min
30min拷打项目，其他八股一点没问，算法和sql也没做。跟我说如果还有后续的话还有一个hr面。怎么就三十分钟啊？不会KPI了吧，许愿许愿许愿
完美氪大数据开发面经
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别，并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式，说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快，为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
中科软-大数据开发-二面
1.去公司线下面试，有笔试题 1.填资料，个人信息，以及有关职业发展问题 1.比如，你的缺点和优点是什么，对你个人产生怎样的影响？ 2.如果你和他人有不同的观点，你该如何和他人讨论？等等，基本就是情商面笔试题 1.中科软是一家主做保险的外包公司，所以用到的sql主要是oracle, 选择题有几道oracle的题， 2.然后有简答题，也比较简单面试环节 1.自我介绍 2.对于shell部分的提
某公司-大数据开发面经
处女面，很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等（项目上写的组件
Shopee 虾皮大数据开发一面
9.21号下午一面的，忘记发牛客了，现在补上一个年轻并且非常友好的面试官，沟通也比较顺畅，完全按照我的简历一条条过，八股很少，问也只会问涉及项目的八股 - 介绍实习部门的业务，数仓架构 - 以下内容都是我简历具体的内容，可能没啥参考意义，中间穿插的一些细节问题有点忘了： - Cube表性能优化，还有其他优化的方法吗 - 表分桶优化，一般表关联还能怎么优化 - 小文件治理 - SLA治理 - 数据
大数据开发面试题【MapReduce篇】
25、MR工作原理 Input Spliting：输入的数据被拆分成更小数据块（Input Splits：将大文件切割成适合并行处理的小块数据，每个小块数据称为一个分片，一个分片作为MR处理的基本单元）Mapping：mapper节点将分配到数据块执行map操作，产生中间结果（k,v）键值对并写入到本地磁盘Shuffling and Sorting：Mapper节点会根据Key进行排序，并将相同K
多益大数据开发提前批
主要问经历，问项目的比较多 hdfs的角色有哪些，功能 hdfs的写流程 Java的线程安全是什么最熟悉的集合是什么？详细描述一下 Arraylist为什么长度可变 python的装饰器用过没？是什么东西？手撕python编程题，给定一段字符串，统计出每个单词的频率，频率相同的按降序排序外部表和内部表的区别？为什么选择多益？对游戏的流失人数进行分析？有没有拿到其他公司的OFFER
9.3 汇量科技大数据开发
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置三个字段完全一样的去重，sql怎么做scala怎么做挑选同个人最后一个时间戳的记录，sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查，怎么处理不能只提八股，要完善分情况的答 8.两数之和 9.小数之和 10.反问，写sca
TCL实业大数据工程师面经
9.11 一面 35min： 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
科大讯飞大数据工程师一面凉经
笔试过了一个月给捞起来了一面 45min 1. 自我介绍 2. 细聊项目，很细（一上来就忘了数据量，尴尬） 3. 特征工程怎么做的 4. iv值的计算方法 5. AUC的计算方法 6. 正反例不平衡对auc有影响吗 7. 知道过拟合吗 8. 逻辑回归怎么解决过拟合问题 9. 写个函数指针 10. pandas库有哪些数据类型 11. 怎么取两个dataframe有差异的部分（忘了具体函数了，讲了
美团Saas软件服务工程师（数据开发方向
🕒 岗位/笔试时间岗位:软件服务工程师（数据开发方向） 6月12日 19:00-20:00 📝 笔试题目选择题：包括数据库，sql的一些相关知识还有一道代码题，记不太清了 🤔 笔试感受当时代码题写了一半，没完成，以为凉了，但是后续通知了一面 🕒 岗位/面试时间 6月18日 11:00（大概四十分钟） 👥 面试题目自我介绍介绍项目大数据开发工具有哪些（详细介绍）数据倾斜解决
metaApp 数据研发工程师面试
一面难绷，上来就问hashmap 我说先自我介绍吧，面试官说啊对对对介绍完了，开始问项目，问实习，全程听完之后，好，下一个问题哈，瞟一眼出题，然后八股，问了十几分钟我也懒得答太详细了就给我出题，反转链表精彩部分来了，他不知道哪里把题目发给我，也不知道让我在哪里写，我说不用发题目给我，我在聊天框写，写了一会发现格式难调，他就让我口述，口述完之后，他就说你有什么想问的吗，我说我没什么想问的，
联通数科（Java开发工程师）-11.9
全程15分钟，5位面试官，小姐姐挺好看的，嘻嘻嘻！ 1、自我介绍 2、问我项目中springcloud中使用的组件 3、问我如何使用nacos和gateway 4、问我如果出现400怎么回事 5、问我另一个项目中redis的定位 6、如何在项目中使用redis的以及相关场景 7、小姐姐问意向地方和目前有那几个offer 完事！ #联通数科##Java开发#

首页

4

5

6

7

8

9

10

11

12

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

awesome-datascience libpcap safe-start-koa2 Workerman smart-servlet Eurasia bLazy.js Vertical Swipe Views

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10