35分钟左右+聊天5分钟 自我介绍,然后大概介绍了一下组里工作 介绍项目,这个小哥好像很重视模块设计问题,一直问我有没有之前进行设计接口的相关工作。 线程池的数量一般怎么设置?IO密集和CPU密集 来了一个新的任务,线程池是怎么工作的? RAII指?在C++11中有什么用了RAII 完美转发介绍一下 去掉std::forward会怎样? 提到了一面的unique_lock,介绍一下unique_l
1. 自我介绍 2. 之前的实习在干啥 3. spark、mapreduce区别 4. 问了一堆Python相关的函数和包,答得挺模糊,还有拷贝估计是想问深拷贝浅拷贝区别我脑子短路没明白问的啥就说忘了(太久没写Python了都在练sql😭😭) 5. 机器学习算法聚类用啥,线性回归和逻辑回归(我也不知道为啥会问这个) 6. 口述sql,求班级各科目排名前三 7. 学校有开大数据开发课吗,自己怎么
1. 互相自我介绍 2. 实习时团队合作出现过哪些问题,如何处理,项目怎么做的 3. 三个词形容自己 4. 成绩还可以,为什么不考研 5. 有没有特别想改变的缺点 6. 父母工作,是独生女吗 7. 你认为在学校和工作的区别是什么 8. 有没有对象,哪里人 9. 对自己影响最大的人 10. 还投了哪些公司,有没有offer,为什么选择淘天 11. 能实习多久,什么时候能到岗 反问:什么时候出结果(清
1. 自我介绍,讲到一半说可以了 2. hadoop工作原理,我直接从作业提交开始讲讲到mr shuffle说可以了 3. 数据倾斜怎么优化sql 4. 星型模型和雪花模型区别 5. 问了离线,实时,数据挖掘熟悉哪些 6. SCD缓慢变化维怎么处理 7. 场景题,问直播带货怎么设计指标,我不懂啊乱答一通基本 8. 数据不一致怎么处理,开始我乱答的,后面引导到了指标体系上 9. 问有没有其他打算实习
已OC,评论区有意向群大家可以加入交流 一面: 挺走流程的,项目+八股+性格 二面: 项目+做题+性格,题目是一个实时指标,一个离线指标,居然要求在web上写flink,然我选择用SQL写离线,题目是统计一个直播间的最大在线人数,感觉挺好的,但是说方向偏业务,问了我的意向,我没表达出兴趣。 三面: 1.自我介绍 2.项目介绍 3.Hudi项目难点 1).FlinkJob怎么配置采集表的个数:个数太
一面30min 自我介绍 选一个最熟悉的结构 说一下原理 特点 怎么使用 hive数据倾斜 内部表外部表 文件存储格式 行转列 列转行 sql题目 项目中有用hive解析json数据吗 实习在做什么 介绍实习项目 实习公司数据仓库怎么分主题的 业务需求是你自己一直在沟通吗 想做数仓还是平台 你觉得对业务了解的怎么样 base想南京还是深圳 二面 介绍实习在干嘛 实习项目怎么做的 项目几个人做 你
面经:主要看学历40%、项目经历30%、籍贯30%,一共17分钟 1.自我介绍 2.负责项目和擅长的编程语言(注意:项目大小由面试官判断) 3.hdfs流程 4.编程语言八股(好笑的是说python面试官都蒙,说Java才能走流程 5.项目追问 遇到问题: 1.非硕不要报,就是刷kpi的,海外本科可以报下,有点恶心; 2.非当地省份户籍的慎重,否则同样kpi,面试官比较看重这一点,对外地很会阴阳怪
一面: 感觉一上来就是主管面,主业务面,考验业务能力和沟通能力 介绍下专业的课程,说说最喜欢哪一门,为什么 直接问实习经历 实习中的项目,扣细节(大部分时间都在问这个) 在同程做了什么业务 广告业务数仓负责哪些东西 广告投放的指标,如曝光、转化等等 广告有哪些类型 聊聊广告投放流程,投前、投中、投后 投中的过程每一轮具体的事情 对比hive和spark 为什么业界都用spark不用mr了 聊聊fl
我是学数学的2024应届,本科阶段有选过大数据的专业选修课,但是编程语言真的不太会,跟科班出身的计院同学没法比,今年数分岗又卷到爆炸,双选会问了几个公司都说数分岗爆满(快手中移信息技术中心),只好一并找找其他方向,上周笔试以为铁挂了就没怎么准备,结果昨天晚上22点发今天的一面邀,一个晚上加上午恶补大数据知识。面试官非常和蔼: 问项目: 大数据技术实验做了什么东西?是为了实现什么?(本科课程里的实验
发面经,攒好运 面试官是个小姐姐,说话非常温柔,但万万没想到面得内容和后端确实关系不大 自我介绍 你用了redis,那能说说他有什么好处吗以及他适用于什么场景? 那redis有什么缺点呢?(我不太清楚,只能说内存要求可能比较高?以及缓存雪崩和击穿) 数据库四大特性以及四大隔离级别 说说持久性 索引以及你用过索引吗 分享一下你在做项目的时候有没有遇到什么比较大的挑战 然后考了一道简单的mysql j
首先是自我介绍:balabala 是否了解过数仓和Spark? 再Linux系统中,找到对应的Java进程并删除。 同样的在 Linux系统下,删除使用某端口的进程。 介绍一下Mysql和LSM,并分析下这两种引擎是基于什么?适用于什么场景? sql编程题:牛客每个人最近的登录日期(二)() 算法题:二叉树的最大路径和 (较难) AC Code: class Solution { public:
15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
1.自我介绍 2.项目介绍 3.MapReduce揪着排序问 Spark揪着OOM问题问 hr和技术一起面,总共20min