上来20min先做题,两道sql,一道数学,一道概率 问数据相关,接触过什么数据库,数据体量,mysql优劣势,mapresduce数据倾斜,hive,sql内置函数 自定义函数 复盘:熟悉应用场景 问答风格无八股,侧重于考察真正理解程度 寄。
最开始发来的邮件说是电话面,当天走完了一面二面,中间只间隔了二十多分钟,当晚HR面,第二天看状态结束了。。。。凉凉 这次幸亏是电话面,手机直接录音了,记录的详细一些。 一面 面试时间:20min 自我介绍? 实习工作介绍,实习内容,所用的技术栈。。。 怎么和同事配合的?自己有开发了那些?有什么提高? 你们这个项目,你觉得还有那些地方可以做优化? 离线和实时结合,未来发展的一些看法? Hive的组成
Timeline: 9.15 投递 9.25 一面 9.25 一面 53min: 1.常见数据结构 2.TCP三次握手 四次挥手 3.Java基本数据类型 包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型 反射 集合 9.Arraylist和linkedlist异同 1
分享一下百川智能的笔试,对于校招生来说难度很大,我只做出来第二题,其余两题都没有什么思路。 笔试题 1 很久很久以前,有一个 NBA 球探,主要负责在大学联盟中,给球队寻找有潜力的年轻射手。现在他手里有非常多而且格式凌乱的新秀投篮数据,让球探不知如何选择,作为球探的助理,你需要给出一份符合要求的球员名单。要求如下: 在一个学期的大学比赛中,至少连续登场 5 次,并且每场比赛的前 5 次投篮的总分是
1.自我介绍 2.项目 3.svm能解决线性不可分吗 4.训练模型的时候loss不下降怎么解决 5.sql的join 6.a 123 b112 aleftjoinb得到什么 答的稀烂,寄了
1.自我介绍 2.介绍和数据相关的项目 3.深入探讨项目 4.左外连接(口述他提供的场景结果) 5.你的数据表中常用哪些索引 6.查询和索引是有关的吗 7.优化慢查询 explain 看哪些信息?实际操作过吗? 全程就是索引相关的问题,和看到的完全不一样,准备数仓的概念都没用到
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目:深挖,包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗?怎么处理?产生原因? 6.t检验与z检验的区别? 二面 很快约二面后 因为面试撞了往后调(!!最好不要随意换时间) 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法?怎么学习的? 5.实习情况,有无转正.
30min拷打项目,其他八股一点没问,算法和sql也没做。 跟我说如果还有后续的话还有一个hr面。 怎么就三十分钟啊?不会KPI了吧,许愿许愿许愿
# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别,并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式,说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快,为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸