1.自我介绍 2.介绍和数据相关的项目 3.深入探讨项目 4.左外连接(口述他提供的场景结果) 5.你的数据表中常用哪些索引 6.查询和索引是有关的吗 7.优化慢查询 explain 看哪些信息?实际操作过吗? 全程就是索引相关的问题,和看到的完全不一样,准备数仓的概念都没用到
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目:深挖,包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗?怎么处理?产生原因? 6.t检验与z检验的区别? 二面 很快约二面后 因为面试撞了往后调(!!最好不要随意换时间) 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法?怎么学习的? 5.实习情况,有无转正.
30min拷打项目,其他八股一点没问,算法和sql也没做。 跟我说如果还有后续的话还有一个hr面。 怎么就三十分钟啊?不会KPI了吧,许愿许愿许愿
# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别,并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式,说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快,为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的?为什么选的是实时? 3、大数据专业有没有学过flink相关课程,你是自动化学院的,如果我招你来你会不会只是学一下就算了,毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久,后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink,相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
一面 4.6 视频面 本来说好视频面,差不多晚上8点打了个电话说电话面,聊了30分钟基本没怎么问技术问题。 二面 4.10 现下面,聊了10分钟天,面试官说他搞算法的,问了个技术问题clickhouse有什么可以代替,这题没答上来。G
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题 反问 用什么做什么 基本大数据组件都会用,shein数据量大而
两个面试官 一个负责问java一个负责大数据 自我介绍 1.为什么要使用线程池 2.说一下线程池创建时的核心参数 3.如何查看当前线程池最大线程数 4.说一下jvm内存区域 5.说一下有哪些垃圾回收 算法 6.linux通过什么命令查看日志 7.通过什么命令杀死进程 8.说一下spark shuffle 和mr shuffle区别 9.说一下hive有哪几种存储格式 哪种存储格式压缩率更高 10.