1h 面试官感觉是个大佬级别人物,battle了40min毕设,理解了项目的细节 sql20min,求某天每个城市所有来访者的人均浏览内容点击量 1.顺带问了timestamp定义细节 2.timestamp和date为什么需要同时存在 3.优化,本身机制优化 4.优化,谓词下推 5.优化,聚合函数结合律子查询下推 反问前辈对大数据的理解
下午四点半打电话问我五点半能面试吗,字节节奏好快,直接就面了 面试形式:下载飞书视频面试 时间:2022/7/18 17:30 0、自我介绍 1、飞书上考了一道SQL,要用窗口函数,case when语句等,写完代码讲思路(解出来了,但面试官提醒我要在外层关联另外一张表,我在内层关联可能会丢失一些数据。没注意到这个小细节) 2、实习相关: 讲一个自己负责的AB test实验分析。 AB test涉
1.项目是自己搞的还是哪里找的 2.项目达成了什么效果,解决了什么问题 3.常见的数仓分为哪几层,为什么要分成这几层 4.项目分层如何做到减少重复开发 5.项目宽表的构成以及和其他表的关联度 6.平常学习通过什么途径 7.MapReduce的原理,秒了 8.国家励志奖学金和校级奖学金的区别 9.学校数模比赛的参赛规模 10.为什么想做大数据这一块 11.为什么做数仓 12.反问 为什么好多都是面完
30min 自我介绍 项目介绍 项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用,具体 是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程,写到一半client发生OOM之后该怎么办,datanode宕机怎么办 怎么实现nn切换,而客户端无感的 Spark提交作业的流程 Executor内存管理,分别存储什么 spark shuffle有哪些,讲一下
35min 1面 自我介绍 排序算法知道哪些 稳定的排序算法有哪几种 mr和spark的区别 bitmap解释一下 bitmap用途有哪些 布隆过滤器的原理 一道dp题,口述思路没想出来。。。 三道业务场景题 30min hr面 常规hr面 vivo流程真快,爱了,九月底开奖 #大数据开发##大数据开发工程师#
1.平常是用python还是java?python和java掌握程度? 2.hadoop的组成,每部分有什么用。 3.spark掌握的怎么样,SQL练过哪些题。 4.mapreduce源码看过吗? 5.wordcount的流程。 6.Scala有没有学过? 然后开始挖简历,还问了我一些业务的问题。 说后面会通知二面,也不知道有没有...
Spark 出问题如何排查 Spark 分区和hdfs block的关系 10000个小文件场景,spark是调整内存配置参数还是调整并行度参数 Spark sql 底层原理 Spark sql如何优化 Hbase region的分裂 #美团#
1.自我介绍 2,实习内容 如何实现数据同步 数据同步过程中遇到的问题有哪些 数据同步过后有没有进行验证 你自己设计数据同步系统要注意哪些问题 3,mybatis 与mybatis -plus 的不同之处 4,mysql 怎么优化 对mysql 的看法 5,手撕删除链表的第n个节点 6,jvm了解吗 7,springboot 有看过源码吗 8,动态代理了解吗 感觉不太妙 像是kpi面一样 竟然没有
场景题: 1、有一个sql突然执行很慢有什么原因 2、从一个很大的日志表中10T,随机取出一些数据 3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办 4、mysql中MyIsam相对于innodb更适合那些场景 5、hashmap为什么不直接用红黑树 问一个问题,回答完就会深挖,给我问麻了 #
9.11 一面(30min) 纯八股: 介绍下hadoop(hdfs、mapreduce、yarn) 介绍下hbase 介绍下flink flink checkpoint、connect和union的区别、flink如何处理数据倾斜 介绍下kafka kafka如果有台机器挂掉会发生什么 链表反转 面试官全程表情和语气冷淡,体验不是很好..当然答得感觉也很一般
自我介绍; 问实习,尤为问了字节那段,问为什么呆那么久; 为什么面测试开发而不是后端开发; 随便选一段实习,讲遇到的困难及解决办法; 如果现在有个后端和测试开发的机会选哪个? 今天中午审批过了,收到意向书。 我觉得面测开一定要对测试开发有了解,并且能跟其他岗位横向比较来凸显测开的重要性。 写在最后:很多同学最一开始简历挂了或者面试挂了,我想说很多时候,并不是真的大家的学历背景或者什么能力不行。极大
字节跳动一面面经(是个温柔的小姐姐) 1.自我介绍 2.为什么选择这份工作? 从能力适配和喜欢行业背景两个方面答(STAR法则) 3.职业规划;(这个部分一定要结合自身实际,想清楚,这对以后求职也是很重要的) 4.对工作怎么理解(要尽可能搞清楚 不清楚的部分需在反问环节提问 ) 5.想做偏数据的运营还是偏用户的运营(往自己求职的岗位和自己的真正喜好上靠,这要求分析清楚岗位) 6.喜欢原来的工作吗?
下午三面30min 1、自我介绍 2、考虑投运营岗位是因为之前的实习没有接触过吗? 3、为什么没有考虑直接做市场营销? 4、在这个岗位上的前三个优势? 5、做过比较复杂/大型的数据分析?复杂性在于哪里? 6、通过数据发现问题的case?带来的反思和改变? 7、hr的实习给到的最大收获? 8、对hr的工作内容/工作领域接触的东西不太一样? 9、如何理解这个岗位? 10、之前接触过的人力资源系统? 1
【一面】 简单的自我介绍之后,问了我关于简历上面的实习信息,有关于我做的一个短视频实习生的位置,详细问了一下具体工作流程,以及素材来源是否为自己拍摄。 之后问了关于我作品集中一个网易云音乐迭代界面设计的项目,问了迭代思路,以及某一个界面设计的迭代原因。(后期复盘的时候觉得 这个部分没有完全说好,因为时间有点久,是去年的项目了,有点忘记当时迭代的部分了,所以说的不够具体详细)因为简历中有公众号相关的
【二面】 二面的面试官介绍自己说是主管(应该比较厉害),自我介绍之后,也是问了我关于短视频 方面的,从脚本到分镜最后制作的过程。 然后详细问了一下关于用户方面的,通过哪些具体的项目得到了哪些用户增长的心得。具体怎么做的。我就说了一下关于我公众号运营方面的,因为也是设计类的公众号,通过运营,就会更加关注到用户需求,用户的偏好,主要推送内容包括两个方面,第一:be网和pin网的设计师及作品介绍 第二: