答的不是很好 #Java# 第一个面试官似乎是个领导跟之前大二面的ruoyi二开那个人脸熟,纯难崩。 自我介绍:自学Spring,微服务等等……,拿省赛奖等等,成绩前3%。 pua我学历大专 大数据提问:谈了下hadoop生态的hdfs,hbase,hive,kafka,MySQL,pg基本原理以及使用,etl概念 (加班潜规则) 然后我说想干Java,但是公司不招Java实习,现阶段项目很复杂,
#在牛客分享我的求职旅程##理想汽车信息集散地##理想汽车##实习##面经#
项目为sgg经典离线数仓 1. 自我介绍 2. 项目介绍(难点、亮点) 3. 根据难点亮点提问 4. 数据域是什么,如何划分数据域,为什么这样划分数据域 5. DIM层维度表的设计原则 6. DWD层事实表设计要点 7. mapreduce shuffle流程 8. maptask和reduce task 与哪些因素有关 9. 数据热点(数据倾斜)在哪些场景下出现,如何解决 10. spark是为
1.自我介绍 2.学校是哪里的,家庭成员,父母做什么的 3.能接受加班,能出差吗? linux服务器之间的文件传输命令 怎么查看日志 什么是中间件(中间件) 4.sql熟悉吗,增删改查的命令有哪些。 5.有啥想问的? 6.未来规划 正如我所写的那样,很简单,但是我还是有些忘了没答上来。 面试难度,因为我有些简单的都没答上来,好像提前结束了。可以试着冲一冲。
20220905荣耀大数据开发面经 写在前面:搬来约在今天下午五点五十的面试,估计是前面的结束的比较快,四点五十给我打个电话让我去面试(当时还在学习室看面经呢/大哭),然后驱车一路彪回去,当时又是军训散场+下课,那叫一g个人多哟,急得不行还是强行镇静/哭 算是最近一场比较愉快的面试,面试官人特别好~有说有笑的,在这里记录下,顺便攒攒人品,求offer!!孩子快卷哭了/大哭 流程: 自我介绍 项目难
被kpi了,还是我太菜了 sparkstreaming和flink有什么区别? sparkstreaming如何确保只被精准消费一次 spark下的执行流程划分? hivesql平常用的多不多,sql不合理如何进行优化 数据库设计的主要的原则 平常做项目面临的最大困难是什么,如何解决的 反问:工作的业务场景是什么? 公司开发中使用的技术栈,回答:hive+es还有个没听清楚
1面:写题目easy+问基础知识+抓只线程池一直问到了系统资源分配,解答部门做大数据的解决方案,不涉及开发 2面:写题目easy+问简历,全程我在讲,然后没了,反问对我的了解,还说部门主要做解决方案 3面:聊人生,主管很好,推荐一下解决方案部门,感觉主管很年轻,然后给了我意见说做非技术不一定不好,校招生不要带着偏见。 整体:3面都是我单方面开摄像头,整个流程很简单,主管面也挺好的,唯一就是不搞技术
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中,说说Action算子和Transform算子的区别?常见的行动算子有哪些? 4. 这个项目有考虑使用Flink处理吗? 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议,说说他们的作用 9. 如果
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的?为什么选的是实时? 3、大数据专业有没有学过flink相关课程,你是自动化学院的,如果我招你来你会不会只是学一下就算了,毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久,后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink,相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
上来20min先做题,两道sql,一道数学,一道概率 问数据相关,接触过什么数据库,数据体量,mysql优劣势,mapresduce数据倾斜,hive,sql内置函数 自定义函数 复盘:熟悉应用场景 问答风格无八股,侧重于考察真正理解程度 寄。
最开始发来的邮件说是电话面,当天走完了一面二面,中间只间隔了二十多分钟,当晚HR面,第二天看状态结束了。。。。凉凉 这次幸亏是电话面,手机直接录音了,记录的详细一些。 一面 面试时间:20min 自我介绍? 实习工作介绍,实习内容,所用的技术栈。。。 怎么和同事配合的?自己有开发了那些?有什么提高? 你们这个项目,你觉得还有那些地方可以做优化? 离线和实时结合,未来发展的一些看法? Hive的组成
30min拷打项目,其他八股一点没问,算法和sql也没做。 跟我说如果还有后续的话还有一个hr面。 怎么就三十分钟啊?不会KPI了吧,许愿许愿许愿
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别,并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式,说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快,为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法