1面:写题目easy+问基础知识+抓只线程池一直问到了系统资源分配,解答部门做大数据的解决方案,不涉及开发 2面:写题目easy+问简历,全程我在讲,然后没了,反问对我的了解,还说部门主要做解决方案 3面:聊人生,主管很好,推荐一下解决方案部门,感觉主管很年轻,然后给了我意见说做非技术不一定不好,校招生不要带着偏见。 整体:3面都是我单方面开摄像头,整个流程很简单,主管面也挺好的,唯一就是不搞技术
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中,说说Action算子和Transform算子的区别?常见的行动算子有哪些? 4. 这个项目有考虑使用Flink处理吗? 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议,说说他们的作用 9. 如果
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的?为什么选的是实时? 3、大数据专业有没有学过flink相关课程,你是自动化学院的,如果我招你来你会不会只是学一下就算了,毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久,后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink,相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
上来20min先做题,两道sql,一道数学,一道概率 问数据相关,接触过什么数据库,数据体量,mysql优劣势,mapresduce数据倾斜,hive,sql内置函数 自定义函数 复盘:熟悉应用场景 问答风格无八股,侧重于考察真正理解程度 寄。
最开始发来的邮件说是电话面,当天走完了一面二面,中间只间隔了二十多分钟,当晚HR面,第二天看状态结束了。。。。凉凉 这次幸亏是电话面,手机直接录音了,记录的详细一些。 一面 面试时间:20min 自我介绍? 实习工作介绍,实习内容,所用的技术栈。。。 怎么和同事配合的?自己有开发了那些?有什么提高? 你们这个项目,你觉得还有那些地方可以做优化? 离线和实时结合,未来发展的一些看法? Hive的组成
30min拷打项目,其他八股一点没问,算法和sql也没做。 跟我说如果还有后续的话还有一个hr面。 怎么就三十分钟啊?不会KPI了吧,许愿许愿许愿
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别,并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式,说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快,为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
1.去公司线下面试,有笔试题 1.填资料,个人信息,以及有关职业发展问题 1.比如,你的缺点和优点是什么,对你个人产生怎样的影响? 2.如果你和他人有不同的观点,你该如何和他人讨论? 等等,基本就是情商面 笔试题 1.中科软是一家主做保险的外包公司,所以用到的sql主要是oracle, 选择题有几道oracle的题, 2.然后有简答题,也比较简单 面试环节 1.自我介绍 2.对于shell部分的提
处女面,很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等(项目上写的组件
9.21号下午一面的,忘记发牛客了,现在补上 一个年轻并且非常友好的面试官,沟通也比较顺畅,完全按照我的简历一条条过,八股很少,问也只会问涉及项目的八股 - 介绍实习部门的业务,数仓架构 - 以下内容都是我简历具体的内容,可能没啥参考意义,中间穿插的一些细节问题有点忘了: - Cube表性能优化,还有其他优化的方法吗 - 表分桶优化,一般表关联还能怎么优化 - 小文件治理 - SLA治理 - 数据
25、MR工作原理 Input Spliting:输入的数据被拆分成更小数据块(Input Splits:将大文件切割成适合并行处理的小块数据,每个小块数据称为一个分片,一个分片作为MR处理的基本单元)Mapping:mapper节点将分配到数据块执行map操作,产生中间结果(k,v)键值对并写入到本地磁盘Shuffling and Sorting:Mapper节点会根据Key进行排序,并将相同K
主要问经历,问项目的比较多 hdfs的角色有哪些,功能 hdfs的写流程 Java的线程安全是什么 最熟悉的集合是什么?详细描述一下 Arraylist为什么长度可变 python的装饰器用过没?是什么东西? 手撕python编程题,给定一段字符串,统计出每个单词的频率,频率相同的按降序排序 外部表和内部表的区别? 为什么选择多益? 对游戏的流失人数进行分析? 有没有拿到其他公司的OFFER
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置 三个字段完全一样的去重,sql怎么做scala怎么做 挑选同个人最后一个时间戳的记录,sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查,怎么处理 不能只提八股,要完善分情况的答 8.两数之和 9.小数之和 10.反问,写sca