40min 面试官问的很细,来自数据平台,技术感觉很强很全面。 warm-up 自我介绍 有其他意向吗?能来北京吗 挑一个做得好的项目介绍下全流程 难点在哪,讲一下 ElasticSearch ES有用到集群吗?有设置分片吗?有设置副本吗?副本数是多少? 你是怎么建立索引的?为什么这么建立索引? Hive 离线处理有用过Spark 吗?没有,主要用的是Hive 说一下Hive 构造UDF 的过程?
1.自我介绍 2.一周能实习多少天 3.是否考研,为什么不考 4.linux基本操作 5.手撕SQL,没答上来。请求提示,有个函数没听说过。 6.在学习的时候哪里用到了SQL 7.MySQLDDL是否了解(太紧张突然想不起来DDL是啥了,就说了没有。。),结束那一刻我才反应过来,麻中麻。。 8.反问环节 hr挺和蔼的。但是我实在又紧张又菜。。估计是凉了。 过两天还有百度的面试,更是重量级,看到自己
两次面试邮件里都写的是初试,不清楚第二次面试属于二面,还是一面挂了被共享到别的部门了。 先说体验,两次的面试官都彬彬有礼,相对年长,可能是主管级别。问题由浅入深,从场景入手,通过思路的引导,了解你的知识掌握水平。 之前理解的数据开发可能更偏向数仓开发,但很多公司数据开发岗位的工作内容是大数据组件的性能优化、数据引擎开发、数据服务开发等等,所以对java开发中多线程编程、jvm等是有较高要求的,我个
公司:好未来 岗位:数据开发工程师 形式:视频面试 视频面试平台:牛客 时长:30分钟 流程: 1、自我介绍。 2、说一个最拿手的项目经历。 3、了解阿里数仓OneData体系吗? 4、了解大数据相关的应用框架吗? 5、对SQL优化有了解吗? 6、说一下Hive的工作原理。 7、Hive有索引吗? 8、Hive的内部表和
面试问题: 1. 从8个外观相同的球里找出质量不相等的球。器材:一个没有砝码的天平;要求:几次称重后肯定能找出来。 2. 在离散的二维平面图形中,面域由三角形组成,用数组存储每个三角形的顶点,如何找出处于边界上的边; 3. 智能指针的作用和原理;
项目为sgg经典离线数仓 1. 自我介绍 2. 项目介绍(难点、亮点) 3. 根据难点亮点提问 4. 数据域是什么,如何划分数据域,为什么这样划分数据域 5. DIM层维度表的设计原则 6. DWD层事实表设计要点 7. mapreduce shuffle流程 8. maptask和reduce task 与哪些因素有关 9. 数据热点(数据倾斜)在哪些场景下出现,如何解决 10. spark是为
20220905荣耀大数据开发面经 写在前面:搬来约在今天下午五点五十的面试,估计是前面的结束的比较快,四点五十给我打个电话让我去面试(当时还在学习室看面经呢/大哭),然后驱车一路彪回去,当时又是军训散场+下课,那叫一g个人多哟,急得不行还是强行镇静/哭 算是最近一场比较愉快的面试,面试官人特别好~有说有笑的,在这里记录下,顺便攒攒人品,求offer!!孩子快卷哭了/大哭 流程: 自我介绍 项目难
被kpi了,还是我太菜了 sparkstreaming和flink有什么区别? sparkstreaming如何确保只被精准消费一次 spark下的执行流程划分? hivesql平常用的多不多,sql不合理如何进行优化 数据库设计的主要的原则 平常做项目面临的最大困难是什么,如何解决的 反问:工作的业务场景是什么? 公司开发中使用的技术栈,回答:hive+es还有个没听清楚
1面:写题目easy+问基础知识+抓只线程池一直问到了系统资源分配,解答部门做大数据的解决方案,不涉及开发 2面:写题目easy+问简历,全程我在讲,然后没了,反问对我的了解,还说部门主要做解决方案 3面:聊人生,主管很好,推荐一下解决方案部门,感觉主管很年轻,然后给了我意见说做非技术不一定不好,校招生不要带着偏见。 整体:3面都是我单方面开摄像头,整个流程很简单,主管面也挺好的,唯一就是不搞技术
一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。 一面: 11.30下午 牛客网面试 30min 自我介绍 数仓项目介绍 什么是全量表,什么是增量表,以及应用的场景 了不了解拉链表,讲一下拉链表如何生成 什么是内部表,什么是外部表,有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法 讲一下熟悉的窗口函
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中,说说Action算子和Transform算子的区别?常见的行动算子有哪些? 4. 这个项目有考虑使用Flink处理吗? 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议,说说他们的作用 9. 如果
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的?为什么选的是实时? 3、大数据专业有没有学过flink相关课程,你是自动化学院的,如果我招你来你会不会只是学一下就算了,毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久,后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink,相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题 反问 用什么做什么 基本大数据组件都会用,shein数据量大而