20220905荣耀大数据开发面经 写在前面:搬来约在今天下午五点五十的面试,估计是前面的结束的比较快,四点五十给我打个电话让我去面试(当时还在学习室看面经呢/大哭),然后驱车一路彪回去,当时又是军训散场+下课,那叫一g个人多哟,急得不行还是强行镇静/哭 算是最近一场比较愉快的面试,面试官人特别好~有说有笑的,在这里记录下,顺便攒攒人品,求offer!!孩子快卷哭了/大哭 流程: 自我介绍 项目难
被kpi了,还是我太菜了 sparkstreaming和flink有什么区别? sparkstreaming如何确保只被精准消费一次 spark下的执行流程划分? hivesql平常用的多不多,sql不合理如何进行优化 数据库设计的主要的原则 平常做项目面临的最大困难是什么,如何解决的 反问:工作的业务场景是什么? 公司开发中使用的技术栈,回答:hive+es还有个没听清楚
9.13 一面 40min 竟然是个群面。。。。 6个人面试 + 1个HR + 1个技术面试官 1)首先是每人三分钟的自我介绍,并阐述自己优势 第一次参加群面有点紧张,一分钟快速介绍完了,优势也没说😂很多奖和论文也忘了说 2)然后6个人讨论一个场景问题,最后由一个人总结 12min 群面的时候有个人老是打断别人发言,自己一直在那说,体验感很差。 3)然后是面试官专业针对每个人在场景讨论的时候发言
1面:写题目easy+问基础知识+抓只线程池一直问到了系统资源分配,解答部门做大数据的解决方案,不涉及开发 2面:写题目easy+问简历,全程我在讲,然后没了,反问对我的了解,还说部门主要做解决方案 3面:聊人生,主管很好,推荐一下解决方案部门,感觉主管很年轻,然后给了我意见说做非技术不一定不好,校招生不要带着偏见。 整体:3面都是我单方面开摄像头,整个流程很简单,主管面也挺好的,唯一就是不搞技术
10.10 一面 12min 明明写的数据开发,招的是数据挖掘..... 全问的算法,一个大数据的东西都没问 满满的槽点,邮件上写的面试时间20min,然后一直等,然后hr说是上一个人还没面完.....再怎么没面完也不会让人等超过20min吧,结果等了半个多小时.......还是3个专业面试官,面试就12min,明明写的是大数据开发岗,说我怎么经历都是数据开发......招的又是数据挖掘,直接单开
一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。 一面: 11.30下午 牛客网面试 30min 自我介绍 数仓项目介绍 什么是全量表,什么是增量表,以及应用的场景 了不了解拉链表,讲一下拉链表如何生成 什么是内部表,什么是外部表,有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法 讲一下熟悉的窗口函
粉丝投稿,两年数据开发经验,面试博时基金的数据开发岗位。 开局是亘古不变的自我介绍,和面试官寒暄几句就开始面试了。 1、能简单介绍下你们的组织架构? 2、你们数据相关的都有什么系统? 3、你们团队有多少人? 4、数仓的数据量多大? 5、除了o层,数仓有多少任务? 6、数仓的任务要跑多久? 7、外部数据平台数据的流向? 8、外部数据平台有哪些数据入到数仓? 9、数据交换平台的应用场景? 10、你们大
一面(技术面)1小时 自我介绍; 介绍一下实习; Flink数据倾斜的原因? Flink如何保证数据不丢失? 介绍一下数据流和数仓架构? 解释一下被压? 介绍一下CheckPoint机制? 团队的工作和你的工作? 什么是AB测试? 现在的架构是什么? 如何保证实验层之间的正交? 产出的核心指标是什么? 实验的显著性如何计算? 实验的合规问题? 合规改造问题的设计思路? 二面(综合面)45分钟 自我
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中,说说Action算子和Transform算子的区别?常见的行动算子有哪些? 4. 这个项目有考虑使用Flink处理吗? 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议,说说他们的作用 9. 如果
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
本人24届某211大数据专业,字节也是本人的第一个面试。 首先是一个自我介绍, 然后问了项目的东西, 比如用的是维度建模嘛,用了什么事实表,用了什么业务,事实表有哪几种分类 项目中的数据域是怎么划分的。 然后问了MapReduce的执行流程,问了一个Map阶段的数据切分函数(没答上来),又问了MapReduce可以不要map嘛。 接着问了spark,问了spark和Hadoop有什么区别。 hiv
题型:15道选择题,其中有单选和多选;3道编程题,核心代码模式,为了方便调试,本文提供ACM 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 在TCP/IP协议的传输层将数据传送给用户应用进程所使用的地址形式 A.端口号 B.socket地址 C.IP地址 D.MAC地址 多选 高并发测试中,数据库数据问题往往出现很多,下面关于隔离级别描述正确的是 A不可重复读:同个事务前后多
1.去公司线下面试,有笔试题 1.填资料,个人信息,以及有关职业发展问题 1.比如,你的缺点和优点是什么,对你个人产生怎样的影响? 2.如果你和他人有不同的观点,你该如何和他人讨论? 等等,基本就是情商面 笔试题 1.中科软是一家主做保险的外包公司,所以用到的sql主要是oracle, 选择题有几道oracle的题, 2.然后有简答题,也比较简单 面试环节 1.自我介绍 2.对于shell部分的提
Timeline: 9.15 投递 9.25 一面 9.25 一面 53min: 1.常见数据结构 2.TCP三次握手 四次挥手 3.Java基本数据类型 包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型 反射 集合 9.Arraylist和linkedlist异同 1
9.14一面 数仓维度建模 离线数仓和在线数仓的构建流程 MapReduce过程 三道编程题: java无重复字符的最长字串(我实习也撕这个) 行列转换(一行变为多行,用mysql,不会。。。) 窗口函数序号函数三个(简单) 问我有没有收到其他公司的offer 将近1h,居然过了,我以为我挂了 9.21二面 这个面试官感觉说话慢悠悠的,然后不怎么问问题,我觉得是KPI来着 项目经历 实习经历 数仓