2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
28min 一位很友好的大哥,感觉问的比较简单全程没有怼我,希望不是KPI面😓 一面 开问: 自我介绍? 介绍Spark 项目? 介绍数据仓库项目,怎么建模怎么分层的? 数仓分层的优点在哪里? 项目里面提到了留存率,你怎么计算留存率的? TCP说一说? TCP和UDP区别说一说? A 3条数据,B 4条数据 A left join B 结果会有几种情况? 双流join 讲一讲? 缓存过多你的解决
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
一面:boss直聘,拷打项目,无八股。面试官简单介绍了项目的情况,反问。 二面:电话面,面试官一眼看出项目是网上的,我狂妄发言:“我是有自己的思考的”,然后被拷打,最后只憋出来了一条。 根据我之前的回答,面试官问了 1)数仓,业务系统,大数据平台的关系 根据jd,问了 2)py如何连接数据库,数据库游标、连接不释放会怎么样 3)hive分桶表,如何分桶,如何确定分桶的数量,分桶有什么用 4)怎么处
#24届软开秋招面试经验大赏# 投递岗位:高性能计算开发 面试时间:15min 面试流程 视频面试 1、自我介绍 2、简单介绍项目的难点与解决 3、你对自己的职业规划是怎样的? 4、高性能有很多落地,为什么选择车载行业? 5、为什么选择大疆? 6、反问 大大大BOSS面,我感觉主要是考察你的职业规划,来大疆的意愿是否坚定
问的挺基础的,可惜自己太菜了,很多问题没答上来。没问项目,只问了八股 1. css选择器,选择div下的第二个p该怎么做 div p:nth-child(2) 2. 默认position是什么,怎么消除position 默认position为statc,此时top,left等值都没法起作用 设置为absolute,相对于祖先元素进行定位 设置为relative,不脱离文档流 设置为fixed,相对
年前面试的 流程是机考,测评,再面试 (数仓)一面 聊得还行,不知道怎么挂了。。。可能是Spark这一块了解得太少了 自我介绍 你做的项目数据采集用的什么工具和原理? 有没有做过数据治理? 有没有做过数据血缘关系管理? 数据突增问题有没有遇到过?影响HDFS,如何解决? Hive表格存储用的哪个?什么原理? 数据某个阶段出现问题了,你怎么样定位出来? 数据倾斜有没有遇到过?怎么处理的? 数据之间的
二面就问了20min不到,吓死我了,不过已经发offer啦,分享下二面问的一些题目。 还是挖简历。 数仓建模核心 拉链表、快照表、全量表的区别 好像就这些~
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中 5. 一张订单表,支付状态会发生变化,如何采集到ods? 面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用up
难度不太大,感觉水水就过去了 一面: 面试官可能都怎么不怎么编程,所以技术性问题很少问 自我介绍 讲解项目,大概说了一下几个(面试官听不听懂就不知道了,感觉是纯测试出身,开发了解的比较少) 然后引入测试的方法,对测试的看法 之后问了技术栈,到岗时间,我再白话了一下学校做的各种项目,比如qt写的客户端,面试官感觉技术栈都对的上,十分满意 接下来面试官说嗨了,直接跟我唠了半个小时,关于他对测试的看法,
30min 1.自我介绍 2.为什么投软测?有没有投开发(没有,因为cpp不熟) 3.软件测试理论(V模型、W模型、黑盒、白盒、单元测试、集成测试、系统测试) 4.bug等级划分 5.拷打实习 6.你认为软件测试需要哪些能力? 7.反问
二面 1、为什么用seatunnel进行同步,不用dataX? 2、seatunnel底层引擎是spark,那为什么不直接用原生的spark进行同步呢? 3、项目有什么做的不够好的? ODPS相当于hive,多进程写入会产生表锁,没法利用spark的并发优势——1.统一管理ODPS表,每个分区写入一张表,读取的时候直接读取表,然后每天定时进行聚合。这个过程对于用户来说是无感的。2.分布式锁,阻塞的
之前投了百川的大模型算法工程师(行业大模型)。 一面只让我自己介绍了简历,然后就是反问环节。总共二十分钟无代码 二面线下面,纯聊天无技术。就问我感觉最无聊的跟最有意思的事情。我说我感觉找数据没意思,训模型有意思。结果面试官说他觉得恰恰相反,我就赶紧顺着他的话说,他又说你不用顺着我说,我就想听你反驳我。(直接就被看穿了😅😅。感觉不愧是懂大模型的,凡是涉及到技术的点我还没讲就说这个我懂你不用说。哈
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
做完美团的笔试之后很快就被捞了 大众点评 面经: 1.自我介绍 2.介绍最有价值的项目;复盘实习项目经历;介绍最近的一段实习经历,我在项目中的角色,是完成任务的人还是主导决策人,之前有没有对接的经历 3.创业跟做产品经理的关系 4.为什么选择这个留学专业 5.最快到岗时间并且希望能够立即入职 6.为什么要做三段不同行业不同方向的pm实习 反问: 如果能来的话会具体负责什么方向 面完之后