笔试: 投递后很快就收到了hr的回复,发了一个word文档作为笔试题,24h内完成,不是很难 几道SQL题(窗口函数),一道业务题(给了一个生活场景,问你的分析思路,我写了swot分析),几道python题(关于数据处理和数据整理,主要考点是pandas) 一面20min: 1.自我介绍 2.在上一段实习中选一个能体现分析能力的项目的介绍,挖得很深,问了很多方法上的细节和原因 3.抖音和快手的区别
1、自我介绍 2、MR的执行过程,用了几次排序,Reduce怎么知道拉取哪些数据 3、RDD的底层实现(Spark用的不多就没问了) 4、项目介绍(没有针对项目进行提问) 5、SQL优化思路,具体讲了关于数据倾斜这块 6、SQL题:包含班级、学生、课程、分数的表,查询每个班每门课前三的学生 7、SQL题:包含user_id和target_id的表,找到互相关注的用户,优化不用join实现 8、SQ
1、自我介绍 2、为什么要去北京 3、MR的原理 4、为什么环形缓冲区到80%之后才反向溢写 5、SQL中哪些函数走MR,max走不走 6、select a,count(distinct b) from table group by a,MR的流程 7、SQL优化,如果给你两张表,用户视频表和用户粉丝表,怎么处理数据倾斜 8、SQL题:每个用户都有5门成绩,总计6列。请生成两列,其中1列是用户ID
1、自我介绍 2、看我用Java,问我Java程序的执行过程,然后Java怎么跨平台 3、基本数据类型,是否可以相互转换 4、自动装箱自动拆箱,Integer i = 100 是什么过程 5、深拷贝浅拷贝 6、Java是值传递还是引用传递 7、JVM的理解 8、堆是怎么划分的,实际有没有用到有关JVM的地方 9、垃圾清除算法说一下,什么时候FullGC 10、多线程,线程安全,线程通信之类的 11
1. 自我介绍 2. 项目里遇到了什么难题,怎么解决的 3. 你用过消息队列,消息队列实现的是什么,还有什么消息队列 4. 分布式锁怎么实现的 5. 介绍一些线程与进程的区别 6. Synchronized和volatile的区别 7. Synchronized可重入锁怎么实现的 8. JVM内存区域介绍一下 9. JVM垃圾回收介绍一下 10. CMS垃圾收集器和G1垃圾收集器什么区别 11.
9.4二面,这个面试官有一丢丢严肃,问的全是业务问题 简历一点没问,sql一点没提 持续了27min好像,面经如下: 1、假设快手平台,推出了京东plus和腾讯视频的联合会员,这三种会员的售价和成本告诉你(我忘了是多少了),卖出的钱怎么分 2、你有没有考虑京东作为大体量电商平台,他的体量因素 3、如果这次活动京东想评估效果,怎么得出京东的用户增量 4、京东怎么估算这次活动产生的收益 5、(上面回答
面试官是小姐姐,好nice 听说写面经能提升运气 持续了40min,面经如下: 1、自我介绍 2、两道sql: 观看时长为0-2min,2-10min,10-30min,30min以上的用户数量 两个表连接,取出小明销售额前三的日期 3、智力题,25匹马,每场只能赛5匹,没有计时器只有排名,选出最快的三匹马 4、异动分析 - 快手直播时长下降了,分析 5、面试官还有个会,反问了几个问题就结束了#快
1. 自我介绍 2. 写一个算法 Q:给一个有序数组arr[ ],和一个 int target,找到target的左索引和右索引。 例:arr = [1,1,1,1,2,2,2,3,3,3,3,3,5,5,5], target = 3. return left = 7, right = 11; 3. 问简历 3.1 介绍了电影推荐的项目。问了几个模型。 3.2 介绍了强化学习的论文,问了DQN和x
50min 无自我介绍 先问一些个人情况,现在人在哪里,什么时候能过来北京,能实习多久 有没有什么其他offer 在哪里投的,跟内推人熟不熟 讲一下flex 浏览器渲染 手写vue选项型API,手写生命周期,在onMounted什么周期会做什么 算法 // 第一题,使用promise实现每隔一秒打印一个数字 1 2 3 4 5 const printNum = (num) =>
自我介绍 介绍项目 介绍实习,面试官问的内容和ML的关系不太大,可能是和部门的工作比较契合所以就没为难我。 面试官向我介绍部门的工作内容,了解到和我目前实习工作相关性较强。 手撕:比较版本号 反问,因为投的是深圳+北京,所以问了一下base地。
快手电商面试好难啊,面试官是个特别好的小哥,不过问的问题还是暴露了我能力不足啊感觉凉了啊。 首先是他自我介绍,快手电商用户买家提升部门的,然后介绍了面试环节。首先是自我介绍;接着是简历问题,要求我介绍下在Kaggle上的项目经历;接下来是问题环节,首先问我ABtest流程,幸好我之前恶补了说完之后他的评价是还行,如果有具体场景应该能更清楚,但是接下来就是一个我完全没记住的问题了,计算最小样本量需要
一面 1.SQL table_a dt, city_id, device_id, gmv tips:每个device一天可能有多条记录 (1)求每个城市每天gmv最高的5个device_id (2)求连续三天每个城市每天gmv都在前5的device_id 2.统计题 (1)自变量存在多重共线性,如何通过变量筛选来解决? (2)线性回归的五个基本假设 3.机器学习 (1)DBScan 与 Kmean
一面:2023.2.7 30min 自我介绍 为什么要换实习 了不了解数仓知识 sql题,各城市观看量前10的用户,能不能保证每次刷数的结果一致 sql题,连续登陆 数据倾斜啥情况,怎么解决 了解即时查询组件吗?CK ES Durid之类? hive2ck有啥要注意的 反问 二面:2023.2.8 40min 自我介绍 为啥要换实习 之前实习有没有什么遇到难点,怎么解决的 你觉得什么样的数仓是好数
一面:女性面试官(业务)#第一份面经# 居然没有自我介绍!!! 开始是她把自己的部门说了一遍以及对实习生的要求, 1、两道SQL T1求留存率,(id,date) T2求学生总成绩前10名——窗口函数 2、两道业务 T1分析用户视频发布数量下降的原因 T2如果你是视频发布者,你会因为什么原因减少视频发布?