项目,根据项目问一些八股 略 记录没答好的 mapreduce的shuffle算法有哪些? mapreduce说的时候忘记切片过程了,导致后面问map分区数懵了,这都能忘废了 雪花和星型模型的区别,我只答了join和冗余,没答全
首先,说下背景 我是22年毕业,所以是社招面的拼多多 并不是我主动投递,是拼多多的人主动在boss直聘联系我,邀请我进行的面试 在这之前,boss上拼多多已经有多个岗位联系过我 但因为考虑到他们一天工作12小时,一周6天,没有双休,我都没有回应 直到这个岗位,因为看起来确实和我很匹配,我也很感兴趣,才答应的面试 技术面虽然有点波折,但最后也都通过了 没想到最后遇到了 hr,算是我平生仅见的人物了,
9.4 20mins 凉 抖音电商业务(数据质量和分析) 1.自我介绍 (介绍了自己上一段实习的工作内容,以及我理解的数据质量的分析框架) 2.介绍个自己做的项目 (讲了个电商相关的) 3.问Python掌握怎么样 (答:用来做数据清洗和机器学习多一点) 4.手撕代码(我以为会是SQL,结果是数据结构??) (我不是科班出身,直接说自己不会) 面试官明说我不太合适,因为技能不过关 全程没问业务,给
面试内容: 1,自我介绍。 2,研究生的方向和毕设题目。 3,主要的技术栈(会使用哪些编程工具,数据库),回答了只会Python+一丁点Java,后面就专注问Python内容了。 4, 实习的工作内容。 5,看CV中有机器学习的项目,讲讲逻辑回归,属于判别式or生成式?决策树中的减支。 看CV中有数据清洗的项目,讲讲数据清洗,缺失值处理的内容。 6,学过计算机的哪些基础课程? 7,Python中的
看牛客上好像很少这个岗位的面经 面试官人很和蔼 最可惜我太菜了 主要是介绍了一下项目 然后问了下大数据组件的八股(我不是很了解数开 答的不是很好) 然后写一道业务sql题(合并两张表 需要用到row_number()排序)可惜我思路全错了 第二道手撕leetcode136 估计是凉了吧555 完事了面试官还和我说他不玩他们公司的游戏 他玩原神(我:这是可以说的吗) 攒人品攒人品
9.4二面,这个面试官有一丢丢严肃,问的全是业务问题 简历一点没问,sql一点没提 持续了27min好像,面经如下: 1、假设快手平台,推出了京东plus和腾讯视频的联合会员,这三种会员的售价和成本告诉你(我忘了是多少了),卖出的钱怎么分 2、你有没有考虑京东作为大体量电商平台,他的体量因素 3、如果这次活动京东想评估效果,怎么得出京东的用户增量 4、京东怎么估算这次活动产生的收益 5、(上面回答
部门:优选事业部-美团买菜 timeline: 8.24 一面 8.28二面 8.31 hr面 9.7 oc 一面: 项目介绍 什么是指标体系 指标体系包含元素 指标分类 数仓分层、分层好处 数仓分层和指标分类之间有什么关系 什么是总线矩阵 什么样的数仓是一个比较好的数仓 什么方法可以落实上面说的数仓 缓慢变化维;除了拉链表还有哪些方式 什么情况下可以使用map join 怎么解决数据倾斜问题 J
秋招第一个意向 感恩团子! 二面和hr面感觉自己发挥得并不是很好,一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向 一面 60min: jvm了解哪些 垃圾回收了解哪些 主线程和另外十个线程,怎样使主线程最后执行完毕 (join、await) flink checkpoint kafka有序和不丢如何保证 算法题 链表
#24秋招加油#投递大约几天后测评,看了一下时间,大家好像都是同一个时间段测评的 测评类型限时具体天数具体时间,只有1h 满分70分,10个选择题,6个大题 选择题与指标有关,一般就是什么LTV与什么有关,出现xx情况,什么原因最不重要之类的 (具体忘记了,29号做的测评,现在也没消息,也没显示投递流程终止) 接下来就是大题 大题围绕的游戏展开:比如如果是你,你怎么评估游戏的渠道效果;有没有玩过游
不总结的笔试面试等于白做,最近的教训 三类题 1,20单选。主要是hadoop组件基础知识 2,5不定项选择。也是大数据基础知识 3,三个sql(一个窗口函数,一个基础,一个分组拼接) 第二个sql用例过了,提交0
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中 5. 一张订单表,支付状态会发生变化,如何采集到ods? 面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用up
1. 自我介绍 上来先问我,你实习就是去写文档吗,压力拉满 2. 深挖项目,确定是不是真自己做 3. 处理过线上bug,是怎么处理的,对于重复数据,having count 确定重复数据,用开创函数row_number完成去重 4. 项目中新增维度问题 5. Spark ui中有哪些东西,定位数据倾斜,如何优化 6. 手撕1到100w中1的个数,除了正常的思维逻辑还有什么其他的算法 7. 提高查看
2023-08-28-19-30,美团数开 ArrayList和LinkList HashMap的数据结构 ConcurrentHashMap,和HashMap的区别,put的过程,扩容的过程(扩容是我自己提到的) 设计一个共享变量,用什么? (我说用volatile,面试官说vol能保证原子性?面试官提醒说设计读写操作,我说弄一个读和一个写的方法,方法用Sychronized修饰,面试官没说话)
我记得我没有投递过这个部门,但是约的面试是数据开发部门。 面试官很好,是我这两周最好的面试官了。 1.自我介绍 2.实习具体工作 3.觉得实习工作有哪些价值 4.自己认为自己有哪些比别人强的优势 5.http/https区别,端口是否可修改 6.get/post区别 7.mysql为什么使用b+树索引 8.秋招目标 反问。 面试官直接告诉我 京东基本没有C++技术栈,90%是java 所以感觉大概
平安产险数据类笔试0901场 总共30道选择+2道问答题,总时长45分钟。 30道选择包括:经济学/SQL(不是常见的向题,会涉及到注入漏斗之类的)/概率论与数理统计/金融数学(年金、利率 剩余本金)/会计/机器学习 2道问答题都有点像是逻辑推理,比如给你几个条件,让你推断抽出的是哪三张牌 总体来说范围很广,难度我觉得不算小 #平安# #平安产险# #数据分析# #笔试# #24校招内推#