一面 1.讲一下你在快手的实习经历,通过哪些手段召回流失用户 2.召回过程中最大的问题是什么?都做了哪些努力 3.你觉得拉新难还是召回难? 4.我看你在网易做拉新,通过哪些手段进行拉新,对koc的短视频内容指导的产出 5.对影视综垂类koc和kol的了解(我当时说我经常看,但是记不住名字) 6.为什么记不住名字?哪些因素导致的? 7.如果现在让你来帮助创作者们改善这个问题,你有哪些好的方案和建议?
2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题,监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域,String是基本数据类型吗?基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
一面:boss直聘,拷打项目,无八股。面试官简单介绍了项目的情况,反问。 二面:电话面,面试官一眼看出项目是网上的,我狂妄发言:“我是有自己的思考的”,然后被拷打,最后只憋出来了一条。 根据我之前的回答,面试官问了 1)数仓,业务系统,大数据平台的关系 根据jd,问了 2)py如何连接数据库,数据库游标、连接不释放会怎么样 3)hive分桶表,如何分桶,如何确定分桶的数量,分桶有什么用 4)怎么处
年前面试的 流程是机考,测评,再面试 (数仓)一面 聊得还行,不知道怎么挂了。。。可能是Spark这一块了解得太少了 自我介绍 你做的项目数据采集用的什么工具和原理? 有没有做过数据治理? 有没有做过数据血缘关系管理? 数据突增问题有没有遇到过?影响HDFS,如何解决? Hive表格存储用的哪个?什么原理? 数据某个阶段出现问题了,你怎么样定位出来? 数据倾斜有没有遇到过?怎么处理的? 数据之间的
二面就问了20min不到,吓死我了,不过已经发offer啦,分享下二面问的一些题目。 还是挖简历。 数仓建模核心 拉链表、快照表、全量表的区别 好像就这些~
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中 5. 一张订单表,支付状态会发生变化,如何采集到ods? 面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用up
作为设计行业的打工人,每天的工作都很充实。来谈谈面试和工作的一些经验吧,希望能对即将迎来秋招的同学有帮助。 个人背景: 本科江南大学服装艺术设计,目前从事用户体验设计相关工作,当初也是从一枚UI小白成长起来的,这几年也一直看到有人在问UI的行情是不是饱和,不行了。其实这个还是看自身能力和努力、兴趣程度,配合一些面试技巧去凸显自身优势,还是可以拿到心仪的offer的! 简历: 在选择好自己感兴趣的岗
1面(1h)8.2 项目介绍 MapReduce提交作业流程 MapReduce和spark的区别 HDFS架构 HDFS写流程 groupByKey和reduceBykey的区别 算法题(实现一个类,插值(已存在就false,不存在就插入),删除值(不存在这个值就返回false,存在就删除),随机获取已存储的值,三个功能时间复杂度为O(1)) 2面(45min)8.10 项目介绍 数仓理解 ja
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
杭州国际化电商 一面: (主要根据简历问问题) 实习经历 Python迭代器与生成器 Python正则 对Python特性的理解 三次握手、四次挥手 http和https 如何解决慢SQL 有哪几种加密 线程如何同步 死锁,解决方法 测试场景:微信朋友圈发后看不到图片。 测试场景:手机连不上网。 算法题:力扣 220. 存在重复元素 III 二面: 实习经历(详细问了工作内容、参与项目) 觉得自己
字节跳动提前批:data-电商 数据科学 一面,部门成员:~50min 1. 自我介绍 2. 机器学习 a) XGBoost:损失函数推导、特征重要性的计算方法 b) 为什么用SHAP计算特征重要性,不用XGBoost自带的方法(实习项目) 3. AB test a) 对于不同类型的指标,分别要怎么做统计检验 b) 用非参数方法检验偏态分布的指标,统计功效较低,有什么其他方法
对于不同性格的面试官,需要有不同的对策 字节跳动的面试也是我第一次面试,也是目前为止唯一一次面试,三个面试官都有不同的偏好 一面,我节奏掌握的不够好,太急于表现自己,在面试官问题还在铺垫的时候就发表自己的看法,偏偏面试官是个会对你的话找问题的人,自己给自己挖坑了(vue的data非得用函数?改变不影响布局的数据,vue会重新渲染页面吗?serviceworker的原理),对于这种面试官,如果自己的
1.自我介绍 (我记错时间迟到了,但是面试官很好,让负责的小姐姐给我打电话了) 2.项目,因为面试的岗位里面有要求是小程序开发经验,就说了一下,应该是深挖项目 3.uniapp怎么运行到小程序实现的底层原理 4.vue组件通信,我说了props和自定义事件 5.然后问了组件通信里面跨级怎么处理 6.问了一个js的东西,没听清,好像没听说过(菜鸡真的不知道是什么 7.promise,讲一下和setT