2022.10.10 一面 1h TDL优化推动存在什么问题? 所有的下游修改代码由公共层实现是合理的吗?如果不合理有什么解决方法? 目前整个数仓多少任务?(母鸡 目前数仓分几层?你觉得目前分层中的平衡应该怎么做到或者有什么思考? SQL题:一个tb表,里面有姓名,课程分数,课程名称,目标:取最高课程分数的学生名字。我的答案用了join,然后提问:join的优化有哪些? Java题:反转字符串,用
面试时长约一个钟 1. 面试官介绍部门及小组情况 2. 自我介绍 3. 讲项目(40min) 深挖 深挖 深挖 中间穿插着一些ab test/ 统计学基础 比如 ab sample size/ 一二类错误定义/ outlier怎么办 / matching怎么做(lz简历提到才问的) 4. sql *2 口述 我本来写在ipad上 但是虚拟背景 直接全糊上 4. 反问 白天上班已经上懵了 根本没时间
视频面,1h 吐槽:我8.11投递的岗位...八月底做完的笔试....10.21给我发邮箱约面,也不知道前面是哪个大佬拒了offer然后把我给捞上来了 但是,面试官人很好啊~面试体验很好~ 虽然我很多没答上来只能说分治思想贯穿了全程... 无自我介绍 实习 由于我有数据开发相关的实习,所以前30min各种问实习 做了哪些工作,怎么做的,任务挂了怎么办,怎么做的清洗,用的啥语言,用的是啥架构/工具?
投递的是到店,被买菜事业部捞起来 一面 一位小姐姐面试官,全身洋溢着令人舒适的气息。 深挖简历每一段实习,细节问的很深入,以及部门为什么做的动因。 二面 从宏观、中观、微观来分别评价下美团买菜目前的优势劣势,以及和其它对手的对比,有提及到像是盒马、朴朴、叮咚买菜等竞争对手。 反问:面试官表示集团对买菜业务很看重,并且自己希望招到兼有战略、数分、经营等多方面经验技能的校招生。 面试全程30-40mi
TimeLine:一面20220901,二面20220901,HR面20221009(已挂) BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 一面 1. 商分和数分的差别? 2. 如何向刚开始接触AB实验的同事解读实验结果? 3. 如果某指标受到组前和策略的共同影响,如何确定策略对该指标的影响大小? 4. AB实验中如何对异常指标作归因? 二面 1. 商分的缩写是BA,你
美团 2022暑期实习 面经 数据开发工程师 2022.03.18 笔试 2h 5题 300多分 2022.03.28 一面 50min左右 自我介绍 大学期间最感兴趣/印象最深的课程? 数据开发: 了解计算机的混沌理论/空值/还是什么?, 没听清,不了解 hive和sql的区别?了解spark?hive中如何自定义函数?hive中的UDF? hive有索引吗? Hive只有有限的索引功能,没有普
一面 2023.1.10 着重考察个人性格能力(自驱性、积极主动性、对成长的思考)、过往项目的参与深度 自我介绍 选一段实习经历,讲一下你的工作和角色 快手这段经历干了很久,为什么要离职 你说你在快手后期是主动思考的角色,讲一个例子证明一下 你觉得这些实习经历里,让你觉得有挑战,比较困难的事情或者时刻是什么 用一句话形容你自己 你下一段实习的目标是什么,希望获得什么 面试官介绍岗位对接的业务、工作
一面 50分钟 自我介绍 http协议是哪一层的协议,讲一下对http的了解 tcp协议和udp协议是哪一层的协议,讲一下他们之间的区别,以及他们各自的应用场景 你知道get和post请求吗,讲一下他们之间的区别 当我们输入美团网址的时候,这个从输入到显示页面的过程 你了解操作系统吗,linux了解吧,你说一下你用过的命令 当我们要查看文件的具体属性用什么命令 讲一下静态链表和动态链表的区别 数据
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
TimeLine:一面20220420(已挂) 当时的BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 写在前面的话:该文档记录2023届暑期实习面试的相关问题,因此时间线分布在2022年 一面 1.SQL代码 面试时会共享屏幕在本地进行编写,不要求跑通,提供大致思路即可。 下述解答可能存在问题,敬请读者批评指正。 现在有两张数据表,分别为: 订单表 orders,字段有:
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
一面 面试官部门介绍 美团到店业务的收益管理和商业分析中心,专做用户侧的促销策略的收益评估。 自我介绍 实习时间地点 深挖简历:怎么做指标异动分析的? 简历延申:在美团到店业务背景下,如何去做成交率的异动分析? 怎么判断一个指标是否异常? 实习中数分最有意思或者你做的最好的一个分析的结论是什么? 多个指标异常的时候,怎么判断哪个指标影响大? 回答了指标贡献率计算的问题,但并没有操作过。 什么场景下
1.自我介绍 2.数据仓库和数据库的区别 3.数仓的架构 4.分层 5.维度建模步骤 6.缓慢变化维 7.如何处理缓慢变化维(拉链表的设计) 8.通过拉链表如何获取某一天的所有用户状态 9.采用什么方式做数据的采集 10.数据哪来的 11.数仓最终的可视化怎么做的 12.OLAP引擎 13.如何评判数仓建模之后模型的优劣 14.用户分层的几种方式(交易链路,漏斗转换) 15.描述一个实时处理场景,
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
个人情况简述:本硕双非,acm银牌 随便找群友要了个内推投递 笔试4.2题,投递选择的是都喜欢,笔试完在人才池待了十几天,被数仓部门捞了 一面(总时长50分钟) 聊实习经历和简历项目,聊了约30分钟 聊天环节把整个技术栈聊的差不多了,还有离线、实时数仓的很多点,后面又问了几个问题 离线数仓分层设计、实时数仓设计,spark、flink相关生成经验,S3、OSS的使用理解,k8s的使用心得等都在聊项