个人bg:211本硕 岗位:数据开发 投递日期:3.23 当前状态:4.2 一面 简短自我介绍,然后开始拷打, 1、对数仓的理解,数仓是个什么东西,用来干嘛? 2、spark与mr区别 3、spark的shuffle可以不排序吗?为什么 4、采用byPass shuffle的依据是什么 5、shuffle的本质是什么? 6、开发过程中有没有遇到过难题?如何解决的? 7、项目在哪做的,环境怎么搭的
全程无八股 项目: 1、介绍你的工作内容 2、数据库构建过程 3、服务架构 4、如果一个业务很慢怎么办 5、微服务架构的选型 6、大数据处理的技术(不太会。。。。) 算法: 手撕 四则运算,一个string数组,{“1”,“+”,”4“,”/“,”6“,”*“,”2“}算结果(两个辅助栈) 反问: 还有几轮(最多一轮技术面+hr) 整体情况还可以 PS:流程现在显示复试,没有之前会议连接,是不是秒
春招流程:网申---->测评--->初面---->复面----->发offer 网申:除了正常的个人信息外还需要写点小作文夸夸泸州老窖,然后写为什么要选择泸州老窖什么的,总体来说网申淘汰率不高 测评:前一天刚网申,第二天就发了测评链接,题目主要是一些申论形策+智力题+性格测试题,难度不高,好好写问题应该也不大 初面:测评完当天晚上就给我发了初面短信,先测试设备,然后发正式初面的腾讯会议的链接和会议
我面试了零售部数据分析岗,下面将问题整理一下: 一面 1.自我介绍 2.介绍一个实习中最深刻的项目1.这个项目的分析思路是什么样,有没有出现和预期不同的情况 2.如果应对这种预期与实际不符的情况 3.用户通过活动转化的行为路径会是怎样,怎么判断是哪个环节出现的问题 4.SQL:次日,三日,七日留存 5.SQL::找各品类下gmv最高的商品 6.SQL的优化方法 7.几个join的区别 8.最后考核
1、自我介绍 2、数仓怎么自学的 3、整个项目架构说一下 4、数据域是什么概念(提到了数据类型),那如何界定数据类型呢 5、总线矩阵构建过程 6、dwd层怎么设计的 7、了解业务过程这个概念吗 8、分域的话,在dws表中有没有可能会跨域(举了个互动域和活动域的例子),结果告诉我这样的话你的互动域设计的其实是有问题的(挖坑给我跳,悲) 9、星形模型和雪花模型 10、缓慢变化纬为什么用拉链表,他说他第
暑期实习和秋招面过的数据分析也有几十场了,给大家汇总一下亲历的高频考点,面试前一定要反复练习哦 一、口述回答问题: 1.SQL查询过慢,如何解决? 2.union v.s. Union all 3.SQL执行顺序 4.视图 v.s. 表 5.第一范数,第二范式,第三范式 二、现场写代码: 1.使用窗口函数求某日每个省GMV前3的商品,给定字段province,sku,gmv,dt 2.求每日新增用
一面 1.简历实习相关 2.gmv 下降如何分析 3.sql留存率计算 连续登录用户 二面 1.简历相关 2.如果在app 内短视频/直播页面增加搜索入口跳转搜索落地页,如何衡量它的效益(这个AB 测试当时答得不是很好,现在的想法是做 AB 测试后,用 PSM 匹配去衡量实验对照组用户区分搜索入口来源的各个指标 ) 3.如果一个搜索词搜索量突然下降,怎么分析,可能的原因 4.sql汇总当月至今的每
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的
笔试+3轮面试,笔试题比较开放,主要考察一些基本的概念,业务一面:首先自我介绍,面试官就简历提问,接着会跟你一个具体的案例让你回答如何识别黑产用户,附加口述一道智力测试题,最后是反问,整体面试很轻松,由于反问阶段表现得很好,所以一面后三分钟就通知结果了。 二面应该是部门leader面,更多的还是深挖简历的内容,真的很细很细,面完以后感觉表现一般,然后hr通知结果待定,基本没戏了。
1.你在项目中做了哪些事情? 2.数据存入HDFS中为什么要在存入mysql?(项目相关略) 3.数据加工存储过了还是直接落在数据中了((项目相关略) 4.(实习)接口中用的什么协议的接口?(懵) 5.报文格式用的什么?(懵)他说xml或者json 6.写过什么复杂的SQL吗?窗口函数写过吗? 7.又没听过mybatis批量提交?无 8.说说二叉排序树有什么特点?时间复杂度?退化后怎么办? 9.二
个人bg:211本硕 岗位:数据开发 投递日期:3.14 当前状态:3.29 一面(本来约的22号,推迟到现在) 面试官人很好,语速比较慢,说话很平和,上来先介绍了部门业务,然后开始交流 1、问了实习相关的经历,有哪些收获(聊了比较久,大搞10分钟) 2、由于本专业不是数开所以根据简历项目问了一些八股 · 为什么会接触HADOOP · HDFS架构、namenode作用、有没有遇到过namenod
岗位:大数据研发实习生 3.21一面 (1h) 1.确认日常实习 2.springboot的概念 3.springboot的自定义配置 4.spring的循环依赖 5.项目相关 6.B+树和B树的区别,为什么用B+树做索引 7.索引失效的场景 8.最左匹配原则 9.手撕代码:杨辉三角,一开始用的一维数组,后来面试官让我用二维做 10.反问 3.25二面(二十分钟) 1.自我介绍 2.项目拷打 3.
******************************* 1、为什么要使用 Elasticsearch? 系统中的数据, 随着业务的发展, 时间的推移, 将会非常多,而业务中往往采用模糊查询进行数据的 搜索,而模糊查询会导致查询引擎放弃索引, 导致系统查询数据时都是全表扫描,在百万级别的数据库中, 查询效率是非常低下的,而我们使用 ES 做一个全文索引, 将经常查询的系统功能的某些字段,比如
1 介绍下你自己 我按照常规的套路,先自我介绍,然后介绍我的项目,想引导着问些八股,但是好像没用😂 2 32位和64位你能联想到什么,从机组操作系统,数据结构等角度,开放性的谈一下你的理解😂😂 这个问题直接问了15分钟 3 手撕代码 给你一个应用场景,设计合适的数据结构,并完成两个功能函数 看出来是树了😂😂,但是没咋刷算法,以为只问sql,我的格局小了,写了二十分钟,一点不会😂😂 总
面经05 |【蚂蚁数据分析暑期实习面经-一面】电话面试 1.面试官介绍工作内容 2.学得最好的一门课?对它有什么独特的理解?为什么会诞生这么一门课? 3.讲一个社团的活动案例,如何与社团同学沟通,如何与指导老师沟通 4.某段实习做什么工作?想象工作和实际工作有什么gap? 5.另一段实习做什么工作? 6.实习case深挖,涉及到一些决策树算法知识 7.如果与人有分歧如何解决 8.SQL连接有哪些方