实习和经历: 1. 介绍一个自己的项目 2. 你在这个项目中遇到的困难有什么 3. 你做过最有成就感的事 4. 你最受挫折的事 5. 有没有协调两个组织共同完成事务的经验 业务: 1. GMV下降异动分析 2. 讲一下做的数据报表项目 反问: 1. 有几面:三面 2. 怎么提高:把看板项目往指标构建异动分析靠一靠,说得更有逻辑一点 3. 工作内容:业务方面的分析,用模型较少,感觉你用模型比较多 不
8.25 18min 1.自我介绍 2.专业介绍 3.大学期间相关经历 4.实习工作 5.数仓分层 6.主题域划分标准 7.数仓建模 8.项目中组件作用 9.反问 主要是深挖项目和细节 #秋招##24秋招##数据人的面试交流地#
时长1s5min 面试官自我介绍 自己自我介绍 简历上面两个项目讲解(20min) 项目: 后端项目的登录模块怎么实现的?(如果服务器扩容到三台还可以适用吗?) 数仓项目当中你做了什么? 实习: 实习都干了什么? 数仓: 数仓建模理论(ODS,DWD,DWS,ADS)? Kimball建模理论和范式建模的区别?他们的应用场景? 八股: web: session和cookie的区别和联系? java
数据研发工程师,base杭州 8月14日投递 8月18日一面 1. 问了一点项目,项目中的亮点,我用了Redis,根据Redis展开提问(太紧张直接宕机) 2. 手撕力扣1 3. 手撕力扣2 4. Zookeeper在 HBase/kafka 的作用是什么 5. Flink checkpoint 6. 状态后端知道啥,说优缺点 7. CK的流程 8. CK失败怎么办(不会) 9. FLink数据倾
介绍项目20min 关系数据库和数仓有什么区别 数据集市、数仓、数据湖区别 数仓建模维度以及常用方法 举例说明三范式关系 介绍Hadoop工作流程以及常用组件 数据结构和算法太菜就没深入问 最后反问 总结:总面试流程不到四十分钟,面试官人很好,给了一些建议。 转行太难了!
自我介绍 数据结构 数组和链表的区别 java中哪里用到了这两个数据结构 栈和队列的区别 网页的前进和后退都是使用哪个数据结构 arraylist和linkedlist的区别 看过哪些书 mysql的索引 b树和b+树的区别,b+树的优点 如果使用mysql存1000w行数据,设计方案 如果设置索引,那么存储索引也会占用很大的空间,怎么解决 数仓的项目,怎么分层的 为什么要分层 每层干了什么事 反
分享一下去年成功面试进快手的面试经验,希望对大家有帮助 1)自我介绍 2)深挖过往实习经历: 1.数据异动问题:假如一直关心的指标在某个时间点下跌很多,怎么分析呢? 2.评估方式问题:大型活动无法上ab实验,那么如何评估活动的效果呢? 3.指标选择问题:如何构建关键的指标链路,如何展示? 3)统计知识考察: 1.如何通俗地解释p值的意义? 2.解释一类错误和二类错误 3.了解染色逻辑吗? 4)偏智
快手数据分析-海外 秋招一面 因为之前有过快手数分实习,所以问的很具体 问了之前实习做的几个项目细节,具体思路,最终的解决方案,以及我们的方案如何让客户buyin 2道sql 一道窗口函数 一道留存率和活跃数 做的很烂 太久没写sql都忘光了😭 大概率寄 反问问了快手对校招生有没有成体系的培训,回答是没有,只能看每个部门对新人的重视程度
一段大厂数开实习 感觉面试官比较喜欢有数据中台经验的 项目基本没怎么深挖 重点问了数据源的接入&处理 sql题 算科目最高分学生 java题 返回有序数组中第一次出现指定数字的位置 要求复杂度最低 #数据人的面试交流地#
一面 英文自我介绍 mr的shuffle zookeeper选举 spark内存管理 hbase中region的拆分 数仓中都有什么表 怎么处理缓慢变化维,拉链表有用过吗 yarn的架构 namenode ha的实现 namenode启动过程中怎么确定哪个是active哪个是standby spark sql用的多吗 手撕 中等leetcoode,合并区间 二面 自我介绍 家哪里的 对博世有什么了
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
2023.08.22 20分钟面完一面,流程如下 自我介绍 为什么选云计算和运维这块,平时是怎么学的 配置过哪些Linux服务,比如LNMP架构,如何配置的,是否是源码编译 配置过docker和k8s吗,如何配置的 Linux基本命令考察 介绍项目经历,项目背景和目的,使用的技术栈 熟悉哪些语言,用这些语言写过哪些小工具或者项目 反问环节 感觉像KPI面,面试官迟到了几分钟,然后20分钟不到就面完
两次面试邮件里都写的是初试,不清楚第二次面试属于二面,还是一面挂了被共享到别的部门了。 先说体验,两次的面试官都彬彬有礼,相对年长,可能是主管级别。问题由浅入深,从场景入手,通过思路的引导,了解你的知识掌握水平。 之前理解的数据开发可能更偏向数仓开发,但很多公司数据开发岗位的工作内容是大数据组件的性能优化、数据引擎开发、数据服务开发等等,所以对java开发中多线程编程、jvm等是有较高要求的,我个
自我介绍 数据倾斜问题 spark的shuffle相对于mr的shuffle有什么区别 spark的stage怎么划分的 yarn中都有什么,作用是什么 hdfs读写流程 rpc和http分别是什么,有什么区别 项目中都有什么数据 数仓的分层,每层都做了什么事 反问 金风科技二面总经理面 自我介绍 总经理问题: 1.本科和研究生都是通信,为什么选择大数据 2.怎么在完成学业同时学习大数据的 2.对