场景题: 1、有一个sql突然执行很慢有什么原因 2、从一个很大的日志表中10T,随机取出一些数据 3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办 4、mysql中MyIsam相对于innodb更适合那些场景 5、hashmap为什么不直接用红黑树 问一个问题,回答完就会深挖,给我问麻了 #
大题 1.sql执行顺序 2.海盗分金币五个海盗分得的金币为 21,20,19,22,18 因为每个人都足够聪明,所以最后两人再聪明都没用,无论怎么分,金币只能被没收。这个题有点博弈论的味道。
9.8 一面(30min) 介绍下自己的项目,项目的内容和使用的技术栈 细挖离线数仓项目 mysql三范式 hive内部表和外部表 hive数据倾斜 一道sql题 9.11 二面(30min) 两张亿级大表join有什么优化方案 场景题:公司通过银行给员工发工资,银行要完成公司账户的扣款和员工账户的收款,这个场景要如何设计,要考虑哪些问题? 介绍下离线数仓项目,几个人完成,多久完成,有哪些难点,现
面试方向为风控,2次业务面+1次hr面,深挖简历的问题就跳过了 一面 1.职业规划,为什么想做数分 2.标准异动归因题 3.sql题:学生id,课程,分数三列的表,口述sql思路,取出所有分数在平均分以上的学生的分数记录 4.对短视频行业的看法 二面 1. 给你全量用户的全量信息,怎么从所有举报信息中分析app大盘是否健康? 2. 在游戏聊天系统内怎么搭建风控核心指标体系? 3. 深入探讨职业规划
一面 1h10min 面试官很和蔼,这次吸取上次教训提前背了自我介绍和项目,基本都答上来了 实习(10min) 实验室项目(5min) Mr流程 Spark和mr区别 窗口函数 Shffule流程 Spaker的宽窄依赖 数仓建模的方法,层数,意义,每层都干了什么 平时为什么用维度建模,范式建模有什么缺点 数据倾斜(很细) 熟悉的排序算法说时间复杂度 一个大数组求topn(bitmap)然后追问,
9.11 一面(30min) 纯八股: 介绍下hadoop(hdfs、mapreduce、yarn) 介绍下hbase 介绍下flink flink checkpoint、connect和union的区别、flink如何处理数据倾斜 介绍下kafka kafka如果有台机器挂掉会发生什么 链表反转 面试官全程表情和语气冷淡,体验不是很好..当然答得感觉也很一般
第五题sql怎么写啊 我写的 select case when year(birth)>=1990 and year(birth)<2000 then '90 后' when year(birth)>=2000 and year(birth)<2010 then '00 后' end as 年龄段, sum(余额字段)(忘了) as '余额' from xxx,xxx where xxx xxx
面试方向为风控,2次业务面+1次hr面,已意向,深挖简历的问题就跳过了 一面 1h 1.职业规划,为什么想做数分 2.标准异动归因题 3.sql题:学生id,课程,分数三列的表,口述sql思路,取出所有分数在平均分以上的学生的分数记录 4.对短视频行业的看法 二面 1h 1. 给你全量用户的全量信息,怎么从所有举报信息中分析app大盘是否健康? 先从大盘,即全量用户圈定重度和新增,再看举报用户中对
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
部门是欺诈风险风控,简历没深挖,实习经历啥的都是随便问两句,像是hr面一样,估计KPI;然后问了两个业务场景问题: 1.如何识别快手异常涨粉; 2.如何预估未成年人直播用户数; 对这种场景业务题一窍不通,哭了,答得很不好; 然后写了道概率题,题目意思没理解,想了半天没想出来;面试官看我没理解题目然后换了道简单的,说了思路后就说面完了,反问问了对方业务部门情况后,然后就是感谢你的时间。
首先是自我介绍:balabala 是否了解过数仓和Spark? 再Linux系统中,找到对应的Java进程并删除。 同样的在 Linux系统下,删除使用某端口的进程。 介绍一下Mysql和LSM,并分析下这两种引擎是基于什么?适用于什么场景? sql编程题:牛客每个人最近的登录日期(二)() 算法题:二叉树的最大路径和 (较难) AC Code: class Solution { public:
个人情况:本双一流硕211非科班,一段搞深度学习的实习。项目自己做的。全程面试被追问麻了面试官有问题必追问 自我介绍 项目深挖(20min) 实习工作介绍(5min) 数据倾斜有哪几种解决方法 Group by 倾斜,join倾斜,null值倾斜 分别说说这些倾斜怎么解决:全说上来了,面试官问:还有呢?。。。开启负载均衡,对小文件进行合并,对数据类型进行检查,还有呢?我就记得这些了 Hdfs小文件
一面8.23 1.自我介绍 2.介绍一下你做过的项目 3.从项目展开的问题:sqoop导数据是从哪到哪? 从mysql到hdfs 在导数据的过程中有没有遇到什么问题? 数据量不大,所以没什么问题 (我的项目很简单,所以我没法答啊,不过幸亏面试官没有深究,开始八股) 4.范式建模有什么特点?和维度模型的区别 (数仓建模理论在《大数据之路:阿里巴巴大数据实践》中有详细归纳,强推!) 5.三范式能说出来
好多天之前的面试了,没信儿了应该挂了 字节-tiktok海外业务(开始让面试官简单介绍一下)-数据分析,一面,40mins: 1、自我介绍 2、深挖简历:遇到的问题、解决方法、对实习经历中业务的理解 3、深挖项目:分析逻辑,指标拆解,评估指标等 4、代码:sql,给业务场景(视频、分区、播放量排序问题等),回答分析逻辑和主要函数,重点是考察窗口函数 5、英语口语询问,商务对话考察、英语阅读和文书能
首先,说下背景 我是22年毕业,所以是社招面的拼多多 并不是我主动投递,是拼多多的人主动在boss直聘联系我,邀请我进行的面试 在这之前,boss上拼多多已经有多个岗位联系过我 但因为考虑到他们一天工作12小时,一周6天,没有双休,我都没有回应 直到这个岗位,因为看起来确实和我很匹配,我也很感兴趣,才答应的面试 技术面虽然有点波折,但最后也都通过了 没想到最后遇到了** hr,算是我平生仅见的奇葩