数据分析面试100题,春招冲鸭! 大家好,今天我给大家总结的是数据分析面试题库的基础篇(后面还会有进阶篇和高级篇) 基础篇指的是与业务场景脱离,可以用简短的话术表达出来的考题,意在考察同学的基础理论知识。 常见于实习的面试和全职面试的第一轮面试当中。 后面乐乐还会同步进阶篇和高级篇,各位敬请期待哟。 基础篇一共包括六个部分,SQL(20题),python(10题),概率论(10题),数理统计(15
#面经##面经#1. hdfs的shell命令,说实话没想到会问这个(平时用都是直接网上查api),让我说如何查看文件前五行,如何复制文件,详细到把命令行+参数都说一遍 2. mapreduce流程 3. mapreduce和spark区别 4. 讲一下spark的rdd 5. 讲一下hdfs架构,2ndNameNode工作机制 6. java基本类型和引用类型的区别,==和equals()的区别
投递+约面:10天 面试形式:电话 面试时长:1h 腾讯是我内地暑实的第一站,刚开就投了简历原以为要在池子里泡很久没想到迅速被捞。 P1:自我介绍 P2:针对自我介绍问了一些专业相关的但不涉及算法和分析的个人理解(岗位理解、未来规划、WXG了解...) P3:问SQL,口述留存率、union&union all、join的差别、窗口函数、如何提高运行效率 P4:针对简历内工作问的一系列问题(全部涉
面试岗位:数据分析师 面试公司及方向:蚂蚁集团 过往实习经历: 腾讯运营(3个月) xx咨询(6个月) 美团商分(12个月) 腾讯商分(4个月) 面前准备 面试积累:秋招前几个月开始可以投递日常实习机会,积累高频问题,并形成自身的答题思路。在不断地刷面试的同时,形成基础问答-面试中发现bug-记录并修正bug-完善自身回答这一套完整的自我提升机制,从而从容面对下一次面试。 实习沉淀:实习过程本身就
项目: 数据库表的设计(好烦,黑马程序员就这么设计的) Redis缓存过期时间怎么设置,过期了咋办 八股: MySQL索引原理 表级锁、行级锁 优化器、连接器、存储引擎架构 线程池参数 什么情况下线程会无法终止 spring boot 启动类注解,自动装配原理 tcp udp区别,适用场景 docker有哪些东西 git merge 和 rebase 区别 平时怎么学Java的 后续:喜进人才库#
一面: 全程围绕简历展开问 1、自我介绍 2、聊聊印象最深刻的一次竞赛经历 (简历写了) 针对这个竞赛内容抠细节 3、问实习经历中做的事情 挑了其中几个细问 这个答了好久,从事情的背景,到思考链路 4、一道算法题 一个数组先升序再降序,求最大值 5、hadoop数据的存储格式 6、spark里job、stage、task的概念 7、问flink、hudi这个有没有经验 因为简历上写了,回答说学习的
京东: 1.自我介绍 2.sql两道,面试官人很好让口述(涉及窗口函数) 3.挨个项目问技术细节,问了四个项目(用户画像数据指标、用的算法等) 4.没有实习经历,最好还是做一做实习 5.反问¿(技能方面还是sql+业务数据敏感性) 中车:全是群面 一面: 自我介绍 家庭有无对象发展城市有无offer ¿(有些我忘了) 二面: 对中车有什么认识 花最多精力的项目是啥 特长爱好 ¿(有些我忘了) #你
数分面试,如何分析业务场景类问题 - 🌈哈喽,今天继续干货分享~ - 在滴滴数据分析岗招聘中有一个这样的面试题:给到一个业务场景问其中的数据如何去分析,如何去落地? - 📌很多小伙伴习惯于数据库里有啥字段就用啥,不区分场景,不打标签,结果自然分析不出东西。比如本例(问题在首图里),很有可能原始数据记录,就是有XX个已发布的视频,有XX人观看,有XX观看的人报名,没了。不深入思考的话,很有可能倾
一面: 主要还是挖简历 自我介绍 问项目经历,聊聊过往开发的项目(聊了很久) 聊聊MySQL的事务 细聊ACID 隔离级别 innodb默认级别 innodb的底层数据存储 对比mysql和hive kafka为什么吞吐量大 场景题目:100个G的文件,保存用户id和看的bookid,求top10阅读量的书 反问
现场面试的,要去接待处用身份证换出入证才行(里面真是太好了,各种环境设施真的好好) 面试官三个,人力一个,主管一个,还有一个职位不明确。 1.自我介绍 2.项目经历细节 (反思:对以往比赛项目不太了解,应该多了解) 3.最喜欢的一本书 (说的《大战拖延症》,然后被追问两方面看待问题,拖延症有什么好处,有什么坏处, 实诚的回答目前还没发现好处,然后被追问比如什么不好的后果) (反思:没有准备此类问题
#软件开发2023笔面经# 前段时间投了4399数据分析方向,本来是15号晚上七点的笔试,忘记参加了顺延到了16号上午九点,内容比想象的多,有十个选择题,涉及面很广,数据结构问时间复杂度的,操作系统问概念的,计算机网络ip结构也问了,java代码也考了,10个选择题,我感觉还有点难,然后有简答题三个,编程题三个,职场题两个,一共两个小时。 简答题有说出代码错误的,写sql语句的,SQL优化的,呜呜
投递+约笔:半个月 时长:2h 形势:HackerRank 外企的coding笔试基本上都是用的HackerRank,但题目基本上刷不到只能自己平时多做做题培养coding思维。 一共考了两道编程题,合计两个小时。 Q1:股票分红,输入 股价 分红 时间 输出 现股价 Q2:动物表演,找某个时间房间内的最大动物 题目本身没有涉及到多难的算法,核心难点在于—— 必须是stdin和stdout输入输出
自我介绍 3道sql:分性别求工资第二——排序窗口函数 行转列——sum+case...when或pivot+sum 忘了 python:查看df分布、df空值情况 统计:abtest的双总体比例的假设检验(方差公式,大样本n>30) 机器学习:kmeansk的选择 决策树(信息增益,信息增益率区别,基尼指数) 数据无量纲化(归一化,归一化的优点,什么时候需要归一化,决策树不需要归一化) 业务:销
#软件开发2023笔面经# 这个谈不上面经吧,毕竟当时抱着试一试的心态投的,然后笔试以为是考行测的内容,结果考了三个还是四个sql的代码题,因为我自己主要用python。sql就是学了,写了实验报告后就没用过了,然后一点也不记得了,其实现在回想起来题目不是很难,就是里扣上那种基础题,主要怪我没准备sql,交完一个题都没写出来。但是会sql的可以试试,我面试肯定是没戏,就这sql水平,唉,太难了,慢
感受还不错 和我一起的小伙伴都蛮好的 大概就是图上这些内容 开始有点紧张了自我介绍一般 后面小组讨论还可以