30min 自我介绍 项目介绍 项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用,具体 是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程,写到一半client发生OOM之后该怎么办,datanode宕机怎么办 怎么实现nn切换,而客户端无感的 Spark提交作业的流程 Executor内存管理,分别存储什么 spark shuffle有哪些,讲一下
1. 你觉得数据分析师应该具有哪些能力? * 首先是硬实力,SQL、Excel、PPT等分析数据和展示数据的工具需要会 * 其次是软实力,当我们通过数据分析获得到洞见后,需要向别人展示,说服别人接受我们的建议 2. 你过去使用过哪些图表来直观的表达你的观点?聊聊你在案例大赛的经历就可以。 * 使用频次最高的是柱状图和折线图,可以表现事物随时间的波动趋势 * 其次是散点图,可以用两个维度给事物排名
9.19号 录用通知 - 9.13号性格测评 - 9.9号一面 一直等待进面试,场控30小时才开始 三个面试官 群面 1.自我介绍一分钟 2.为什么工作后考研 3.项目提问 4.大数据项目中的项目架构 5.flume拦截器思路 6.算法归并排序思路 7.家人情况 8.未来职业规划 问的都比较简单,不难 搞了个23届湖南联通数科群,私我进#湖南联通##联通数科##大数据开发工程师##秋招##面经#
40min 1面 自我介绍 项目介绍 做题:一道算法, sql2道 数据库索引有什么用 索引失效的情况 spark提交作业的流程 spark 共享变量有哪些 广播变量怎么实现的 hive外部表和内部表区别 hive优化,项目中使用到了哪些,展开讲讲 kafka是读写分离 为什么不做读写分离 mysql事务 40min 2面 自我介绍 项目介绍 算法题(20min) hard plus 没写出来最优
9.13 达梦数据库 一面 1.自我介绍 2.Java最新版本? 3.Java为什么能够跨平台,字节码好处 4.Java面向对象特性 5.Java基本数据类型 6.static关键字 7.反射作用,优缺点,场景 8.String不可变原理 9.字符串常量池 10.如何破坏String的不可变性 11.StringBuffer和StringBuilder区别 12.HashMap底层原理,扩容,为什
一面: 面试体验满分,字节面试官会引导你回答问题 虽然是数据分析师面试,但全程都是在聊业务,没有手撕sql,sad 业务主要分为在实习期间做的业务,指标体系搭建 1.平常喜欢用的app有哪些?优缺点? 我说的抖音和小红书,其中谈到两者推送单双列的区别 2、详细展开说明单双列的优缺点 3、抖音如果从单列转双列的劣势 老用户习惯改变、广告变现、封面成本设计 4、搜索功能好坏的评估 用户点击搜索渗透率、
京东数据分析一面凉经: 自我介绍 实习经历(因为之前在京东实习过,特地问了这个) 未来的3-5年规划,如何努力 讲讲具体你在某个项目中的提出的建议。这个答得不好,写好的东西都忘了。 提问环节。这个面试官因为我在京东实习过,所以回答的比较简洁,然后就说后续等通知就好。 估计是凉了
1.先自我介绍 2.然后介绍实习,之前的实习做的是离线数仓开发,聊的时候感觉面试官不懂数仓 3.那就做题吧 第一题 剑指 Offer 19. 正则表达式匹配,我知道是原题,也知道我面试必定做不出来,就直接说我不会 第二题 124. 二叉树中的最大路径和 ,虽然之前刷过,但完全不记得了,做的时候感觉完全是新题,直接中序遍历按最大连续子序列和的思路求了一个结果,面试官说是错的(当然事实上也确实是错的)
了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
一面 38min 有序数组,求target的index(二分) 求name重复次数大于3的人的信息 对每个学生按照成绩进行排名,并标注rk, 这里我把是row_number,rank,dense_rank都说了一遍 spark的任务提交流程 索引的原理(有没有老哥有具体的博文解析啊,感觉这个一直答不好) hive如何阻止数据倾斜 kafka可以读写分离吗 为什么不可以 二面 (凉面)20min 为
一面(2023.9.15) 11点开始,11点41分结束 面试官很和蔼,不过周围有点吵。(面试官叫王xx,我不太记得了,人挺好的) 自我介绍 实习项目介绍(我这真是面出经验了,只要你项目他不感兴趣,接下来就是八股时间) 学校里有什么课程 八股问的多到离谱,总共就30分钟不到,全八股。 int和Integer有什么区别? Integer(200) new 两次,他们是一样的吗? valueOf方法介
timeline: 2.21 投递 3.8 笔试通知 3.10 交付笔试 3.10 约面试 3.11 面试 3.11 oc 3.15 offer JD: 1.在金科、信贷、保险、理财等领域协助开展行业研究、竞品追踪、案例分析等一系列分析研究工作 2.协助进行业务经营数据的统筹收集、数据分析和管理层汇报材料准备 3.参与公司重点业务规划与管理,协助进行重点战略项目管理与进程把控 4.负责部门交付的其
投递的岗位是大数据运维开发工程师 面试官人很好,是个话痨,整个面试过程很轻松。 首先是面试官的自我介绍,以及部门情况,业务职责(运维 开发 46)。 然后是我的自我介绍,面试官就在旁边看我的简历 然后就是纯八卦聊天,家乡啊,职业规划啊,谈没谈恋爱啥的,氛围很轻松。 然后看了简历问了些技术问题 spark RDD的血缘关系,shuffle Hbase的列族 然后问了些偏运维的问题 apache ha
记录一下宁德时代-数据分析工程岗的面试流程: base 厦门的“时代电服”子公司 投简历:2022-8-11 一面:2022-9-14 1、自我介绍 2、最有成就感的项目是哪个?为什么最优成就感? 3、本科和研究生里面最喜欢的科目是什么?为什么? 4. 介绍一下Kmeans的原理(我提到用python做聚类分析,面试官顺着问了) 5、为什么选择制造业的公司?选择工作地点有没有考虑过? 6、反问
一面: 1.简历深挖,两个实习经历➕一个项目经历 2.由简历项目中的问题延伸到业务问题,比如,DAU 在某一天下降,如何找原因;给项目中提到的小程序设立关键指标;小程序中某个功能点的优缺点 3.介绍具体AB test 的流程 4.在工作中,最不能接受的事 5.反问环节 二面: 1.介绍一个与数分相关的经验,借此深挖背景,过程,产出,待优化点 2.平时使用哪个产品;大概介绍下抖音的特点 3.抖音需要