这次是真面爽了,50分钟,没算法题,没问项目和实习 对方是个架构师, 开局看我的博客,看到我的博客有架构设计的知识,问我对高可用架构的理解,对方说感觉我有些紧张,说一面我面评很好,这次面试是来决定定级是S还是A的,哥们直接原地高潮,人都支棱起来了,直接正襟危坐。 1.架构设计的top3是什么? 2.你觉得高可用架构设计的top3技术是什么?后面他说了他自己的理解,哥们直接追问拷打(你说的限流是怎么
面试官比较看细节,遇到不确定的会反复让你确定 1.自我介绍 2.问项目和实习 3.项目架构 4.如何确保kafka的消息不重复读(答了offset和ack机制,但是ack记成消费者的ack了,估计寄) 5.kafka的主题 分区 分块的概念 6.flink的checkpoint机制 7.手撕 二叉树非递归遍历 8.Java中线程安全的集合有哪些 9.线程不安全的例子,能举几个吗 10.反问 总结:
一面 自我介绍 讲一下上一段实习做了什么? 怎么做建模的? 有遇到什么数据治理相关的问题吗? 怎么做的? 讲讲你做的需求开发?实习期间具体产出了多少内容? 你怎么跟上下游沟通的? 怎么学习数仓内容的? 如果有什么需求排不过来,你会怎么处理? sql题,求每个用户类型下,下单数top100的用户。 反问 一面感觉答得还不错,面试官态度也比较好 二面 开局定在11点30就感觉很不对劲了 经典自我介绍
🕒 岗位/面试时间 数据开发 9.14 自我介绍 项目拷打 一道场景题(数据库建表问题) 手撕:重排链表 我以为是排序链表,写了半天没写出来,最后发现原来是看错题目了😭 更新:当天已约二面,手撕没出来也给过了没想到!
🕒 岗位/面试时间 运营开发 20min 上来看我没有实习经历,问我场景题,权限管理怎么建立数据库表格,没怎么接触过,不太会,后面看我不会,就提前结束面试了。 面试官也不是搞Java的,还说是搞全栈开发的。 能不能别捞我这菜鸡,我还是鸽小红书的笔试来面试的,浪费时间。
一面 实习深挖 聊数据治理(链路、模型、作业) spark作业调优具体案例 数据质量评价体系,如何保证数据质量 全链路数据建模怎么做 指标设计方法 数据结构有哪些,分别有什么作用 计网各层都有什么协议,分别有什么作用 mr和spark区别 shuffle原理 MySQL索引有哪些 MySQL索引数据结构 数据倾斜解决办法 算法 前k个大数 SQL 1.薪资TOP3 2.各个部门入职最早的员工 #美
1.十分钟自我介绍 2.项目最难点和最有技术的点 3.一句话总结你的问题解决方案 4.一句话总结你的项目的价值 5.手撕:合并k个有序链表 6.问机试题目思路 大部分时间在写算法,感觉面试官对大数据相关的技术栈不太感兴趣,问大数据相关问题就像走过场一样,最后也没有反问,emmmm有点难评 #数据人的面试交流地#
面试时给的SQL题 1.有个无忧达人开的店铺,每个顾客访问任何一个店铺的任何一个商品时,都会产生一条访问日志 访问日志存储的表名为vsit,访客用户id为user id,被访问的店铺名称为shop。请统计每个店铺访问次数top3的访客信息。输出店铺名、访客id、访问次数。 2.现在只有两个字段工号,姓名,请你在原有数据不动的情况下,标记这个人是否出现重名情况,并把其余重名的人的工号(要去除自己的工
1.自我介绍 2.项目内容:背景,uv,pv,功能,项目人数,分工 3.数仓的设计思路 4.分层数仓和使用普通数仓的区别 5.为什么ods不直接对接app层,有没有考虑过增加一层数据集市层 6.项目用了哪些技术栈 7.hdfs如何保证高可用 8.hdfs写入数据流程,写入过程中datanode挂了怎么办 9.小文件原因,危害,解决方法 10.数据倾斜介绍,数据倾斜如何排查 11.spark的两种s
timeline 到家 8.21 一面 寄 介绍项目,问了问不多 1.InnoDB和MyISAM的区别 2.MySQL有几种索引 3.MySQL索引的实现方式 4.数仓分层体系 5.指标体系 6.数仓的建设流程 7.维度建模和范式建模 8.星座和雪花模型的异同 9.Spark的执行过程 10.RDD包含什么 10.Task Job Stage的关系 11.Worker Driver的关系 12.怎
一面 1.自我介绍 2.实习经历介绍,负责的项目模块,有多少张表,为什么要做这些表,涉及哪些方面的建设 3.对业务的了解,是你和需求方直接对接吗,参与过砍需求的过程吗 4.模型设计到最后交付的数据开发全流程,有没有中途变更过需求,最终有多少个指标和维度 5.你怎么把这么多维度放到一张表里面呢,oltp引擎怎么样使用的 6.指标都是可以累加的吗,有没有想过把可加的和不可加的指标分别放到不同的表中 7
感觉自己和快手的相性不是很好,每次都和面试官不和,感觉应该是无缘快手 1.自我介绍,大数据组件是自学的吗 2.工作内容,定位,成果介绍 3.前期调研也是你做的吗,怎么调研出的指标体系,耗时多久 4.复购率是几日复购率,为什么选择这个天数不选择15天,你这个调研不够深刻,调研他的打法和业务目标不才是第一步要做的事吗 5.有多少个维度和指标,为什么用grouping sets不用cube,介绍coun
问项目 根据项目问了一个sql如何写 聊七聊八 20min 挂了
1.自我介绍 2.项目细节介绍 3.针对一个指标讲讲你整个链路怎么设计的 4.数据交付时数据质量如何保证 5.如果现在调度的表都是高优先级,你这个表延迟产出了,怎么办 6.hive架构介绍 7.hive优化器会做什么,详细讲讲谓词下推 8.小文件产生原因,危害,解决方法 9.spark遇到的挑战 10.实时了解过吗 11.你们公司的数据链路,数仓分层是怎么样的 12.数据怎么采集的,binglog
1.transfomer底层 2.用户分级进行优惠促销 如何做 3.F1值含义 4.手撕sql 5.掷硬币的数学期望