时长:28min 1、自我介绍(说了实习期间做的工作,主要是做数仓) 2、面试官拿着简历开始问,问着问着我发现不对劲, 我:“您好,您是不是拿错简历了?”, 面试:“你不是XXX吗?” 我:“不是” 面试官:“稍等,我找一下,你继续说你的”。(我又把做了一遍自我介绍) 3、你说一下你在实习期间做的工作。。。(又说了一遍实习工作) 4、你说的都是业务上的问题,有没有技
1.自我介绍 2.介绍和数据相关的项目 3.深入探讨项目 4.左外连接(口述他提供的场景结果) 5.你的数据表中常用哪些索引 6.查询和索引是有关的吗 7.优化慢查询 explain 看哪些信息?实际操作过吗? 全程就是索引相关的问题,和看到的完全不一样,准备数仓的概念都没用到
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸
最喜欢的一种面试方式,全程问实习和项目。 1.自我介绍+技术栈介绍+实习介绍+难点介绍(第一次做了十多分钟的自我介绍) 2.你的难点为什么不用oltp引擎解决呢,应该多拓展一下oltp的宽度(针对oltp讨论了快⑩分钟) 3.bitmap详细讨论 4.用户怎么使用你们的数据产品 5.实时了解吗 6.base地只考虑武汉还是都可以 许愿hr面 #数据人的面试交流地#
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
#软件开发2024笔面经# 1说说你对数仓里分层的理解,越详细越好? 2说说你对数仓里数据建模的认知理解,越详细越好? 3之前做过数仓么? 4请简要说明什么是数据仓库,以及它与数据库的主要区别。 5列举几种常见的数据抽取、转换和加载(ETL)工具,并简述其特点。 6如何处理数据中的缺失值?请举例说明至少两种方法。 7讲一讲你对分布式数据处理框架(如 Hadoop、Spark 等)的理解。 8在大数
1.自我介绍 2.介绍项目,数据哪来的,数据量级,数仓模型,曝光率怎么算的 3.难点介绍,随spark版本变化会不会有一些函数不适用 4.bitmap的JAVA实现,哈希冲突怎么做的 5.数据倾斜介绍 6.除了数据倾斜,还有哪些优化手段 7.开窗函数 8.udf用过吗 9.JAVA实现过什么项目 10.sql:去掉一个最高分去掉一个最低分求用户平均分 很常规的一次面试,没什么好细说的 #数据人的面
第一题:吃糖果xx值大于等于x(二分答案) 题意:给一个长度为的数组代表个糖果的幸福值,一天可以吃任意个糖果得到幸福值其中不代表下标,吃的顺序可以任意。 现在求至少吃多少天可以得到至少的幸福值。 思路:不难发现答案是线性的,存在一个分界天数使得达到这个分界后都能达到,因此使用二分天数。我们可以贪心的认为对于幸福值大的糖果尽量在每一天更早的吃。即先对降序,每次都长度为累加(我直接累减,这里可以用前缀
7.29号--一面 一个小姐姐面试 自我介绍 1.点赞幂等如何保证? 2.分布式学了什么? 3.分布式解决什么问题而提出来的? 4.做分布式有什么麻烦?需要考虑把服务拆成微服务,那么维护,设计需要考虑什么问题? 5.分布式服务数据之间的流通?(这一部分分布式确实不知道回答什么 -。-,看我不太了解分布式果断终止话题,换其它) 6.spring框架用到了什么底层思想,如何实现的,有用到哪些比较
抖音 对c++的内容是真不熟,反复拷打指针问题。。 一面 hashmap 扩容方式 面向对象的特点,优劣 进程通信的方式,优缺点 c++的智能指针,野指针 堆栈的区别,优缺点 数组和指针的区别 计算机网络模型 视频采用什么协议 c++的编译过程 10.内存溢出和内存泄露,如何排查 11.垃圾回收机制如何设计 12.手撕: **42.接雨水 #二面 常规的计网相关的一些协议,osi分层,各层的协议功
3.21约一面 3.29一面: 主要问Java八股以及Spring框架八股,concurrentHashMap的底层实现,@Autowired注解冲突,ArrayList和LinkedList的底层实现。一道算法题Leetcode490迷宫,结束后大约五分钟约二面 3.31二面: 问了点Java基础,String,StringBuilder和StringBuffer,@Spring Boot Ap