40min 面试体验感超好,德子好感+1 Spark sql了解吗?Dateframe 是啥(不会) 项目里数据怎么拉的? Flume+kafka+flume+hdfs 有什么过滤器吗?:3个flume拦截器 判断文件类型+时间戳过滤器+落hdfs小文件检测 数据量:千万 flume拉取时间是多少?(不会,瞎编的10分钟有兄弟了解吗) Spark小文件怎么处理 Kafka 的整体结构:broke+
面试问题: 1. 从8个外观相同的球里找出质量不相等的球。器材:一个没有砝码的天平;要求:几次称重后肯定能找出来。 2. 在离散的二维平面图形中,面域由三角形组成,用数组存储每个三角形的顶点,如何找出处于边界上的边; 3. 智能指针的作用和原理;
Timeline: 8.27 投递 8.30 笔试 9.15 HR面 9.26 技术面 10.9 offer 9.15 一面 20min: 1.对互联网公司加班的看法 2.有考研计划吗 3.为什么投多益 4.喜欢游戏吗 5.评价父亲 6.家里的情况 7.实习未转正原因 8.如何看待军人的天职 9.看重公司哪一方面 10.能否提前实习 11.是否单身 12.主观题是否是自己写的 9.26 46min
1、自我介绍 2、数仓怎么自学的 3、整个项目架构说一下 4、数据域是什么概念(提到了数据类型),那如何界定数据类型呢 5、总线矩阵构建过程 6、dwd层怎么设计的 7、了解业务过程这个概念吗 8、分域的话,在dws表中有没有可能会跨域(举了个互动域和活动域的例子),结果告诉我这样的话你的互动域设计的其实是有问题的(挖坑给我跳,悲) 9、星形模型和雪花模型 10、缓慢变化纬为什么用拉链表,他说他第
题主背景:对计算机基本上一窍不通的半个数学人。 题主在面试屋外等候时,工作人员问题主昨天是不是来咨询过(昨天校招宣讲),题主点头,工作人员又说,“你的简历我们印象非常深,我们今天主要是偏后台开发的,你先跟后台开发的一起面试,之后有其他部门想要你了我们再推你走哈”,题主此时还没有感受到不妙…… 数据结构:首先提问数据结构,问树的结构掌握哪些,如何用Java实现一个哈希表,链表结构有哪些。 数据库:询
1.sqoop底层是怎么实现的 2.shuffle调优 3.数仓和数据集市的概念 4.数仓分层,各个层是做什么的 5.维度退化,为什么要维度退化 6.HDFS上文件用什么存储的,ORC底层是什么样的 7.sql,求TopN 8.从一个数组中求第N大的数(先手撕了一下快排,然后面试官问有没有更好的答案,然后说了一下用堆的做法) 反问 整体面试三十分钟左右,感觉是寄了
介绍项目20min 关系数据库和数仓有什么区别 数据集市、数仓、数据湖区别 数仓建模维度以及常用方法 举例说明三范式关系 介绍Hadoop工作流程以及常用组件 数据结构和算法太菜就没深入问 最后反问 总结:总面试流程不到四十分钟,面试官人很好,给了一些建议。 转行太难了!
8.1一面(共50mins) 1. 项目中用的索引 2. 索引八股,主键索引、二级索引、联合索引(好处,场景题判断能不能用到) 3. B+树好处,如何进行范围查询 4. 项目的分库分表,怎么优化 5. redis使用场景,缓存一致性 6. kafka,作用、架构、消息顺序 7. websocket和http 8. 各种排序算法时间复杂度,最坏情况、平均情况、稳定性 9. 链表和数组各种操作时间复杂
#百度面经# 个人情况:23届,211硕,大数据开发,数仓,入职即被裁,找工作ing... 今天面试了百度搜索的数据挖掘岗位,面试官超级nice,先大概讲了岗位情况,问下意向,由于我之前想的最长远的发展路线就是先搞底层技术,再搞分析,最后能转挖掘的话更好,就说还OK,就接着面了,一共五部分 1. 统计学 早还给老师了 2. AB实验 只听过名字 3. 机器/深度学习 知道的太基础了,没法应对面试
自我介绍 实习项目介绍 对这个岗位的理解? 平时都是怎么学习,看书和github源码吗? 为什么要开发这个工具?是重复造轮子,现有的不行吗?出于什么背景? Java异常分类? Exception又分成几类?有什么区别? 捕获异常用什么? error能捕获吗? 介绍一下Java的垃圾回收机制? 都有那些垃圾回收器? Java源码看过吗?介绍一下HashMap吧 了解那些Linux命令? 写一个Lin
1h 面试官感觉是个大佬级别人物,battle了40min毕设,理解了项目的细节 sql20min,求某天每个城市所有来访者的人均浏览内容点击量 1.顺带问了timestamp定义细节 2.timestamp和date为什么需要同时存在 3.优化,本身机制优化 4.优化,谓词下推 5.优化,聚合函数结合律子查询下推 反问前辈对大数据的理解
本硕211,c++/go,无论文无实习,项目:tinykv+15445+6.s081,leetcode100多道 4.24 快手一面: 1. 项目介绍 2. mvcc多版本并发控制 3. 操作系统内核中断处理机制 4. malloc实现原理 5. free实现原理 6. 介绍15445中锁管理器的实现 7. 读写锁的饥饿问题 8. 虚函数如何实现 9. 虚函数表如何存储?存在哪里?如何验证? 10
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
火车票业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、聊实习,扣细节 3、聊实习项目技术难点,聊到了我用later view遇到的坑,面试官直接激动,并表示他前几天也碰到了这个坑,两边都很惊喜,直接惺惺相惜 4、聊竞赛经历,内容以及遇到的难点 5、开始八股,写吐了,这里就省略了,要看的看我之前的帖子 6、sql题,是啥忘了,难度中等吧 7、反问 二面 主管面: 1、自我介绍 2、
一面(技术面) 自我介绍 hadoop架构 namenode的功能,对namenode影响最大的计算机资源 介绍一下hive 宽依赖,窄依赖 写过复杂sql吗,介绍一下 sql分组过滤 java的hashmap c++和java的区别 介绍一下hbase 数据库三范式 二面(hr面) 自我介绍 为什么选择中移互联网 了解中移互联网吗(这里尬住了,压根不了解) #中移互联网##数据研发#