一轮技术面 已oc 自我介绍 数据倾斜 工作中遇到不会的技术栈怎么办 和业务方沟通的case
一面: 自我介绍 专业主修大数据什么方面 hadoop有什么组件 数仓分层有那几层各自有什么作用 等等常见的问题 手撕sql编程,见过,应该是利扣的,想了半天差点没想出来,中等难度? 面试官人很好,不紧不慢不会催你 我慌的一比 一共三面,等待后续更新 #面经#
美团平台-美团平台技术部 1h 3.29 1. 自我介绍 2. 项目难点 3. Netty有哪些应用场景,可以做哪些事情? 4. 选择Netty的原因(Netty的优点) 5. Netty中的EventLoop了解吗 6. 数据库表结构设计:美团打车场景,乘客打车,发出自己的订单,司机接单,司机有一些车辆(说的范式建模) 7. 维度建模了解吗?如何设计 8. 打车场景,乘客发布订单,对应司机接单,
二面说是30分钟,但实际要面45分钟,希望能过 1. 自我介绍 2. 看你写了对数据结构和算法比较了解,说一下 回答的链表 树和图,还有常用的堆 红黑树 LRU 跳表 3. 那你比较一下红黑树和跳表的优缺点 4. 哈希表了解多少 回答的C++中的map unordered_map 比较一下他们的区别,原理 空间复杂度 5. B+树了解吗,为什么MySQL中使用的是B+树而不是红黑树 跳表 6. 写
30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of
(被捞起来重新面) 总共40min 手写模板方法,责任链模式(项目中的) spark和mr有什么区别,为什么spark比mr快 磁盘和内存 有有向无环图的这些优化 什么更优秀呢,什么原因导致比mr更快(不知道) spark里面,checkpoint和cache有什么区别,分别用于什么场景(场景完全忘记了) 数仓是怎么分层的 什么是业务过程(不知道) 事实表设计的步奏是什么(不知道) 三范式建模和维
为啥官网上写着java 数据库,结果面试全问我C++,这几天看的数据库都没问啥 30min 1. 自我介绍 2. 说一下Linux和常用命令,线程和进程的区别 线程和进程的本质区别是什么 3. Linux如何查看是哪一个进程占用率指定端口 4. C++了解到什么程度 5. C++中的const和底层const 的区别 fun(int i) fun(const int i)有什么区别,编译器怎么看
一面 聊实习 数仓怎么分层 为什么要分层 sql 连续登录天数最多的用户 窗口和聚合函数的区别 mr和spark对比 还有些问题不记得了 应该寄了,莫名紧张,发挥太差了 #面经##滴滴#
状态最不好的一次,面试官说话温温柔柔的我本来中午就没睡感觉快要睡着了 腾讯会议,对方没开摄像头(整个屏幕都是我的脸) 自我介绍 然后问了对数据开发的了解 数据建模、数据分层 然后就开始共享屏幕写sql(本来让我写hive sql,我说我不会) 三道题,写的稀碎... 主要是问题的逻辑我理解不了,再加上自己sql写的没那么熟练,在加上我真的好困啊 然后写完了 他就和我说,多练练sql,别搭虚拟机框架
就面了十几分钟 面试官说我更适合去做算法 1.实习经历 2.数仓和数仓建模的理论知识(我说了维度建模 范式建模 问知不知道维度退化 不知 3.SQL:怎么找A表有B表没有的数据 数据倾斜怎么处理(不会 #发面经攒人品#
顺带分享面经 9.05到家一面: 自我介绍 实习相关 画像表和指标维度表的区别 标签体系 数据结构基础。dag如何排序 算法,删除链表重复元素 9.18美团平台一面: 数仓分层 spark任务提交 数据倾斜,如何处理 数仓好坏 开发完成之后如何做数据验证,如何确保是对的 反转链表 9.20二面: 学校 实习 在实际工作中对数仓理论的认识 如何对订单数据建模,考虑哪些维度 任务跑得慢怎么分析 如何估
一面 经典的自我介绍 我看你实习经历挺多的,你挑一个项目讲讲看吧?我希望听到的是背景,目的以及你做了什么 balabala 嗯嗯,这么看我了解你的业务背景了,那你觉得你项目的目的是什么呢? 我:balabala,为了看a,b,这几个指标 拆解之后是看这些内容,但是主要是为了什么呢?是不是为了提升用户的体验 (面试官真的一步步引导) 再说说你做了哪些表吧,涉及到哪些层?有哪些比较重要的指标。 bal
#软件开发笔面经# 1、自我介绍 2、面试官:你倾向于数仓还是数开。我:实习做的数仓,所以更倾向于数仓。面试官:好的,我们是做后端开发相关的 3、说一下实习期间做的工作 4、介绍下你的第一个项目 5、了解过zookeeper吗 6、spark中dataframe和dataset的区别 7、简单说一下kafka是干什么的,消息能保证全局有序吗 8、了解容器吗,docker和kubernetes 9、
1.挖项目 2.jvm垃圾回收 3.找问题,String类型循环内使用+= 4.mysql 聚簇索引和非聚簇索引 5.hashmap原理 6.索引数据结构(b+树),特点 7.hive数据倾斜 8.hive mapjoin ,bucket map join ,SMB join 9.flink watermark 10.flink checkpoint. 三种分布式快照算法 11.flink 状态
1.自我介绍、成绩排名、读研计划、奖学金、是否挂科、有无数模竞赛经历 2.介绍项目,数仓设计中主要考虑的点 3.开发用的语言 4.项目数据量多少,报表用什么软件做的 5.实习工作介绍,dqc怎么用的 6.实习最难的一点是什么 7.机器学习和深度学习了解吗 8.python常用的包 9.rdd和dataframe和dataset的区别 10.hive查询过程怎么优化 11.你的性格在工作中的优势 总