一面: 1.自我介绍 2.数仓分层 3.来了新的业务怎么建模 4.选用的什么模型,有什么考量 5.如果现在一张事实表一对多一个维度表,此维度表又一对多一个维度表,怎么设计模型 6.实习过程中用的什么计算引擎 7.spark UI会看哪些内容 8.数据倾斜问题怎么解决 9.介绍一下项目 10.为什么有的指标在下沉的时候要拆开来 11.SQL调优,讲一个具体的例子 12.SQL题:求中位数 二面: 1
时间:一个小时 数据采集通道的搭建要用到什么能力 离线数仓项目几个人,后端做啥 datax和sqoop的区别(应用场景上的区别) maxwell的底层原理是啥 怎么理解mysql的主库和从库 主从延迟比较严重对数据的影响 数据量级,条数 在日志采集项目中有什么收获 这块是新开发的还是迭代的 现在数据采集已经封装很成熟了,那做数据采集对后面数仓开发有什么优势吗 hive中内部表和外部表怎么转换 多张
没想到实习的第一面给了团子,记录一下: 1.面试官上来直接介绍业务:美团金融,负责借贷、理赔的,对这个挺感兴趣 2.发散:说说大数据和计算机专业的区别 3.谈谈对chatgpt的理解 4.介绍一下自己的项目背景(尚硅谷电商离线数仓) 5.两阶段聚合是怎么解决数据倾斜的 6.拉链表如何解决维度缓慢变化 7.数仓的分层结构 8.数仓的建模流程 9.如果产品给了一个用目前技术无法解决的问题,该怎么办?
1.实习经历拷打 2.项目拷打 3.数仓分层 4.sql:连续登录 已OC
一面 实习介绍 设计过哪些数据指标,这些指标的意义 项目介绍 具体分层怎么做的 表怎么设计的 对数仓和数据湖的理解 连续登录3天的用户 问的太少了,估计没想招我 #面经##大疆#
1.问实验室和导师情况 2.HDFS架构 3.HDFS怎么保证数据一致性的 4.两个栈模拟链表 5.两阶跳台阶 6.n阶跳台阶 7.项目里面OOM遇到的问题和解决办法 8.Xms和Xmx参数大小限制,是否要一样 9.大数据下有没可能出现OOM的问题 反问 1.快手数据湖湖仓一体的情况 2.从头设计流引擎一般需要注意什么
个人情况简述:本硕双非,acm银牌 群友(cpp实习生)内推投递 因为是之前面的,时间也有1个多月了,可能记不太清一些细节了 一面(总时长90分钟) 聊简历项目,一个离线大数据处理项目,flume+hadoop+hive+spark+azkaban,两个后端项目 项目扣细节,主要问设计思路,比如数仓各层的设计、flume和kafka之间如何结合使用,spark的算子等 项目一共问了40多分钟 接下
前面的IEG秒挂后2天被这个部门捞了,这几天准备了下算法,但是项目有点懈怠了 时间:3月11日 14:40 ,时长45分钟 全程拷打Java项目,掺了一些业务相关的八股 拷打查询优化细节: 因为项目亮点手贱,写了用Redis缓存优化前时间、优化后时间。结果疯狂拷打怎么得出的优化时间 其实是编的数据😭😭,引以为鉴!! ⭕查询时间是怎么测出来的? 肉眼对比效果 + 查询前时间 对比 查询后时间 ❌
一面(11/3) 自我介绍 拷打项目 然后问了一个Flink反压的问题 二面(11/10) 自我介绍 拷打项目 问了前端展示大量数据,如何考虑?(可能大佬就是前端的) 问了用了哪些数据库? 问了Kafka 和 Flume 的应用场景? (可能时间比较紧张,所以问的比较急,二面没有遇到反问环节了)
1.hashmap底层数据结构 2.virtual的使用场景,虚函数表 3.设计模式 4.多线程同步的方法 5.三次握手 6.智能指针有哪些,如何设计一个share_ptr? 7. vector是如何实现的,和list相比有何优缺点? 8.想问我网络编程方面的,我说不熟悉,跳过了…… 9.c++ 源文件到可执行文件的过程 9.多线程适用于那些应用场景? 10.stl哪些容器是线程安全的 11.补充
#互联网公司爆料# 58笔试通过但面试没有过,面试我的人首先问的还是数仓建模,我当时这方面还是刚学,不是很懂,问的建模细节还是不会,直接挂了,但整体还是可以的,薪资估计16起步吧,双非本科估计就是最低的白菜价
介绍自己,介绍项目 实习公司数仓的分层,优缺点 实习期间遇到的困难,解决方案 维度建模的流程 怎么理解数仓是反应历史变化的集合的 实习时用的是什么任务调度工具 结合谷歌的三篇论文谈谈对Hadoop的理解 对YARN的理解 了解实时吗 反问,无手撕
Java的设计模式 100g的数据在小内存里如何排序(spark) Spark为什么比mr快 Hbase的适用场景 Hbase为什么快 和Clickhouse一样的数据库 Clickhouse底层数据结构 Clickhouse为什么快(很细) 两个sql(难度较大) Hadoop的高可用触发后,会发生什么(面试官说不要背八股,详细说里面的流程) Flink水位线 激活函数有哪些(sigmoid,r
timelime 9.5投递 9.13一面 9.17二面 9.19测评 10.7 21:00 收到意向邮件。 ---------------------------------------------- 防定位,面经先匿了。 #晒一晒我的offer##天翼云##大数据##秋招##国企#
总时长30分钟左右 1.自我介绍 2.大数据学习过什么技术? 3.数据工作有哪些岗位? 4.写一个二分法 5.一道sql,从表中提取出所有课程分数大于90的学生id 6.最近在学什么新技术? 7.进程和线程的区别?哪个开销比较小? 8.tcp和udp区别 9.职业规划 10.反问 总结:最近看测试内容比较多,对于大数据了解不多。面试官态度挺好,还要补的东西有点多我,sql都没写出来。找工作找得失去