研究生学的机器学习,结果今年算法岗全军覆没,倒是开发岗被捞了。由于是三个多月之前的面试,有些问题记不清了,特此抱歉。 23.11.30 一面 自我介绍 JVM的组成,垃圾回收机制 MapReduce的流程,Spark与Hadoop的优劣 快速排序的原理,是否是稳定的(估计是前面答得不太熟,太久都忘了) BEV的原理和流程(简历项目) 笔试第一题的思路 手撕(只记得是一道滑动窗口的题,用两层for就
腾讯会议一面(30分钟) 自我介绍 项目介绍 数据如何采集,整个流程叙述一遍 项目难点说一下 两个项目的区别讲一下 数仓分层里面的表叙述一下有什么 分析一下两个事物之间的关系,怎么分析(有点抽象的问题),有什么经验
1.自我介绍 2.项目介绍 3.对着项目问了些简单的组件八股文,,没记住 4.java 集合类底层实现,ArrayList 锁原理 syn 可重入锁 追问syn的底层原理(忘了) 递归函数套syn会出现什么情况 线程池参数和过程 5.操作系统 线程进程内存关系(我excuseme,不一般问协程吗,还能问内存??) 线程间除了锁以外其他通信方式 为啥有进程了还要有线程 6.计网 输入URL的过程 长
字节整体给我的感觉是不怎么问八股,他们非常想听你的理解是什么,问的很多问题网上都没有答案,高度都很高。 一面(2023.3.22) 自我介绍 为什么选择从全栈开发转到大数据,为什么会对大数据感兴趣 有学习过大数据的一些技术栈或者项目实战么 狂问项目(国电的,问的极其极其细) 问了电商数仓项目(大概介绍了一下维度建模) DWS层都是什么类型的事实表(不知道怎么答,感觉问的很奇怪,就直接答了事务型事实
1、 目前研究的项目,对数据的处理? 2、 你怎么理解数据挖掘? 3、 平时用啥数据库? 4、 3NF? 5、 深剖数仓项目 6、 讲一讲项目? 7、 数仓表哪里用到了3NF? 8、 是2NF吗? 9、 数仓模型? 10、 事实表和维度表都有啥? 11、 下单业务中怎么记录下单了但未支付的行为? 12、 拉链表用过吗? 13、 留存率怎么实现的? 14、 连续的还是间隔的? 15、 今天算出来的留
来美团不知不觉快一个月了。想和大家分享一些干货,包括我的美团面经,希望对大家有所帮助。 base:双非本+211硕 💼 公司岗位:大数据开发实习生 🕒 时间线: 4.6美团校招官网投递 4.13美团笔试 4.15美团一面(挂) 4.29美团复活赛一面 5.8美团复活赛二面 5.13美团oc 笔试总结:我是菜鸡。一共四个算法题,做出来两个,有一个超时,有一个测试用例都没过。美团的话笔试难度不是特
1.自我介绍 2.rdd变dataframe,再变dataset中间发生的过程 3.项目拷打 4.说说文本处理方法 5.说说数据采集经历 6.颜色分类,操这题还没写对,麻了
### 一面技术面 自我介绍 四道算法 前两题是sql,其中一个难点的就是求连续登录2天以上的用户 一道快排 一道求二叉树是否是对称二叉树,就是左右节点是对称的 问实习经历(问的很细) 工作中的难点 维度建模过程 聊到数据仓库工具箱这本书的内容,我都不会。。。 数据倾斜(我从原理,场景,解决方案三个角度回答的) 问到一些常用函数,UDF,UDAF,UDTF概念 hive的概述 hadoop,hiv
1.自我介绍 2.你对redis宕机后的方法 我:...... 3.你说到算法。你有刷过letcode算法? 我:很少刷letcode,一般都是刷sql的 3.kafka的副本同步 我:忘了 4.谈谈你对数仓的理解 我:..... 5.谈谈你对hbase和clickhouse的理解 我:.... 6.你说你对hive中的ads层数据导入到MySQL,为什么不是直接从hive的ads层中访问 我:不
字节跳动 - 数据研发 一面(40min) 学过的数据结构,并分别讲下它们的特点 进程和线程的区别 TCP和UDP的区别 JAVA的面向对象的三大特性,并详细介绍应用场景 MySQL的事务隔离级别 MySQL的binlog的运用 数据仓库的的特点、数据治理 范式建模、维度建模 Hive内外部表的使用场景 HQL底层执行逻辑 Hive数据存储在哪,分区和分桶的区别 Sort by 和 Order b
1、自我介绍 2、MR的执行过程,用了几次排序,Reduce怎么知道拉取哪些数据 3、RDD的底层实现(Spark用的不多就没问了) 4、项目介绍(没有针对项目进行提问) 5、SQL优化思路,具体讲了关于数据倾斜这块 6、SQL题:包含班级、学生、课程、分数的表,查询每个班每门课前三的学生 7、SQL题:包含user_id和target_id的表,找到互相关注的用户,优化不用join实现 8、SQ
1、自我介绍 2、为什么要去北京 3、MR的原理 4、为什么环形缓冲区到80%之后才反向溢写 5、SQL中哪些函数走MR,max走不走 6、select a,count(distinct b) from table group by a,MR的流程 7、SQL优化,如果给你两张表,用户视频表和用户粉丝表,怎么处理数据倾斜 8、SQL题:每个用户都有5门成绩,总计6列。请生成两列,其中1列是用户ID
1、自我介绍 2、看我用Java,问我Java程序的执行过程,然后Java怎么跨平台 3、基本数据类型,是否可以相互转换 4、自动装箱自动拆箱,Integer i = 100 是什么过程 5、深拷贝浅拷贝 6、Java是值传递还是引用传递 7、JVM的理解 8、堆是怎么划分的,实际有没有用到有关JVM的地方 9、垃圾清除算法说一下,什么时候FullGC 10、多线程,线程安全,线程通信之类的 11
岗位:数据开发 体验还不错,面试过程偏向聊天,会问一些新技术,从基础的框架为起点延申出一些问题,面试官也很友好,有些问题答不上来也说没关系 问的相对基础,但但范围较广 (忘记录屏以下为回忆,面试时长1h [蔚来数开一面] 自我介绍 实习介绍(因为前一份实习和数开相关性不是很大,只是写过sql就简单带过了没深挖 kafka相关: kafka的结构 优点,和其他消息队列相比优势在哪 数仓项目(自己做的
1.自我介绍 2.两道SQL 3.mapreduce中map阶段和reduce阶段的task的数量怎么确定 4.了解哪些建模方式,了解维度建模吗,说说他们的区别 5.rdd有哪些shuffle类算子 6.shuffle的本质是什么 7.为什么数仓要分层,分层的意义在哪 8.四个排序的区别 9.spark的提交流程 10.hive中的元数据存储了哪些内容 已过