1.自我介绍 2.项目介绍 3.对着项目问了些简单的组件八股文,,没记住 4.java 集合类底层实现,ArrayList 锁原理 syn 可重入锁 追问syn的底层原理(忘了) 递归函数套syn会出现什么情况 线程池参数和过程 5.操作系统 线程进程内存关系(我excuseme,不一般问协程吗,还能问内存??) 线程间除了锁以外其他通信方式 为啥有进程了还要有线程 6.计网 输入URL的过程 长
字节整体给我的感觉是不怎么问八股,他们非常想听你的理解是什么,问的很多问题网上都没有答案,高度都很高。 一面(2023.3.22) 自我介绍 为什么选择从全栈开发转到大数据,为什么会对大数据感兴趣 有学习过大数据的一些技术栈或者项目实战么 狂问项目(国电的,问的极其极其细) 问了电商数仓项目(大概介绍了一下维度建模) DWS层都是什么类型的事实表(不知道怎么答,感觉问的很奇怪,就直接答了事务型事实
1、 目前研究的项目,对数据的处理? 2、 你怎么理解数据挖掘? 3、 平时用啥数据库? 4、 3NF? 5、 深剖数仓项目 6、 讲一讲项目? 7、 数仓表哪里用到了3NF? 8、 是2NF吗? 9、 数仓模型? 10、 事实表和维度表都有啥? 11、 下单业务中怎么记录下单了但未支付的行为? 12、 拉链表用过吗? 13、 留存率怎么实现的? 14、 连续的还是间隔的? 15、 今天算出来的留
来美团不知不觉快一个月了。想和大家分享一些干货,包括我的美团面经,希望对大家有所帮助。 base:双非本+211硕 💼 公司岗位:大数据开发实习生 🕒 时间线: 4.6美团校招官网投递 4.13美团笔试 4.15美团一面(挂) 4.29美团复活赛一面 5.8美团复活赛二面 5.13美团oc 笔试总结:我是菜鸡。一共四个算法题,做出来两个,有一个超时,有一个测试用例都没过。美团的话笔试难度不是特
#23届找工作求助阵地# #实习# #网易智企# 一轮面试: 1.比赛相关(自动化敏感信息提取项目中:数据提取、清洗和转换是怎么做的?数据量大概有多少?最终的训练模型的数据结构是怎么样?有没有涉及到分布式集群来训练模型?) 2.课题相关(刚才说这个项目不是用到多卡多去存储,应该是相当于HDFS文件上面对吧?有没有用到它里面的一些计算的一些引擎,那你存储它的用它的组件的目的是什么?Hadoop的集群
面试官设备有问题临时改为电话面 1.项目拷打 2.指标下沉怎么做的 3.数据从业务数据库到数仓,怎么估算数仓需要的存储资源 4.了解哪些窗口函数 就记得这些了,其他的一会想不起来
字节跳动 - 数据研发 一面(40min) 学过的数据结构,并分别讲下它们的特点 进程和线程的区别 TCP和UDP的区别 JAVA的面向对象的三大特性,并详细介绍应用场景 MySQL的事务隔离级别 MySQL的binlog的运用 数据仓库的的特点、数据治理 范式建模、维度建模 Hive内外部表的使用场景 HQL底层执行逻辑 Hive数据存储在哪,分区和分桶的区别 Sort by 和 Order b
2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题,监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域,String是基本数据类型吗?基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
1h 面试官没开摄像头,然后我也没开~ 1. 自我介绍 2. 项目介绍 3. Java NIO原理,与BIO有什么区别 4. 线程不安全的类有哪些 4. G1回收器原理 4. 类加载过程 4. GCROOTS由什么组成 5. 数据库索引 6. 数据库的事务和一致性 7. 计网分层结构 8. TCP和UDP的区别 9. TCP怎么实现可靠传输 10. HTTP3.0展开讲讲 11. 进程和线程的区别
40min 1面 自我介绍 项目介绍 做题:一道算法, sql2道 数据库索引有什么用 索引失效的情况 spark提交作业的流程 spark 共享变量有哪些 广播变量怎么实现的 hive外部表和内部表区别 hive优化,项目中使用到了哪些,展开讲讲 kafka是读写分离 为什么不做读写分离 mysql事务 40min 2面 自我介绍 项目介绍 算法题(20min) hard plus 没写出来最优
9.26 一面 (10.12感谢信) 20min+ 自我介绍 项目介绍 介绍下数仓分层?做了哪些数据处理? Spark反压机制? HDFS读写流程? kafka中出现数据堆积如何处理?
视频面,1h 吐槽:我8.11投递的岗位...八月底做完的笔试....10.21给我发邮箱约面,也不知道前面是哪个大佬拒了offer然后把我给捞上来了 但是,面试官人很好啊~面试体验很好~ 虽然我很多没答上来只能说分治思想贯穿了全程... 无自我介绍 实习 由于我有数据开发相关的实习,所以前30min各种问实习 做了哪些工作,怎么做的,任务挂了怎么办,怎么做的清洗,用的啥语言,用的是啥架构/工具?
10.20 一面 25min 自我介绍 Hadoop三大组件介绍 MR Shuffle的过程? Spark shuffle和 MR Shuffle概念和区别? shuffle作用? shuffle中涉及到哪些排序?快排和归并排序时间复杂度是多少? 宽窄依赖概念,如何划分? 一亿条数据如何找出top100? 归并排序 未来职业规划? 反问
hive的架构 hive外部表和内部表的区别 内部表的数据由hive管理,且存储在hive.metastore.warehouse.dir配置下的路径中;外部表的数据由HDFS存储,路径可以自己指定; 删除表时,内部表会把元数据及真实数据删除;外部表不删除真实数据。 你用过hive哪些窗口函数 可参考:面试官:你用过哪些窗口函数 一般用什么文件格式 可参考:面试官:“你们实际生产中hive用什么文