当前位置：首页 > 专题 >

《大数据开发实习》专题

阿里夸克大数据开发外包实习面经（已OC）
1.自我介绍 2.项目介绍 3.对着项目问了些简单的组件八股文，，没记住 4.java 集合类底层实现，ArrayList 锁原理 syn 可重入锁追问syn的底层原理（忘了）递归函数套syn会出现什么情况线程池参数和过程 5.操作系统线程进程内存关系（我excuseme，不一般问协程吗，还能问内存？？）线程间除了锁以外其他通信方式为啥有进程了还要有线程 6.计网输入URL的过程长
字节跳动大数据开发转正实习面经（已OC）
字节整体给我的感觉是不怎么问八股，他们非常想听你的理解是什么，问的很多问题网上都没有答案，高度都很高。一面(2023.3.22) 自我介绍为什么选择从全栈开发转到大数据，为什么会对大数据感兴趣有学习过大数据的一些技术栈或者项目实战么狂问项目(国电的，问的极其极其细) 问了电商数仓项目(大概介绍了一下维度建模) DWS层都是什么类型的事实表(不知道怎么答，感觉问的很奇怪，就直接答了事务型事实
2023暑期实习-大数据开发面试-字节商业化
1、目前研究的项目，对数据的处理？ 2、你怎么理解数据挖掘？ 3、平时用啥数据库？ 4、 3NF？ 5、深剖数仓项目 6、讲一讲项目？ 7、数仓表哪里用到了3NF？ 8、是2NF吗？ 9、数仓模型？ 10、事实表和维度表都有啥？ 11、下单业务中怎么记录下单了但未支付的行为？ 12、拉链表用过吗？ 13、留存率怎么实现的？ 14、连续的还是间隔的？ 15、今天算出来的留
美团大数据开发暑期转正实习面试总结
来美团不知不觉快一个月了。想和大家分享一些干货，包括我的美团面经，希望对大家有所帮助。 base：双非本+211硕 💼 公司岗位：大数据开发实习生 🕒 时间线： 4.6美团校招官网投递 4.13美团笔试 4.15美团一面（挂） 4.29美团复活赛一面 5.8美团复活赛二面 5.13美团oc 笔试总结：我是菜鸡。一共四个算法题，做出来两个，有一个超时，有一个测试用例都没过。美团的话笔试难度不是特
网易大数据研发实习面经
#23届找工作求助阵地# #实习# #网易智企# 一轮面试： 1.比赛相关（自动化敏感信息提取项目中：数据提取、清洗和转换是怎么做的？数据量大概有多少？最终的训练模型的数据结构是怎么样？有没有涉及到分布式集群来训练模型？） 2.课题相关（刚才说这个项目不是用到多卡多去存储，应该是相当于HDFS文件上面对吧？有没有用到它里面的一些计算的一些引擎，那你存储它的用它的组件的目的是什么？Hadoop的集群
面经|网易数智-数据开发实习
面试官设备有问题临时改为电话面 1.项目拷打 2.指标下沉怎么做的 3.数据从业务数据库到数仓，怎么估算数仓需要的存储资源 4.了解哪些窗口函数就记得这些了，其他的一会想不起来
25届日常实习面试 - 数据开发 & 后端开发
字节跳动 - 数据研发一面（40min）学过的数据结构，并分别讲下它们的特点进程和线程的区别 TCP和UDP的区别 JAVA的面向对象的三大特性，并详细介绍应用场景 MySQL的事务隔离级别 MySQL的binlog的运用数据仓库的的特点、数据治理范式建模、维度建模 Hive内外部表的使用场景 HQL底层执行逻辑 Hive数据存储在哪，分区和分桶的区别 Sort by 和 Order b
百度大数据开发一面面经
2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题，监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域，String是基本数据类型吗？基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
百度大数据开发二面面经
2022-07-27 下午时长1h5min 百度的面试官真的很好，这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join，大表大表join怎么解决数据倾斜，展开说 3 SQL 没做出来，但是面试官全程提示，沟通交流 4 Hive和Spark哪个比较熟悉，我们聊一聊——都比较熟悉，问了Hive组件和底层执行逻辑，逻辑计划优化有哪些方法，什么是谓词下推（自己提到了） 5 算法：数组
百度大数据开发一面已挂
１ｈ面试官没开摄像头，然后我也没开～ 1. 自我介绍 2. 项目介绍 3. Java NIO原理，与BIO有什么区别 4. 线程不安全的类有哪些 4. G1回收器原理 4. 类加载过程 4. GCROOTS由什么组成 5. 数据库索引 6. 数据库的事务和一致性 7. 计网分层结构 8. TCP和UDP的区别 9. TCP怎么实现可靠传输 10. HTTP3.0展开讲讲 11. 进程和线程的区别
招银大数据开发 1 2 3面
40min 1面自我介绍项目介绍做题：一道算法， sql2道数据库索引有什么用索引失效的情况 spark提交作业的流程 spark 共享变量有哪些广播变量怎么实现的 hive外部表和内部表区别 hive优化，项目中使用到了哪些，展开讲讲 kafka是读写分离为什么不做读写分离 mysql事务 40min 2面自我介绍项目介绍算法题（20min） hard plus 没写出来最优
佳都科技大数据开发（凉经）
9.26 一面（10.12感谢信） 20min+ 自我介绍项目介绍介绍下数仓分层？做了哪些数据处理？ Spark反压机制？ HDFS读写流程？ kafka中出现数据堆积如何处理？
美团大数据开发一面（凉经）
视频面，1h 吐槽：我8.11投递的岗位...八月底做完的笔试....10.21给我发邮箱约面，也不知道前面是哪个大佬拒了offer然后把我给捞上来了但是，面试官人很好啊~面试体验很好~ 虽然我很多没答上来只能说分治思想贯穿了全程... 无自我介绍实习由于我有数据开发相关的实习，所以前30min各种问实习做了哪些工作，怎么做的，任务挂了怎么办，怎么做的清洗，用的啥语言，用的是啥架构/工具？
一点资讯大数据开发（凉经）
10.20 一面 25min 自我介绍 Hadoop三大组件介绍 MR Shuffle的过程？ Spark shuffle和 MR Shuffle概念和区别？ shuffle作用？ shuffle中涉及到哪些排序？快排和归并排序时间复杂度是多少？宽窄依赖概念，如何划分？一亿条数据如何找出top100？归并排序未来职业规划？反问
大数据开发面试题之Hive篇
hive的架构 hive外部表和内部表的区别内部表的数据由hive管理，且存储在hive.metastore.warehouse.dir配置下的路径中；外部表的数据由HDFS存储，路径可以自己指定；删除表时，内部表会把元数据及真实数据删除；外部表不删除真实数据。你用过hive哪些窗口函数可参考：面试官：你用过哪些窗口函数一般用什么文件格式可参考：面试官：“你们实际生产中hive用什么文

首页

4

5

6

7

8

9

10

11

12

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10