当前位置：首页 > 专题 >

《大数据研发实习》专题

百度大数据一面
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现写一个sql，学生不同学科的得分排名前三手写单例模式，策略模式，工厂模式，并描述在什么场景下使用，口述一下装饰者模式 arraylist和linkedlist的区别，什
京东大数据一面
hdfs读写流程 spark内存管理项目中遇到的问题，怎么解决的项目中都有哪些表怎么处理缓慢变化维拉链表怎么做，开链闭链怎么数仓和数据湖维度建模，星型模型，雪花模型数据倾斜，小表join小表，大表join大表遇到过的数据倾斜，怎么做的手撕，二叉树中序遍历，非递归写法
快手大数据一面
数据倾斜问题写个sql吧再写一个sql吧，写挺好啊，在写一个吧这些你是练习过原题吗，在写一个sql吧说一下数仓的分层，每层干了什么事？说一下归并排序的过程 xgboost原理线性回归，逻辑回归聚类了解吗说一下spark怎么实现map join
百度大数据一面
自我介绍专业课程、成绩是否学过计算机专业课（408）线程、进程的区别编译型语言和解释性语言区别、使用场景计算机32位、64位存储空间多大 Java内存存储 Linux通过文件名、文件内容查找介绍Redash 比较ClickHouse、Doris和Mysql架构、使用场景和优缺点 b+树的优势实习主要工作反问：如何使用好一个数据模型对我的建议
百度大数据一面
自我介绍深挖实习经历（介绍实习主要工作、场景复盘等等延伸） hive相关（hive原理、hive sql区别）数据倾斜的常见case ClickHouse相关 group by原理 left join与right join区别与特点主要技术栈对岗位的理解反问：部门与产品业务线校招生定位
小米大数据一面
1.自我介绍 2.熟悉flink还是spark 答：flink 3.介绍下flink架构吧答：这里越深越好，我就讲到了flink的jobmanager(dispathcer，jobmaster)和taskmanager 4.flink有哪些算子? 答：map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。 5.fl
歌尔大数据秋招
#歌尔# 项目 ETL部分拉链表的设计与作用数据量的大小为什么选择kmeans，介绍一下其他的聚类方法八股介绍下数据仓库的分层大数据中的数据倾斜 hive开窗函数 spark streaming和flink的区别 sort by 和 order by的区别有没有用过doris等（没用过）什么时候可以来实习
百度大数据一面
自我介绍实习工作介绍事实表与维度表如何搭建星型模型与雪花模型维度冗余业务场景理解数据倾斜原因和常见手段手撕一道sql：连续登录7天用户两道算法：二维动态规划 n! 尾数0的个数
星环科技大数据
项目垃圾回收，JVM调优 Elasticsearch 结构索引集群分片 redis 数据结构 mysql优化，事务，索引，MVCC 聊天
百度大数据一面
4.27 1h B2B，百度电商部门介绍完自己直接开始写算法题随机数据的峰值，如 1 2 3 6 5 8 7，返回 6 或 8都行，要求时间复杂度O（lgN）斐波那契数列，要求时间复杂度O（lgN），矩阵解法求两个字符串的最长公共子串，如 abcedfgh 和 bcedgh 最长公共子串是bced 求两个字符串的最长公共子序列，如 abcedfgh 和 bcedgh 最长公共子序列是bce
Android：通过BLE发送大于20个字节的数据
问题内容：通过连接到外部BLE设备，我最多可以发送20个字节的数据。如何发送大于20个字节的数据。我已经读到我们必须将数据分段或将特征拆分为所需的部分。如果我假设我的数据是32字节，你能否告诉我我需要在代码中进行的更改才能使其正常工作？以下是我的代码中必需的摘录：这是我用于发送数据的代码。在以下onclick事件中使用“发送”功能。当大于20个字节时，则仅接收前20个字节。如何纠正呢？为了
字节大数据开发-人力科技面经（已凉）
字节大数据开发工程师- 人力科技面经一面网络模型，每一层的功能访问一个网页的流程 tcp是如何保证可靠线程和进程的区别 JVM的内存区域垃圾回收算法类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag，job，task是如何划分的 spark宽窄依赖为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
网易云音乐大数据开发工程师 1面
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别，分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的，有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么？怎么学习？反问 1. 部门做什么业
深圳闻泰科技大数据开发技术面经
1、自我介绍 2、什么是维度建模？什么是关系建模？ 3、星型模型和雪花模型有什么区别？ 4、数据仓库分层的意义是什么？ 5、对哪些大数据框架比较熟悉？（答了Hadoop和Kafka） 6、Hadoop的进程有哪些？作用分别是什么？ 7、Kafka的特点是什么？ 8、Kafka为什么可以支持海量数据吞吐？ 9、问实习工作内容，以及实习收获 10、能否接受加班？ 11、有什么问题要问我的？问了日常工作
携程大数据底层框架开发面经回顾
去年秋招拿了携程-大数据底层框架开发岗位的offer，想着还是把面试回顾下吧，给后面的朋友一个参考。这个岗位是做大数据组件底层二次开发的，我面试的是偏向离线方面，因此面试都是围绕hadoop、spark、hbase、hive这几个组件的底层原理去问，因为是偏向底层，所以也会注重java语言和多线程并发的知识。 HDFS的写入流程？如果一台机器宕机，HDFS怎么保证数据的一致性？如果只存活一台机器

首页

33

34

35

36

37

38

39

40

41

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Spiped OPMS Apache Lucy JQuery4JSF react-native-context-menu-view IndieLib CLTableWithFooterViewController worktop

文档资料

GitHub 漫游指南 Django Book 2.0 中文版 QAP 千牛开发者套件 Scrapy 中文文档 Rails 风格指南