当前位置：首页 > 专题 >

《数据开发工程师》专题

宁德时代大数据开发面经
40min 面试体验感超好，德子好感+1 Spark sql了解吗？Dateframe 是啥（不会）项目里数据怎么拉的？ Flume+kafka+flume+hdfs 有什么过滤器吗？：3个flume拦截器判断文件类型+时间戳过滤器+落hdfs小文件检测数据量：千万 flume拉取时间是多少？（不会，瞎编的10分钟有兄弟了解吗） Spark小文件怎么处理 Kafka 的整体结构：broke+
滴滴大数据开发二面面经
二面就问了20min不到，吓死我了，不过已经发offer啦，分享下二面问的一些题目。还是挖简历。数仓建模核心拉链表、快照表、全量表的区别好像就这些~
滴滴大数据开发一面面经
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群，一张hive表如何进行数据共享，A集群如何同步到B集群中 5. 一张订单表，支付状态会发生变化，如何采集到ods？面试官说由于每张mysql表都是在系统上有应用的，所以应该用update的方式更新支付状态，不能采用数仓的方式去思考问题，不能用拉链表。数仓可以保存历史数据，但是mysql表必须要用up
网易云音乐数据开发实习
一面实习介绍 mr过程 mr和spark的区别 spark shuffle 举例说明事实表和维度表的设计拉链表设计 3道sql题 row_number rank dense_rank区别二面实习介绍怎么设计数据指标集群故障怎么排查解决的自动化运维脚本怎么写的实习的收获项目介绍讲一张你最熟悉的维度表，怎么设计的，说说都有哪些字段拉链表优缺点你觉得实际拉链表用的多吗用的不多为
荣耀大数据开发凉面面经
年前面试的流程是机考，测评，再面试 (数仓)一面聊得还行，不知道怎么挂了。。。可能是Spark这一块了解得太少了自我介绍你做的项目数据采集用的什么工具和原理？有没有做过数据治理？有没有做过数据血缘关系管理？数据突增问题有没有遇到过？影响HDFS，如何解决？ Hive表格存储用的哪个？什么原理？数据某个阶段出现问题了，你怎么样定位出来？数据倾斜有没有遇到过？怎么处理的？数据之间的
字节面试-大数据开发实习
视频ms 前三分钟自我介绍数据仓库的了解怎样设计数据分层了解的大数据组件 spark用于解决什么问题 spark底层逻辑 sql的join实现方式举例A（3） join B （5）有几条数据 join底层逻辑 sql题查询用户峰值全程不到30分钟 **我就是一个小菜鸡。问就是面试凉凉问的其实感觉没有特别难但就是啥都不会。还是学的太过浅层次。总的来说项目拷打底层深挖。G
百度大数据开发一面 #秋招
#秋招# JAVA: 1.java面对对象的特征 2.Java中基本类型有哪些 3.==和equals的区别 4.为什么重写equals要重写hashcode 5.List，map，set什么区别 6.Try，catch，finally 分别作用是什么大数据： 7.hdfs的读流程 8.项目里用到的 hive on spark 和普通的hive有什么区别 9.数据倾斜的优化，如果group b
星环大数据开发两面面经
一面：boss直聘，拷打项目，无八股。面试官简单介绍了项目的情况，反问。二面：电话面，面试官一眼看出项目是网上的，我狂妄发言：“我是有自己的思考的”，然后被拷打，最后只憋出来了一条。根据我之前的回答，面试官问了 1）数仓，业务系统，大数据平台的关系根据jd，问了 2）py如何连接数据库，数据库游标、连接不释放会怎么样 3）hive分桶表，如何分桶，如何确定分桶的数量，分桶有什么用 4）怎么处
滴滴数据开发一二面 40+40min
一面 1.自我介绍 2.实习经历介绍，负责的项目模块，有多少张表，为什么要做这些表，涉及哪些方面的建设 3.对业务的了解，是你和需求方直接对接吗，参与过砍需求的过程吗 4.模型设计到最后交付的数据开发全流程，有没有中途变更过需求，最终有多少个指标和维度 5.你怎么把这么多维度放到一张表里面呢，oltp引擎怎么样使用的 6.指标都是可以累加的吗，有没有想过把可加的和不可加的指标分别放到不同的表中 7
9-4 唯品会-数据开发二面
问项目根据项目问了一个sql如何写聊七聊八 20min 挂了
科大讯飞数据开发一面 35min
1.自我介绍，城市相关 2.你对于大数据哪一块比较了解，展开讲讲 3.结合项目讲数仓建模理论 4.数仓分层的理解和好处，每一层的作用 5.app层如果下面有多个看板，他们有多个指标是重复的，你怎么设计app层才能保证数据查询起来容易又包装数据的一致性呢 6.指标体系的了解 7.原子指标派生指标衍生指标 8.日活留存率怎么算，要得到连续十五天相对于第一天的的留存率，如何优化 9.spark学到什么程
字节大数据开发三面面经
今天面了字节大数据开发的三面，记录一下：面试官先自我介绍，然后开始问专业知识。 1.你了解实时领域和离线领域的哪些技术？ 2.mapreduce和spark作为计算引擎的差异 3.spark的rdd是什么 4.如何理解rdd中弹性的概念 5.spark有哪些调优方法 6.spark中的join操作有哪些 7.数仓建模方法有哪些 7.介绍一下flink的双流join，以及双流join可能会遇到哪些
中新赛克-大数据开发-初面
2024/9/12 16:40 40min - 自我介绍 - 我看你本科不是计算机的，你学过一些专业课程吗？ - 你是投的大数据开发吗？还是调过来的？ - 开源项目介绍 - 剩下三个项目介绍 - 你的项目Redis是单机的还是集群 - Redis 槽了解过吗 - 对Spring Boot有了解吗？ - Redis中基本数据结构 - 如果一个Hash存的对象非常大，会导致什么后果？ - 接口可以继承
字节复活数据开发一面 45min
1.自我介绍 2.项目内容：背景，uv，pv，功能，项目人数，分工 3.数仓的设计思路 4.分层数仓和使用普通数仓的区别 5.为什么ods不直接对接app层，有没有考虑过增加一层数据集市层 6.项目用了哪些技术栈 7.hdfs如何保证高可用 8.hdfs写入数据流程，写入过程中datanode挂了怎么办 9.小文件原因，危害，解决方法 10.数据倾斜介绍，数据倾斜如何排查 11.spark的两种s
8.16汇量科技数据开发一面
介绍开源项目介绍离线数仓可视化用的什么框架 spark的submit的参数了解和做过数据清洗吗数据怎么清洗数据倾斜的优化思路了解scala吗给场景进行去重和选最近一条数据两道代码两数之和数组的小和 1个小时有些忘了

首页

40

41

42

43

44

45

46

47

48

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档