当前位置：首页 > 专题 >

《大数据开发工程师》专题

美团23春招面经～数据开发
陆续分享点面经虽然大部分都被挂了hh 希望能帮到大家 3.15 一面 1.自我介绍 2.题外话怎么看待数仓和算法的联系 3.项目 4.介绍一下对大数据技术生态的了解 5. 怎么理解spark和hive 6.hive的逻辑架构 7.MR的流程 8.整个MR有几次排序 9.spark的shuffle 10.怎么确定spark分解成多少个task，即spark任务的并行度怎么指定 11.stage的
得物数据开发 kpi面13分钟
1.Java的数据结构相关 2.HashMap怎么解决哈希冲突的 3.HashMap和HashSet区别 4.Spark shuffle 5.Maven会用吗，怎么解决版本冲突？ 6.实习相关反问做什么的？用什么？偏底层，主要是做Spark和Flink底层的一些东西
二次开发 - 常用数据表说明
常用数据表说明： dede_archives|文档主表 dede_addonarticle|文章附加表 dede_addonimages|图片附加表 dede_addonshop|商品附加表 dede_addonsoft|软件附加表 dede_addonspec|专题附加表 dede_arctype|栏目表 dede_flink|友情链接表 dede_admin|系统管理用户表 dede_flin
字节数据开发实习三面挂
10.23 非科班，只学了离线的技术栈，没项目，投了一个月全被拒了。（百度美团得物滴滴蔚来）一面二面八股问的简单也都答出来了，但是算法题都是暴力求解，竟然过了，三面感觉八股有点冷门，算法题做出来了结果挂了，究极折磨，有点难受！数仓分层，什么是主题 Kafka怎么保证数据一致性 Hdfs有哪些数据存储类型，有什么区别 Spark和MapReduce的比较为什么转行做过的数据分析案例
快手数据开发二面凉经 60min
1、自我介绍 2、数仓怎么自学的 3、整个项目架构说一下 4、数据域是什么概念（提到了数据类型），那如何界定数据类型呢 5、总线矩阵构建过程 6、dwd层怎么设计的 7、了解业务过程这个概念吗 8、分域的话，在dws表中有没有可能会跨域（举了个互动域和活动域的例子），结果告诉我这样的话你的互动域设计的其实是有问题的（挖坑给我跳，悲） 9、星形模型和雪花模型 10、缓慢变化纬为什么用拉链表，他说他第
网易云音乐数据开发实习
一面实习介绍 mr过程 mr和spark的区别 spark shuffle 举例说明事实表和维度表的设计拉链表设计 3道sql题 row_number rank dense_rank区别二面实习介绍怎么设计数据指标集群故障怎么排查解决的自动化运维脚本怎么写的实习的收获项目介绍讲一张你最熟悉的维度表，怎么设计的，说说都有哪些字段拉链表优缺点你觉得实际拉链表用的多吗用的不多为
滴滴数据开发一二面 40+40min
一面 1.自我介绍 2.实习经历介绍，负责的项目模块，有多少张表，为什么要做这些表，涉及哪些方面的建设 3.对业务的了解，是你和需求方直接对接吗，参与过砍需求的过程吗 4.模型设计到最后交付的数据开发全流程，有没有中途变更过需求，最终有多少个指标和维度 5.你怎么把这么多维度放到一张表里面呢，oltp引擎怎么样使用的 6.指标都是可以累加的吗，有没有想过把可加的和不可加的指标分别放到不同的表中 7
9-4 唯品会-数据开发二面
问项目根据项目问了一个sql如何写聊七聊八 20min 挂了
字节复活数据开发一面 45min
1.自我介绍 2.项目内容：背景，uv，pv，功能，项目人数，分工 3.数仓的设计思路 4.分层数仓和使用普通数仓的区别 5.为什么ods不直接对接app层，有没有考虑过增加一层数据集市层 6.项目用了哪些技术栈 7.hdfs如何保证高可用 8.hdfs写入数据流程，写入过程中datanode挂了怎么办 9.小文件原因，危害，解决方法 10.数据倾斜介绍，数据倾斜如何排查 11.spark的两种s
8.16汇量科技数据开发一面
介绍开源项目介绍离线数仓可视化用的什么框架 spark的submit的参数了解和做过数据清洗吗数据怎么清洗数据倾斜的优化思路了解scala吗给场景进行去重和选最近一条数据两道代码两数之和数组的小和 1个小时有些忘了
欢忻网络数据开发实习生
问的都是数据结构的问题 1.给一个整数，怎么把它翻转（123转成321）我说用字符串他说不行 2.忘了 3.有两个整数型数组，里面的整数范围都是1-1000w，问怎么找出两个数组中相同的数字已挂
2024字节跳动面试数据开发
#软件开发2024笔面经# 2024字节跳动面试数据岗位 1.模型开发的流程，需求调研过程中有哪些人员参加，调研过程，你会输出什么文档？ 2.如何保障数据质量（准确性）？ 3.spark有什么优缺点？在使用过程如何规避缺点？ 4.spark内存模型？ 5.spark和MR为什么会进行shuffle，如何减少shuffle？ 6.小文件治理的方式？ 7.主题域建设的流程？ 8.大表join大表的优
字节 Data 数据开发面经已凉
#软件开发2024笔面经# 二战字节一面自我介绍介绍实习工作平时做什么数据量多大数据仓库理解怎么分层的 Spark执行流程 Spark内存划分 SQL优化方式布隆过滤器 JVM内存模型垃圾回收双亲委派 SQL题连续登录算法题 LRU 二面自我介绍介绍实习数仓为什么分层主要解决什么问题两道算法题链表删除元素和在数组中快速查询数据布隆过滤器半连接查询 gro
网易数据开发5.14一面已过
1.自我介绍 2.实习关注准确性和效率等指标的权衡 3.项目 4.sql全勤员工两天没消息了忍不住打电话问了，hr接起来电话来第一句“你是浙大同学吧，我们交叉面隔壁部门面试官忙” ？？？？浙大去网易干外包做数开？？？？？我是不能理解
美团数据开发暑期实习Timeline
岗位：软件开发工程师-数据开发方向部门：核心本地商业-基础研发平台技术岗位处女面，运气挺好，没有被问到完全不会的题，感谢团子缓解我的焦虑 4.30 一面（60min） 1.自我介绍 2.介绍项目架构，数据源等 3.项目中遇到的难点 4.数仓为什么要分层，各层的职能 5.讲一下项目中提到的零点漂移问题 6.hive结构， 7.hive优化 8.数据倾斜 9.tcp三次握手 10.进程和线程的区别

首页

51

52

53

54

55

56

57

58

59

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档