当前位置：首页 > 专题 >

《大数据开发面经》专题

淘天数据研发面经
一面：投的数研，实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过？怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目：求连续登陆三天的用户 9.假设检验概率论场景题：求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向，数科还是数研，安排下一轮面试官（回数研后第二天结束流程） 13.反问
数据开发笔试问题
saas平台,商城商品模块相关表设计交以下内容初始化数据 1.表数据字典 2.生成语句 3.自行模拟的数据导入语句业务数据 1.后台新增语句 2.后台修改语句#秋招#
京东数据开发笔试
题型：20道选择题，3道编程题，其中第一题写SQL 笔试太难了？可以私信我有些AC有些通过率还行，助攻已经进面了选择题：下列排序中需要额外辅助空间的期望值最大的是() 堆排序希尔排序快速排序冒泡排序双十一快到了,某服装厂为了赶制订单,加班加点使用设备生产衣服。如果某一设备在时间长度为的时间内发生故隙的次数服从分布N(t)～P(λt) (H松分布)，求该设备在无故障工作8小时后再次
平安产险数据开发
秋招第一面给了平安产险，投的平安产险总部科技管培生-数据开发，9月11投递的，9月16测评，9月18笔试，9月27开始一面。 3点59分，面试官准时打来电话，首先是自我介绍，然后面试官让介绍实习的项目，后面会根据简历上你写的东西问，其实也是岗位要求写的那些，问了数仓分层，还有java垃圾回收机制，数据结构，数学建模等方面相关的，历时23分钟，虽然答得不好，但是面试官也没让我难堪，说自己当时也是这么
杭州银行数据开发
1.自我介绍 2.数据仓库分层 3.介绍项目分工难点数分和数挖哪部分做的多 4.三范式 5.事务基本特性 6.存储和函数有什么区别（没懂） 7.为什么来杭州 8.反问
宁德时代数据开发
一轮技术面已oc 自我介绍数据倾斜工作中遇到不会的技术栈怎么办和业务方沟通的case
滴滴数据开发实习
一面聊实习数仓怎么分层为什么要分层 sql 连续登录天数最多的用户窗口和聚合函数的区别 mr和spark对比还有些问题不记得了应该寄了，莫名紧张，发挥太差了 #面经##滴滴#
团子数据开发oc了
顺带分享面经 9.05到家一面：自我介绍实习相关画像表和指标维度表的区别标签体系数据结构基础。dag如何排序算法，删除链表重复元素 9.18美团平台一面：数仓分层 spark任务提交数据倾斜，如何处理数仓好坏开发完成之后如何做数据验证，如何确保是对的反转链表 9.20二面：学校实习在实际工作中对数仓理论的认识如何对订单数据建模，考虑哪些维度任务跑得慢怎么分析如何估
金山云数据开发 oc
聊项目面相对象三大特性 JVM内存结构 Hashmap springIOC AOP 缓存雪崩 sql问题
众安在线——数据开发
已Offer 技术面（1h，已过） 1. 自我介绍 2. 问了一下实习，开始挖项目 - 说说你的项目架构，整个流程是什么样的 - 如果让你构建一个大数据分析平台，你会选择哪些组件？（主要是数据存储、计算等） - 如果是要求实时处理呢？ 3. 问Flink（不会，直接跳过） 4. 为什么选Clickhouse？和其他OLAP数据库相比有啥特点？ 5. 八股 - 进程与线程区别 - 说一下Spring
字节大数据开发推荐架构(深圳)日常实习一面（凉)75min
9.20 24届非科班本发面筋攒好运！第一次面+太紧张+基础不好+算法出没见过的hard = 寄组是偏基础架构的自我介绍到一半简介项目的时候就被打断了开始撕项目(乐学习的方法离线项目： 1.分层的好处，为什么分层 2.idmapping 3.拉链表的逻辑(用户活跃区间的中间表)，下次还应该解释一下这个中间表的好处以及为什么方便。实时项目: 1.维表动态注入的意义在哪里，为什么不直接写入
字节跳动商业化技术大数据开发实习一面50min（已过）
这轮比较关注底层 1.自我介绍 2.个人信息和实习时长进一步沟通 3.问项目，进一步阐明下项目细节 4.HDFS备份文件数量 5.HDFS读文件底层原理 6.HDFS写文件底层原理 7.追问是写完一个文件就返回还是所有备份写完才返回 8.问MapReduce原理 9.问Hive内部表和外部表的区别 10.问Hivesql咋转换到MapReduce的 11.问Hive可以用啥作为元数据库 12.Hi
大华---C++服务器开发一面+二面技术面（凉经）
10.11号下午电话一面约半小时自我介绍没有实习经验----------那就先不问--------没有实习经验也没事，那就描述些可以展现思维的方面的。描述了科研项目---------问了一些问题。知道应聘的这个岗位是做什么的吗? 对数据库的了解锁对数据结构和算法的了解实践有多少对C++的特性的了解对设计模式的了解反问环节第二天出结果，收到二面技术面 10.13号上午电话二面
百度大数据研发实习
一面实习深挖对于高耗时任务的代码优化思路如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗，差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样，容错机制是怎么样机架感知有限内存下的一亿数据怎么排序了解哪些shell命令有a，b两个文件，存的都是id，写shell找出a中有但b中没有
百度提前批大数据二面面经
1、spark shuffle过程，越具体越好，细化到组件，map task以及reduce task具体过程 2、你说bypass shuffle是每个executor节点生成对应reduce task数量的结果文件，那mergesort shuffle呢 3、reduce task 如何知道哪些map task完成了，又是怎么拉取的 4、spark 写文件流程？commit流程？ 5、spar

首页

28

29

30

31

32

33

34

35

36

尾页

最新发布

💼｜腾讯产品运营实习｜详细面经🔍高德地图产品经理(社招)哈啰产品经理实习面经 python-数据分析岗位-22届考研-华OD面经安克数开

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

javascript - 为什么相同的代码无法正确排列数据？求java/php大佬帮帮忙？epub - 有没有类似语雀这样的笔记管理软件最后可以导出为EPUB格式的？前端 - 如何在抖音H5页面中让安卓手机拉起自带应用商店下载APP？人工智能 - 要运行本地Midjourney只自己用（只自己使用，不给别人服务使用）1张显卡就足够了吗？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Motto Poseidon IDE TaSSL Heraldry Prana csu-thesis circuitikz JavaWeb-Project-Source-Share

文档资料

SUI 移动开发UI库 Jackson 入门教程 Elixir 编程入门 React 使用文档驾驭 Go 语言基础与网络开发