当前位置：首页 > 专题 >

《大数据开发实习生》专题

唯品会-大数据开发实习面试
7.15一面： 1.自我介绍 2.项目深挖（聊了很久） 3.对数仓的看法 4.主题域及其建设过程（要落地，谈业务过程） 5.讲一个熟悉的指标体系构建（没做过） 6.为什么不考研 7.为什么想跳槽 8.sql留存率（讲了下思路就行了）反问： 1.为啥晚上6点还面试，唯品会不是955吗 2.唯品会的计算引擎选型是什么 ------------------------- 挂了
星环大数据开发校园实习生面经
1、flume架构组成以及作用 2、flume到kafka中，如何保证同一个组件的数据放在kafka同一个分区里面 3、kafka支持全局有序吗？kafka isr？介绍kafka副本与hdfs副本区别 4、zookeeper在项目中的作用？如何判断节点是否存活？ 5、HDFS什么功能用到了zookeeper？ 6、spark的执行流程，比如做一个wordcount 7、sparkcontext内
滴滴数据开发实习
一面聊实习数仓怎么分层为什么要分层 sql 连续登录天数最多的用户窗口和聚合函数的区别 mr和spark对比还有些问题不记得了应该寄了，莫名紧张，发挥太差了 #面经##滴滴#
字节大数据开发实习一二HR面
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储，为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
网易大数据开发日常实习已oc
部门：网易云 8.23约面，8.25 一面 8.29 二面。8.30 hr面一面： 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询，项目里是怎么做的。 4.四道sql，十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
ACCESS大数据开发实习一面凉经（20min）
自我介绍问对hadoop各个组件的了解解释下mapreduce的过程问有没看过谷歌的GFS论文问项目里数据库咋建模设计的对维度建模的了解对数仓的了解，数仓一般咋分层 GGGG，这之前只关注框架底层了，，没看过数仓的东西#大数据开发面经##实习生[话题]##access#
欢聚大数据开发实习面经（已offer）
首先做了三道SQL题，主要涉及分组聚合、窗口函数。 3.3 一面 28min： 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min： 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
美团大数据开发暑期实习一面
时长：1h 由于问题太多，分四类进行整理 0. 实习相关：之前有数据开发的实习经验，就问了之前工作有没有spark或者hivesql优化的经验；如何确保数据的有效性；实习公司数据存储格式（Parquet），还知道哪些数据存储格式 1. 大数据相关问题：为什么Spark比MR快；对Spark的了解；两个表join的优化方法（大小表join可以map-side join, join前过滤null值）；
美团暑期实习-大数据开发一面
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验，求个好运时长一个小时二十分钟自我介绍因为学统计的，问了中心极限定理和大数据定律机器学习-XGBoost算法简介两道智力题：逻辑判断谁说谎了和分金条问了为什么研究生跨专业保研了？ Hive和MySQL区别数据库的索引有什么用说一下索引的类型，还有B+树索引数据仓库和关系型数据库区别 Hadoop生态圈简介问我SQL写的
网易大数据开发实习一面面试
#校招##秋招#
tx暑期实习一面3.25pcg大数据开发
自我介绍后根据我的项目问我了一些问题，虚拟列表，懒加载，canvas怎么压缩的（这个没答对）项目怎么实现鉴权的，我说的jwt，巴拉巴拉然后又问了cookie，问了防抖节流项目跨域是怎么解决的（项目上线后用反向代理不太好）问了数据类型，然后就问深拷贝浅拷贝，让我实现深拷贝问promise，让我实现all和race方法解释下事件循环机制 nextTick 总结：还是要多写写底层源码，回答
唯品会大数据开发实习（一二面）
一面面试官会一步一步引导，也会给出自己的见解，体验很好简单介绍一下自己接口优化，讲讲背景，怎么做的八张表同时并发去查的话，会不会对数据库的压力很大，有没有考虑这方面？数据库的负载怎么样？什么情况会导致索引失效？索引命中的原理？ select .... where b = xx and c = xx 会命中索引吗，怎么优化这个问题？有个字段叫city，你觉得用city建索引合适吗用单
百度-大数据开发-日常实习（凉经）
1.问项目 2.数据倾斜，spark,hive,问的比较多。大多是简单的八股 3.问java很多（没复习，哭死） ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗直接一问三不知 4.sql现场写代码
百度大数据研发实习
一面实习深挖对于高耗时任务的代码优化思路如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗，差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样，容错机制是怎么样机架感知有限内存下的一亿数据怎么排序了解哪些shell命令有a，b两个文件，存的都是id，写shell找出a中有但b中没有
3.22 大数据开发美团实习一面（凉经）
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息：211本+985硕（非计算机），笔试4出头的分数，面了90分钟，面试官人超好，奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍，在项目中承担什么角色，如何完成工作大数据相关： 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实

首页

1

2

3

4

5

6

尾页

最新发布

某一面虾皮 NLP 一面美的寒假实习llm面经蚂蚁大模型算法面经，say something I don't know 百度 llm算法一面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - vu3+vite 使用vue-pdf-embed预览pdf，组件渲染空白，页面无报错，是什么原因？java - @Async("asyncTaskExecutor") 没有并发处理问题？python - 如何查看：pypi中想要看是否哪些包最受欢迎的库？前端 - 可以安装在内网使用的安卓模拟器？前端调用API之后更新状态逻辑：是触发store的方法进行拉取更新是吗，还是说直接修改store进行更新？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

nativescript-pdfbox Dexie.js isort JeeSite4 Mobile Uni-App CWPopup jwwui Firetable RBDirView

文档资料

百度 Web Uploader 中文文档 LeetBook LeetCode 题解开源书 CTF 竞赛权威指南 Pwn 篇 LocaSpace Viewer 帮助文档百度统计分析云使用手册