当前位置：首页 > 专题 >

《大数据开发实习生》专题

shein大数据开发实习生
1.自我介绍 2.实习最大收获 3.odps平台的性能调优与spark的性能调优的共同点和差异点 5.spark的countdistinct算子优化 6.bitmap作用在expload的作用是什么？ 7.小文件过多的影响 8.sql countdistinct优化代码手写 9.反问 #大数据开发##数据人的面试交流地#
大数据开发实习面筋。
1.平常是用python还是java？python和java掌握程度？ 2.hadoop的组成，每部分有什么用。 3.spark掌握的怎么样，SQL练过哪些题。 4.mapreduce源码看过吗？ 5.wordcount的流程。 6.Scala有没有学过？然后开始挖简历，还问了我一些业务的问题。说后面会通知二面，也不知道有没有...
百度大数据开发实习
10.16投递 10.17一面（50minute）自我介绍项目细节 mysql（这里问了很多）大数据的基本八股计算机网络tcp 一道sql题，一道算法题（吐槽一下百度的如流，用网页端看不到聊天框，最后还是下载了客户端才看到，面百度的小伙伴记住面试了要下载如流）反问:问了一下业务 10.19二面（30minute）自我介绍项目细节流程两个项目的关系为什么不继续做大模型实习多久
美团大数据开发实习
一面——60mins 自我介绍拉链表的制作，数据量有多少，为什么不用快照表呢项目有哪些表数仓分层有哪些，具体做了什么，数仓分层作用怎么设计表，怎么建模，DIM DWD层的主题分了哪些如何做的可视化什么是数据倾斜，数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的对哪些数据库了解 Shuffle有哪几种类型在shuffle的过程中会进行排序吗
脉脉，大数据开发实习
一面：(1h) 1.自我介绍 2.选一个熟悉的项目介绍一下吧 3.看你简历上写了进行过数仓的搭建，那你说一下数仓分几层合适？ 4.每一层干了那些事儿？ 5.你说一下数仓为何要进行分层？ 6.数仓的建模方法知道吗？ 7.指标分类有哪些？（回答的是原子指标，派生指标，衍生指标） 8.你的ods层为何选择gzip压缩呢？ 9.除了gzip压缩还有哪些压缩方法？介绍他们的区别？10.项目中你的hive表使
北京MetaAPP大数据开发实习生
给了三道题，两道SQL，还有一个程序设计题。 1、银行交易记录表，字段有(id，存取金额(存为+，取为-)，交易id) （1）求每个人的总余额（2）求每次交易后的余额 2、学生成绩表，字段为：学生id、成绩（内容格式为：&quot;数学：xxx，语文：xxx&quot;）将成绩字段拆分为科目和成绩两个字段，每个学生拥有的科目不一定相同 3、一个文件里是一个整数占一个G大小，求该
大数据开发实习-----欢聚（Hago)
一共两轮技术面一轮HR面，第一轮面试hive 问题居多，第二轮hadoop 问题居多，整体来说问题不是很难，方向为数仓。一面: 11.30下午牛客网面试 30min 自我介绍数仓项目介绍什么是全量表，什么是增量表，以及应用的场景了不了解拉链表，讲一下拉链表如何生成什么是内部表，什么是外部表，有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法讲一下熟悉的窗口函
shein 大数据开发暑期实习
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题反问用什么做什么基本大数据组件都会用，shein数据量大而
脉脉大数据开发实习生一面
岗位JD 使用大数据组件对海量数据进行建模，参与数据仓库的的开发、维护及优化岗位要求计算机相关专业，对大数据有浓烈的兴趣扎实的计算机基础，熟练使用python/java/scala其中至少一种语言熟悉Hadoop生态体系，包括但不限于Hadoop/Hive/Spark/Clickhouse 学习能力强，强烈的责任心，具有较强的沟通能力及团队合作精神，细致耐心、积极主动有大规模数据/日志处
小米大数据开发实习面经
1. 自我介绍 2. 问了一下简历上的项目（研一在国电做的） 3. Spark有没有过调优 4. 基于我对Spark调优的一些回答进行追问： ● 我提到了利用RDD缓存进行RDD复用，追问Spark缓存一般可以用什么函数做到（cache，presist） ● 追问并行度的设置方法（配置文件或在代码中） ● 并行度的值一般根据什么设置（CPU核数的2-3倍） 5. Hive执行原理（SQL到MR的过
大数据开发暑期实习总结
前言从2023年3月初开始投递暑期实习，几乎所有大厂都投递过了，有些简历都过不了，有些一面直接挂了，虽然说确实互联网行情不是特别的好，但是应该还是自己能力不足，做的简历不够漂亮； 4月的时候第一次刷到了@三石数据的面经帖（见下图），于是跟他聊了一下，真的收获太多了，非常非常感谢这位大佬的指导，不仅帮助我修改简历，而且还给我解答一些在面试中遇到的问题；大佬要是没女朋友的话，我愿意以身相许（开个玩笑
字节面试-大数据开发实习
视频ms 前三分钟自我介绍数据仓库的了解怎样设计数据分层了解的大数据组件 spark用于解决什么问题 spark底层逻辑 sql的join实现方式举例A（3） join B （5）有几条数据 join底层逻辑 sql题查询用户峰值全程不到30分钟 **我就是一个小菜鸡。问就是面试凉凉问的其实感觉没有特别难但就是啥都不会。还是学的太过浅层次。总的来说项目拷打底层深挖。G
滴滴大数据开发实习面试
了解大数据吗？分布式是什么？ 1、list、set、map之间的区别与联系 2、arraylist和linkedlist之间的区别与联系 3、数组与链表的区别 4、线程和进程的区别？为什么要设置线程？ 5、线程安全如何保证？几种方法？为什么会出现线程不安全 6、线程池用于干啥？ 7、同步与异步的概念？ SQL相关 1、讲一下索引？索引怎么实现 2、列排序是什么数据结构？ 3、B树和B+树的区别？
（暑期实习）美团大数据开发实习生一面
个人情况简述：本硕双非，acm银牌随便找群友要了个内推投递笔试4.2题，投递选择的是都喜欢，笔试完在人才池待了十几天，被数仓部门捞了一面（总时长50分钟）聊实习经历和简历项目，聊了约30分钟聊天环节把整个技术栈聊的差不多了，还有离线、实时数仓的很多点，后面又问了几个问题离线数仓分层设计、实时数仓设计，spark、flink相关生成经验，S3、OSS的使用理解，k8s的使用心得等都在聊项
大数据开发暑假找实习总结
目前去团子了。总结一下一个多月以来找实习的历程，也算是非常坎坷了，好在最后结果还行，最后说一句我是团孝子 #暑假实习# #美团# #大数据开发#

首页

1

2

3

4

5

尾页

最新发布

米塔碳UI设计师面试经验分享美团到综搜推日常实习一面凉经鹅子WXG微信支付部门机器学习实习凉经 VIVO策略算法分析实习一面凉经（体验最差的一次）商汤一面- 大模型算法应用实习生

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

node.js - sequelize 事务错误不回滚，打印回滚了，但是第一条还是更新了？网如何在 Flutter 中解决 flutter_secure_storage 无法使用的问题？网 python - 利用Python-doc创建DOC文件不成功？网 vue.js - Vue + elm-plus UI布局问题：如何控制文本垂直排列？网 vue.js - Electron + Vue 项目在 WebStorm 中 @router 路径报红线如何处理？网

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

SimJQ LDProgressView x-terminal LANraragi MindSpore-GraphEngine McDPF JPolite Bootswatch

文档资料

Effective Modern C++ 中文版（不完整）Vanilla 中文手册蘋果 Swift 官方教學 v2.0 阿里云 Link Develop 开发指南 V1.6.1 轻推开发文档和帮助文档