当前位置：首页 > 专题 >

《大数据开发实习》专题

大数据开发实习面筋。
1.平常是用python还是java？python和java掌握程度？ 2.hadoop的组成，每部分有什么用。 3.spark掌握的怎么样，SQL练过哪些题。 4.mapreduce源码看过吗？ 5.wordcount的流程。 6.Scala有没有学过？然后开始挖简历，还问了我一些业务的问题。说后面会通知二面，也不知道有没有...
百度大数据开发实习
10.16投递 10.17一面（50minute）自我介绍项目细节 mysql（这里问了很多）大数据的基本八股计算机网络tcp 一道sql题，一道算法题（吐槽一下百度的如流，用网页端看不到聊天框，最后还是下载了客户端才看到，面百度的小伙伴记住面试了要下载如流）反问:问了一下业务 10.19二面（30minute）自我介绍项目细节流程两个项目的关系为什么不继续做大模型实习多久
shein大数据开发实习生
1.自我介绍 2.实习最大收获 3.odps平台的性能调优与spark的性能调优的共同点和差异点 5.spark的countdistinct算子优化 6.bitmap作用在expload的作用是什么？ 7.小文件过多的影响 8.sql countdistinct优化代码手写 9.反问 #大数据开发##数据人的面试交流地#
美团大数据开发实习
一面——60mins 自我介绍拉链表的制作，数据量有多少，为什么不用快照表呢项目有哪些表数仓分层有哪些，具体做了什么，数仓分层作用怎么设计表，怎么建模，DIM DWD层的主题分了哪些如何做的可视化什么是数据倾斜，数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的对哪些数据库了解 Shuffle有哪几种类型在shuffle的过程中会进行排序吗
脉脉，大数据开发实习
一面：(1h) 1.自我介绍 2.选一个熟悉的项目介绍一下吧 3.看你简历上写了进行过数仓的搭建，那你说一下数仓分几层合适？ 4.每一层干了那些事儿？ 5.你说一下数仓为何要进行分层？ 6.数仓的建模方法知道吗？ 7.指标分类有哪些？（回答的是原子指标，派生指标，衍生指标） 8.你的ods层为何选择gzip压缩呢？ 9.除了gzip压缩还有哪些压缩方法？介绍他们的区别？10.项目中你的hive表使
大数据开发实习-----欢聚（Hago)
一共两轮技术面一轮HR面，第一轮面试hive 问题居多，第二轮hadoop 问题居多，整体来说问题不是很难，方向为数仓。一面: 11.30下午牛客网面试 30min 自我介绍数仓项目介绍什么是全量表，什么是增量表，以及应用的场景了不了解拉链表，讲一下拉链表如何生成什么是内部表，什么是外部表，有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法讲一下熟悉的窗口函
shein 大数据开发暑期实习
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题反问用什么做什么基本大数据组件都会用，shein数据量大而
小米大数据开发实习面经
1. 自我介绍 2. 问了一下简历上的项目（研一在国电做的） 3. Spark有没有过调优 4. 基于我对Spark调优的一些回答进行追问： ● 我提到了利用RDD缓存进行RDD复用，追问Spark缓存一般可以用什么函数做到（cache，presist） ● 追问并行度的设置方法（配置文件或在代码中） ● 并行度的值一般根据什么设置（CPU核数的2-3倍） 5. Hive执行原理（SQL到MR的过
大数据开发暑期实习总结
前言从2023年3月初开始投递暑期实习，几乎所有大厂都投递过了，有些简历都过不了，有些一面直接挂了，虽然说确实互联网行情不是特别的好，但是应该还是自己能力不足，做的简历不够漂亮； 4月的时候第一次刷到了@三石数据的面经帖（见下图），于是跟他聊了一下，真的收获太多了，非常非常感谢这位大佬的指导，不仅帮助我修改简历，而且还给我解答一些在面试中遇到的问题；大佬要是没女朋友的话，我愿意以身相许（开个玩笑
字节面试-大数据开发实习
视频ms 前三分钟自我介绍数据仓库的了解怎样设计数据分层了解的大数据组件 spark用于解决什么问题 spark底层逻辑 sql的join实现方式举例A（3） join B （5）有几条数据 join底层逻辑 sql题查询用户峰值全程不到30分钟 **我就是一个小菜鸡。问就是面试凉凉问的其实感觉没有特别难但就是啥都不会。还是学的太过浅层次。总的来说项目拷打底层深挖。G
北京MetaAPP大数据开发实习生
给了三道题，两道SQL，还有一个程序设计题。 1、银行交易记录表，字段有(id，存取金额(存为+，取为-)，交易id) （1）求每个人的总余额（2）求每次交易后的余额 2、学生成绩表，字段为：学生id、成绩（内容格式为：&quot;数学：xxx，语文：xxx&quot;）将成绩字段拆分为科目和成绩两个字段，每个学生拥有的科目不一定相同 3、一个文件里是一个整数占一个G大小，求该
滴滴大数据开发实习面试
了解大数据吗？分布式是什么？ 1、list、set、map之间的区别与联系 2、arraylist和linkedlist之间的区别与联系 3、数组与链表的区别 4、线程和进程的区别？为什么要设置线程？ 5、线程安全如何保证？几种方法？为什么会出现线程不安全 6、线程池用于干啥？ 7、同步与异步的概念？ SQL相关 1、讲一下索引？索引怎么实现 2、列排序是什么数据结构？ 3、B树和B+树的区别？
tplink大数据开发
6.27一面 20min 问简历，介绍项目提到的各种模型，做了什么优化有没有spark实践的经历介绍一下hadoop 了解哪些机器学习算法 xgboost和随机森林的区别有用Java做过项目吗（无...）反问 6.28二面 35min 简历项目一个一个详细讲 transformer编码器解码器区别 transformer位置编码的情况 spark实践经历反问
脉脉大数据开发实习生一面
岗位JD 使用大数据组件对海量数据进行建模，参与数据仓库的的开发、维护及优化岗位要求计算机相关专业，对大数据有浓烈的兴趣扎实的计算机基础，熟练使用python/java/scala其中至少一种语言熟悉Hadoop生态体系，包括但不限于Hadoop/Hive/Spark/Clickhouse 学习能力强，强烈的责任心，具有较强的沟通能力及团队合作精神，细致耐心、积极主动有大规模数据/日志处
大数据开发暑假找实习总结
目前去团子了。总结一下一个多月以来找实习的历程，也算是非常坎坷了，好在最后结果还行，最后说一句我是团孝子 #暑假实习# #美团# #大数据开发#

首页

1

2

3

4

5

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10