当前位置：首页 > 专题 >

《大数据开发实习》专题

爱奇艺数据开发日常实习全程30min
1.自我介绍 2.布隆过滤器如何减少误判？ 3.介绍一下点赞系统是怎么做的？ 4.点赞系统中的缓存和数据库一致性怎么做的？ 5.学习进度记录是如何减少与数据库的写操作的？ 6.Java重写和重载的区别？ 7.JVM垃圾回收算法介绍一下？ 8.ArrayList和LinkedList之间的区别？ 9.乐观锁和悲观锁的区别？ 10.MySQL中的索引是如何实现的？ 11.手撕二叉树中序遍历，非递归 1
12.8字节跳动商业化技术大数据开发实习二面凉经30min
1.自我介绍 2.解释数据库，表，索引 3.索引一遍加在哪里 4.问索引为什么能加快查找速度 5.解释第三范式 6.出了七八道走不走索引的判断题，解释理由（有个范围查找的走没走索引答错了，呜呜呜呜） 7.解释二叉树 8.问二叉树的几种遍历方式 9.算法题，问二叉树存不存在根节点到叶子结点路径上的数据和为一个target。反问，问了部门业务场景，还稍微聊了一点数仓的东西。 12.16update，
SHEIN 数据开发一面
自我介绍什么是数据仓库，和数据库有什么区别？数仓是怎么构建的？（然后开始细抠项目的内容，可怕） Hive的存储格式有哪些？实习做了什么工作？有哪些难点？为什么离职？（寒冬哪有我的位置？） Spark和Flink的区别是什么？（简单说了一两点，感觉不是面试官要的答案） Spark Streaming接收Kafka数据的两种方式？（这题真不会）都学过哪些专业课程？结束整个流程挺快的，会就是
贝壳数据开发(47min)
1. hadoop如何实习高可用 2. 实习的需求（异步io） 3. 进程和线程的区别，通信方式有何不同，在开发过程中，需要注意的地方？ 4. 物理地址空间和逻辑地址空间 5. 两道算法题，一道二分，另一道是改进之后的二分
11.1蔚来数据开发
1.自我介绍 2.项目 3.实习优化工作 4.强化学习原理 5.sql和java/python的区别 6.写题统计每个年级，最高分数学生 7.numpy\pandas有没有一种可变机制的修改（没听过，真没听过） 8.对于RDD不可变的理解 9.对谓词和谓词下推的理解
思特奇数据开发
思特奇一面 19min（已进终面）总体来说不难，但是网上风评不太好 1. 自我介绍 2. 介绍一下你在实习中用到最多，掌握最好的技术？ 3. 介绍一下你项目中，从数据采集，到数据加工到标签生成，整个流程能介绍一下吗？ 4. 标签用什么语言开发？能简单介绍一下hive吗？hive的分区？hive表能单条删数据吗？ 5. 你能说一下hive sql的性能优化吗？参数+代码 6. 说一下你的比赛内容？你
TapTap-数据开发-一面
项目，根据项目问一些八股略记录没答好的 mapreduce的shuffle算法有哪些？ mapreduce说的时候忘记切片过程了，导致后面问map分区数懵了，这都能忘废了雪花和星型模型的区别，我只答了join和冗余，没答全
tplink数据开发一面
1.问实习问项目问成绩 2.机器学习算法了解哪些，分类算法？特征工程？ 3.kafka原理，spark优势反问：业务技术有哪些—离线实时都有，和国外电商有关总结：时间较短二十分钟，比较轻松，不知道有没有二面
菜鸟数据开发 oc
24届秋招一面电话面自我介绍介绍实习工作数据倾斜怎么解决 map join 原理维度缓慢变化了解吗二面视频面介绍实习实习工作具体内容口述SQL题了解哪些数据治理数据仓库迁移介绍下过了几天HR面 OC
大数据实验手册
这是一本关于大数据学习记录的手册，主要针对初学者.做为一个老IT工作者，学习是一件很辛苦的事情.希望这本手册对帮助大家快速的学习与认识大数据(特指Hadoop Spark)，为了不让初学者一下接触爆炸式的新概念，我们会以实验先行，概念跟进的方式进行课程学习，这样有利于大家快速进入状态，而不至于一直深陷逻辑概念出不来，但是每个人的学习方式不一样，仁者见仁智者见智吧。
大数据实习面试记录
#数据人的面试交流地# 今年找实习和秋招都很难，很多公司投了都不理，在这里记录一下自己面过的一些公司面经，顺便拿个奖励 2023届实习面经：音泰思（大数据开发实习生）好像是个对日外包公司，这是我的第一次面试，第一次就体验到了10分钟的面试下边是面试内容： 2022/03/15 一面：自我介绍介绍下项目 jvm垃圾回收机制为什么要用kafka mr flume断点续传 2022/03/15
大数据实习面试记录
#数据人的面试交流地# 第二次实习面试巨杉数据库一面数据库应用开发工程师 2022/03/17 常用的容器，Arraylist hashmap的区别 iolist和listnext（这个可能听错了，当时没听懂是什么）数组、链表、栈、队列的不同 tcp udp 流量控制进程和线程 mysql了解啥，说一下高并发项目 hive sql 用过哪些优化 MVCC用来干嘛进程间通信的方式 Li
大数据实习面试记录
#数据人的面试交流地# 十方融海大数据开发实习生（秋招提前批）一面：2022/05/30 自我介绍 this super 值和引用垃圾回收算法多线程用过吗回收算法进程线程 Linux子系统： linux内核的子系统有5个： 1、进程调度控制系统（SCHED）； 2、内存管理系统（MM），主要作用是控制多个进程安全地共享主内存区域； 3、虚拟文件系统（VFS）； 4、网络接口（NET）
大数据实习面试记录
#数据人的面试交流地# 广州丰石科技大数据开发实习生 2022/06/07 一面：感觉就是kpi 进去之后做一份面试题，hr叫我做小题，后边的大题不需要做，做完之后面试的时候给面试官看，第一句就是后面的题不会做吗？蚌埠住了。。。自我介绍 spark中数据迟到怎么处理 hive权限管理 cdh kafka分区策略 sparkstream对接kafka的方式， hashmap键和值允许为空吗，
大数据实习面试记录
#数据人的面试交流地# 赫基集团大数据开发实习生一面：电话面 2022/06/21 1.sql判断是否有重复数据 2.数据库引擎的区别 3.说一下项目 4.项目中转化率数据异常怎么进行清除二面：主管加hr面 2022/06/31 项目和经历建模（雪花模型和星型模型）渐变字段笛卡尔积用在什么场景？没想出来，最后面试官说这是个坑，说没人愿意遇见笛卡尔积还有普遍hr问题反问科大讯飞 A

首页

13

14

15

16

17

18

19

20

21

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档