当前位置：首页 > 专题 >

《大数据开发》专题

顺丰大数据开发一面
9.11 一面（30min）纯八股：介绍下hadoop（hdfs、mapreduce、yarn）介绍下hbase 介绍下flink flink checkpoint、connect和union的区别、flink如何处理数据倾斜介绍下kafka kafka如果有台机器挂掉会发生什么链表反转面试官全程表情和语气冷淡，体验不是很好..当然答得感觉也很一般
美团大数据开发面经
个人情况：本双一流硕211非科班，一段搞深度学习的实习。项目自己做的。全程面试被追问麻了面试官有问题必追问自我介绍项目深挖（20min）实习工作介绍（5min）数据倾斜有哪几种解决方法 Group by 倾斜，join倾斜，null值倾斜分别说说这些倾斜怎么解决：全说上来了，面试官问：还有呢？。。。开启负载均衡，对小文件进行合并，对数据类型进行检查，还有呢？我就记得这些了 Hdfs小文件
美团大数据开发面经
部门：优选事业部-美团买菜 timeline: 8.24 一面 8.28二面 8.31 hr面 9.7 oc 一面：项目介绍什么是指标体系指标体系包含元素指标分类数仓分层、分层好处数仓分层和指标分类之间有什么关系什么是总线矩阵什么样的数仓是一个比较好的数仓什么方法可以落实上面说的数仓缓慢变化维；除了拉链表还有哪些方式什么情况下可以使用map join 怎么解决数据倾斜问题 J
平安科技大数据开发
2023/10/10 平安科技大数据开发（37min）（1）自我介绍（2）对于平安科技的数据开发岗的理解和认为它是做什么的？和自己的契合度是怎么样的？（3）数据库学习到哪些东西，学了多久，什么时候学的，有实践过吗？（4）sql分哪几类，违反主键约束会出现什么问题，索引什么情况下回失效，有自己去安装过吗？（之前没准备数据库的内容，答得很差，后边的面试才好好看了数据库的东西）（5）使用sq
某厂外包-大数据开发
1.自我介绍 2.描述一张表的设计流程 3.针对简历提问，问的不算难 4.kafka的用法及途径 5.redis的几种类型（我有写，但是忘了）， 6.有没有bi可视化经验。 ----------------- 是的，没有看错，简历上写的就会可能提问，并不会针对你。
字节大数据开发一面
1.自我介绍 2.实习介绍 3.实习工作内容下游使用方主要有那些？ 4.AI团队数据支持他们使用这个数据做的什么 5.除了对表的支持之外，是否在计算层面做过一些优化 6.boradcast join和sortmergeJoin的区别和使用场景的不同然后面试官开始说，我觉得概念你应该都会，我就不问你了，所以我后面会从场景的角度去考验你的技术理解，本人听到这里心凉了半截，因为两段实习全是离线，这
京东-大数据开发凉经
110分钟，全程无项目和算法，全是八股深挖，被拷打惨了 1、谈一谈你对java面向对象的理解，什么时候用接口，什么时候用抽象类，从本质上讲一下区别？ 2、都有了解过哪些设计模式？创建对象的设计模式有哪些？工厂模式和建造者模式分别在什么场景下使用，举一个具体的例子 3、java的hashmap在1.8之前链表中采用的头插法的方式，为什么1.8之后改成尾插法？头插法的方式可能会极限情况连成一个环，举一
PCG大数据后台开发(45min)
腾讯二进宫，秒挂，简单题没写出来，太菜了。。。自我介绍项目相关介绍一下java的反射介绍一下mysql引擎 MyISAM引擎什么时候用讲一下垃圾回收讲一下集合讲一下hashmap 算法题:大数翻转 (乐死了，这么简单的题没做出来，我转了字符串双指针超时) 反问: ∽具体有什么业务提供大数据内容服务balabala ∽技术栈有什么大数据开发岗spark之类，后台开发岗golang
shein大数据开发实习生
1.自我介绍 2.实习最大收获 3.odps平台的性能调优与spark的性能调优的共同点和差异点 5.spark的countdistinct算子优化 6.bitmap作用在expload的作用是什么？ 7.小文件过多的影响 8.sql countdistinct优化代码手写 9.反问 #大数据开发##数据人的面试交流地#
美团大数据开发实习
一面——60mins 自我介绍拉链表的制作，数据量有多少，为什么不用快照表呢项目有哪些表数仓分层有哪些，具体做了什么，数仓分层作用怎么设计表，怎么建模，DIM DWD层的主题分了哪些如何做的可视化什么是数据倾斜，数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的对哪些数据库了解 Shuffle有哪几种类型在shuffle的过程中会进行排序吗
脉脉，大数据开发实习
一面：(1h) 1.自我介绍 2.选一个熟悉的项目介绍一下吧 3.看你简历上写了进行过数仓的搭建，那你说一下数仓分几层合适？ 4.每一层干了那些事儿？ 5.你说一下数仓为何要进行分层？ 6.数仓的建模方法知道吗？ 7.指标分类有哪些？（回答的是原子指标，派生指标，衍生指标） 8.你的ods层为何选择gzip压缩呢？ 9.除了gzip压缩还有哪些压缩方法？介绍他们的区别？10.项目中你的hive表使
上海银行大数据开发（数仓）数据一面
离线数仓项目介绍 hdfs读流程 hdfs 中datanode怎么与namenode交互 mr过程 hive数据倾斜，介绍原因和解决方案介绍一下网络结构，tcp在哪一层 java有哪些集合类介绍java接口 MySQL索引数据结构（B+树）反问上海银行数仓技术框架
数据开发 - 面经 - 来未来（医疗大数据）
2024.1.9 面试 Boss直聘沟通公司要求驻场开发，接受加班，接受出差你是25届是吧？能在六个月左右是吗？目前在校吗？后续有什么规划？你怎么理解数据开发这个岗位的？讲讲简历上这两个项目？是你在学校做的是吧？项目你是全程参与是吧？聊天这个项目的数据源是哪里来的呀？项目整体是落在HDFS上是吧？单一架构，嗷，然后可视化，是哇？下一个电商项目介绍一下？数据来源讲讲？那意思是
开源大数据OLAP引擎
主要内容：1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述如今的开源数据引擎多种多样，不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种，即StarRocks(DorisDB)，ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid，Kylin和HBase。MPP引擎主要有Trino，PrestoDB和Impala。这些引擎在行业内有着广泛的应用。在云资源层，主要有E
20220905荣耀大数据开发面经
20220905荣耀大数据开发面经写在前面：搬来约在今天下午五点五十的面试，估计是前面的结束的比较快，四点五十给我打个电话让我去面试（当时还在学习室看面经呢/大哭），然后驱车一路彪回去，当时又是军训散场+下课，那叫一g个人多哟，急得不行还是强行镇静/哭算是最近一场比较愉快的面试，面试官人特别好~有说有笑的，在这里记录下，顺便攒攒人品，求offer！！孩子快卷哭了/大哭流程：自我介绍项目难

首页

1

2

3

4

5

6

7

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

awesome-datascience libpcap safe-start-koa2 Workerman smart-servlet Eurasia bLazy.js Vertical Swipe Views

文档资料

MOAC 链中文文档 TweenMax 插件帮助文档数据结构思维 Unity 5.5 手册 Java 高并发核心编程 NIO、Netty、Redis、ZooKeeper 卷1