当前位置：首页 > 专题 >

《大数据开发工程师》专题

ihandy 大数据开发工程师面经
一面：主要还是挖简历自我介绍问项目经历，聊聊过往开发的项目（聊了很久）聊聊MySQL的事务细聊ACID 隔离级别 innodb默认级别 innodb的底层数据存储对比mysql和hive kafka为什么吞吐量大场景题目：100个G的文件，保存用户id和看的bookid，求top10阅读量的书反问
知乎大数据开发工程师面经
一面：感觉一上来就是主管面，主业务面，考验业务能力和沟通能力介绍下专业的课程，说说最喜欢哪一门，为什么直接问实习经历实习中的项目，扣细节（大部分时间都在问这个）在同程做了什么业务广告业务数仓负责哪些东西广告投放的指标，如曝光、转化等等广告有哪些类型聊聊广告投放流程，投前、投中、投后投中的过程每一轮具体的事情对比hive和spark 为什么业界都用spark不用mr了聊聊fl
美团大数据开发工程师一面
发面经，攒好运面试官是个小姐姐，说话非常温柔，但万万没想到面得内容和后端确实关系不大自我介绍你用了redis，那能说说他有什么好处吗以及他适用于什么场景？那redis有什么缺点呢？（我不太清楚，只能说内存要求可能比较高？以及缓存雪崩和击穿）数据库四大特性以及四大隔离级别说说持久性索引以及你用过索引吗分享一下你在做项目的时候有没有遇到什么比较大的挑战然后考了一道简单的mysql j
美团-大数据开发工程师(一面)
首先是自我介绍：balabala 是否了解过数仓和Spark？再Linux系统中，找到对应的Java进程并删除。同样的在 Linux系统下，删除使用某端口的进程。介绍一下Mysql和LSM，并分析下这两种引擎是基于什么？适用于什么场景？ sql编程题：牛客每个人最近的登录日期(二)() 算法题：二叉树的最大路径和 (较难) AC Code： class Solution { public:
恒生 2022.9.24 大数据开发工程师笔试
1）10道不定向选择题，共40分，包括知识点：关系型数据库有限自动机进制转化 HIVE特点、复杂数据类型 Flink窗口分类、通过什么方式处理数据迟到、时间语义 SPARK RDD特性 LSM 2）1道数据库，给出一个表，包括三个小题： 1. 玩家在线时间排名 2. 计算 pv, uv 3. 计算第一天留存率 3）2道编程题，题目描述中有说若写不出来也可以在注释中写思路或伪代码 1. J
济南特来电大数据开发工程师
一面时间：2022.10.13 星期四 10:30-10:45 和HR聊天比较多自我介绍是否了解就业地点？兴趣爱好优缺点是什么？现在有没有女朋友？（？？？这都要问，哈哈哈）是否考虑考研？为什么？大学期间参加过什么项目？简单介绍一下面对一个新技术怎么去学习？大学期间最后悔的事？期望薪资是多少？ -------------------------------------------
深智城-大数据开发工程师-面经
#国企#一面约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的？ - 数据分片是怎么做的？ - 如何保证节点间数据的一致性？ - 如果有节点挂掉会怎么办？ 1. 地理数据如何索引？ 2. 喜欢用什么开发语言？二面约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗？解释一下分布式事务是做什么的 - 如何保证分布式事务的原
科大讯飞大数据开发工程师 1面已挂
45min 自我介绍数仓项目的数据采集模块怎么做的 flume组成，各个模块的功能为什么要使用这些source或者是sink file channel和memory channel有什么区别，分别在什么场景使用 flume内部原理 sink消费能力弱，channel会不会丢失数据数千台机器需要采集日志小文件到hdfs上，该怎么办？数千个flume要怎么统一配置，修改就分发吗？ maxwel
蔚来数字化业务大数据开发工程师
投nlp挂，转岗大数据开发一面算法题：一个只包含1，2，3的数组，排序使得3在最前，2在中间，1在最后。要求时间复杂度O(n)，空间复杂度O(1)。用双指针，类似快排的思路。二面算法题：数组中，第一个非0的数位置索引，时间复杂度O(log n)。二分查找。两个面试官都很nice，没有因为岗位不匹配为难。#我的秋招日记#
海信大数据开发工程师（一面凉经）
今天早上刚洗漱完，托舍友的福十点才刚准备出寝室门，突然一个电话打进来，说是海信的想给我进行简短的电话面试，我寻思这种面试会问什么问题随即应允。但没想到会把我问成这样...... 开局问我自己本科和研究生都学了些什么，然后不依不饶的追问我研究生学了什么？接着问我在实习期间做的数仓的底层架构和数仓设计，问从后端到前端的数据流程，问存储介质是什么，接着问数据是怎么流转的一连串问题让我难以招架；之后问我在
中科曙光大数据开发工程师一面
1、计算机网络：（1） TCP的三次握手和挥手（2）OSI7层模型，每层分别有什么作用（3）对哪个层的了解比较多一些，平时用得最多是哪一层（4）传输层的协议有哪些（5）是否对ip协议有了解，ip协议的分类等 2、数据结构（1）数据结构的分类（2）红黑树、平衡二叉树查找的过程、原理（3）hash,hash冲突，解决hash冲突时单链表长度过长的问题（4）大小堆 3、算法（1）堆排
德拓-外包面试-大数据开发工程师
1.自我介绍 2.数据采集相关，怎么把kafka中的数据采集到mysql中？忘了 3.hive，两张表的重复数据，怎么去重？回答distinct,group by ，开窗取第一条，开窗函数是哪个？没回答上来 4.udf函数写过吗，flink消费kafka中的数据写过代码吗，需要看代码？ 5.使用java干过那些代码？面试时长：10分钟，面试效果，差不足：对于简历上的内容，回答支支吾吾，
美团大数据开发工程师-转正实习
发帖求好运部门：基础研发平台-数据科学与平台部 --------- 一面：57min 1.自我介绍； 2.讲最熟悉的项目； 3.爬虫遇到的问题，如何处理的呢； 4.mysql：left join \ right join \ full join，用一个案例讲一下； 5.数据仓库了解吗； 6.Hashmap的原理了解吗； 7.Hadoop了解吗； 8.NameNode了解吗； 9.HDFS为什么安
大数据研发工程师面经
公司：广州网易互娱面试时间：2024.07.23，共计65分钟共两位技术面试官，轮流提问流程：自我介绍、项目、基础知识(Java基础方面、数据库方面、计算机基础方面(操作系统)、计算机网络方面)、算法笔试。问题自我介绍项目方面成本治理中负责的工作内容数据平台中，任务计算成本的计费维度 Spark作业从哪些方面可以发现能够优化？ Spark作业可以从哪些方面进行优化？从哪些配置入手
网易云音乐大数据开发工程师 1面
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别，分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的，有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么？怎么学习？反问 1. 部门做什么业

首页

1

2

3

4

5

尾页

最新发布

某一面虾皮 NLP 一面美的寒假实习llm面经蚂蚁大模型算法面经，say something I don't know 百度 llm算法一面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - vu3+vite 使用vue-pdf-embed预览pdf，组件渲染空白，页面无报错，是什么原因？java - @Async("asyncTaskExecutor") 没有并发处理问题？python - 如何查看：pypi中想要看是否哪些包最受欢迎的库？前端 - 可以安装在内网使用的安卓模拟器？前端调用API之后更新状态逻辑：是触发store的方法进行拉取更新是吗，还是说直接修改store进行更新？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

objection Fqutils Gitee dcm4che pg_pathman AndroidJUnit4 reek WebJars

文档资料

Windows 证书管理帮助文档 YoC 平台文档优质文章推荐 v1 上云如此简单深入理解 Android