当前位置：首页 > 专题 >

《大数据开发实习》专题

科大讯飞大数据开发工程师 1面已挂
45min 自我介绍数仓项目的数据采集模块怎么做的 flume组成，各个模块的功能为什么要使用这些source或者是sink file channel和memory channel有什么区别，分别在什么场景使用 flume内部原理 sink消费能力弱，channel会不会丢失数据数千台机器需要采集日志小文件到hdfs上，该怎么办？数千个flume要怎么统一配置，修改就分发吗？ maxwel
蔚来 24届日常实习数据开发实习生
蔚来一面数据开发 24届日常实习 base武汉看了jd，感觉岗位更偏向数仓方面的，面试过程中疯狂拷打框架底层原理我本人不是很match 1. 自我介绍 2. 问了我简历上的项目，在项目中遇到的问题 3. 然后项目集群环境，在搭建节点服务器过程中遇到的问题 4. 高可用集群这些怎么实现出错了怎么办怎么排错 5. 造成高可用集群脑裂的原因是什么 6. Hadoop 如果配置的zkfc无法
荣耀大数据开发岗-面试官有病
大概是今年五月初面试了荣耀大数据的Java开发港，面试官全程基本什么都没有问。也没有问一些八股文的问题，也没有问算法题。就是轻蔑地看了一眼我的简历，然后问你的项目是自己做的，还是根据别人的来做的，然后直接说你做的这个项目怎么这么简单，因为我还有一个机器学习的项目，然后他就随便问了项目做什么的。最离谱的是他说你有机器学习的经历，那么我推荐你去客户端。总之全程什么技术问题都没有问你，也没有问项目
茄子科技大数据开发一面 (凉经)
🍆 数仓方向 9.19 一面第二天就挂了自我介绍，科研项目介绍(项目相关问题提问) 1) 内部表和外部表的区别？ 2）窗口函数？ 3) 知不知道比HDFS活跃度更高的产品？ 4） Zookeeper常用得场景和用法？RATF协议了解吗？ 5） CAP原理？一致性的概念？ 6） Hadoop如何保证一致性？ 7） Hadoop生态圈和MySQL等分布式数据库的区别? 8） Hive支
恒生 2022.9.24 大数据开发工程师笔试
1）10道不定向选择题，共40分，包括知识点：关系型数据库有限自动机进制转化 HIVE特点、复杂数据类型 Flink窗口分类、通过什么方式处理数据迟到、时间语义 SPARK RDD特性 LSM 2）1道数据库，给出一个表，包括三个小题： 1. 玩家在线时间排名 2. 计算 pv, uv 3. 计算第一天留存率 3）2道编程题，题目描述中有说若写不出来也可以在注释中写思路或伪代码 1. J
汇量科技大数据开发一面（凉经）
9.22 一面 1h 自我感觉挺好的还，9.26挂了 1）自我介绍 2）两个项目介绍 3）Hadoop的元数据存在哪里？ 4）什么是缓慢变化维？拉链表的数据具体是怎么更新？并举例 5）Kafka的零拷贝机制？ 6）对RDD的了解 7）哪些情况下会发生索引失效？手撕代码 1）无重复字符的最长子串双指针+map 2）求出数组中最小的n个数 3）求出每个部门的薪资前三的用
【星环3面已OC】大数据后端开发
前言星环感觉整个流程非常不错，二面面试官不是搞大数据的，但是交流上感觉到了尊重，面试实在7月份，八月份就给意向了，进展到十月份了对比看来星环流程真的不错（PDD推荐组某个面试官一生黑），看到大数据后端已经不招人了，但是可能会拒掉一面忘记了没有记录二面 1.1. HBASE架构 1.2. Regionserver结构 1.3. Hbase避免热点数据（Rowkey的设计） [大白话彻底讲透
2022/10/21 天翼云大数据开发（已OC）
2022/10/11 一面 30min 自我介绍实习项目介绍项目中你做了什么任务实习项目难点阿里云大数据框架怎么学习的大数据开发具体想做什么方向 hive中的开窗函数用过吗 rank、dense_rank、row_number区别 hive行转列列转行 spark用过吗 spark为什么比MapReduce快 spark数据倾斜遇到过吗数据倾斜怎么解决的 Java中的HashMap底
济南特来电大数据开发工程师
一面时间：2022.10.13 星期四 10:30-10:45 和HR聊天比较多自我介绍是否了解就业地点？兴趣爱好优缺点是什么？现在有没有女朋友？（？？？这都要问，哈哈哈）是否考虑考研？为什么？大学期间参加过什么项目？简单介绍一下面对一个新技术怎么去学习？大学期间最后悔的事？期望薪资是多少？ -------------------------------------------
佳都科技大数据开发后端笔试
笔试时间 90min 20道选择题 + 3道编程题主要还是考数据库的操作如何增删查改如何检索然后阅读数据库代码找错误/模拟运行只有一道算法题是AcWing_3578题的变式个人感觉算是降低难度每次操作选取两个数 ai 与 aj, 并赋值ai = ai + aj, 删除aj; 中位数计算方式为为（m+1)/2向下取整。输入第一行数据组数t 此后每组第一行数组长度n 操作k数
03/22 美团大数据开发一面凉经
总共33min，凉透了，可能因为我是第一次面试，没经验，被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢？ 7、协同过滤的常用算法有了解吗？ 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql：统计最近下单的用户是在去年12月份的用户数量 11、
美团数据开发一面大概率寄了
1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样？ 14
深智城-大数据开发工程师-面经
#国企#一面约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的？ - 数据分片是怎么做的？ - 如何保证节点间数据的一致性？ - 如果有节点挂掉会怎么办？ 1. 地理数据如何索引？ 2. 喜欢用什么开发语言？二面约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗？解释一下分布式事务是做什么的 - 如何保证分布式事务的原
美团优选大数据开发timeline和面经
秋招第一个意向感恩团子！二面和hr面感觉自己发挥得并不是很好，一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向一面 60min: jvm了解哪些垃圾回收了解哪些主线程和另外十个线程，怎样使主线程最后执行完毕（join、await） flink checkpoint kafka有序和不丢如何保证算法题链表
众安保险大数据开发一面凉经
1、自我介绍 2、实习经历介绍 3、实习项目难点介绍 4、你比别人的优势是什么 5、hive相比与传统数据库的优势是什么 6、hive集成了mapreduce，如何将hive语句转换为mapreduce 7、hive on spark和spark on hive的区别 8、spark调优你做过哪些？ 9、数据倾斜调参和不调参的方法你知道有哪些 10、数仓的存储介质有哪些 11、数仓建模的话你会如何

首页

9

10

11

12

13

14

15

16

17

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档