当前位置：首页 > 专题 >

《数据开发工程师》专题

网易大数据开发日常实习已oc
部门：网易云 8.23约面，8.25 一面 8.29 二面。8.30 hr面一面： 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询，项目里是怎么做的。 4.四道sql，十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
茄子科技大数据开发一面 (凉经)
🍆 数仓方向 9.19 一面第二天就挂了自我介绍，科研项目介绍(项目相关问题提问) 1) 内部表和外部表的区别？ 2）窗口函数？ 3) 知不知道比HDFS活跃度更高的产品？ 4） Zookeeper常用得场景和用法？RATF协议了解吗？ 5） CAP原理？一致性的概念？ 6） Hadoop如何保证一致性？ 7） Hadoop生态圈和MySQL等分布式数据库的区别? 8） Hive支
汇量科技大数据开发一面（凉经）
9.22 一面 1h 自我感觉挺好的还，9.26挂了 1）自我介绍 2）两个项目介绍 3）Hadoop的元数据存在哪里？ 4）什么是缓慢变化维？拉链表的数据具体是怎么更新？并举例 5）Kafka的零拷贝机制？ 6）对RDD的了解 7）哪些情况下会发生索引失效？手撕代码 1）无重复字符的最长子串双指针+map 2）求出数组中最小的n个数 3）求出每个部门的薪资前三的用
【星环3面已OC】大数据后端开发
前言星环感觉整个流程非常不错，二面面试官不是搞大数据的，但是交流上感觉到了尊重，面试实在7月份，八月份就给意向了，进展到十月份了对比看来星环流程真的不错（PDD推荐组某个面试官一生黑），看到大数据后端已经不招人了，但是可能会拒掉一面忘记了没有记录二面 1.1. HBASE架构 1.2. Regionserver结构 1.3. Hbase避免热点数据（Rowkey的设计） [大白话彻底讲透
2022/10/21 天翼云大数据开发（已OC）
2022/10/11 一面 30min 自我介绍实习项目介绍项目中你做了什么任务实习项目难点阿里云大数据框架怎么学习的大数据开发具体想做什么方向 hive中的开窗函数用过吗 rank、dense_rank、row_number区别 hive行转列列转行 spark用过吗 spark为什么比MapReduce快 spark数据倾斜遇到过吗数据倾斜怎么解决的 Java中的HashMap底
2023秋招—数据开发面经—多益网络
1、实习的工作是什么？ 2、SQL调优有哪些？ 3、介绍一下项目，主要做什么工作？（项目介绍还不顺畅） 4、为什么学大数据？ 5、项目里的Flume是怎么用的？ 6、TailDir为什么可以断点重传？（面试官说不能） 7、Linux什么指令可以监听文件？ 8、Flume的事务是怎样的？（因为上一题提到了事务） 9、Kafka的基本架构？ 10、RXR队列（不知道是什么东西） 11、Kafka的pa
2023秋招—数据开发面经—蚂蚁金融
一面：电话面试 1、自我介绍 2、挑一个实习项目讲一讲 3、项目里的数据是怎么处理的？ 4、数据研发选择哪一块？（数据仓库、数据平台、数据算法、数据挖掘） 5、讲讲MapReduce的原理 6、环形缓冲区为什么要反向？ 7、实习的存储计算用的是什么组件 8、有金融相关知识的储备吗？反问： 1、这一面算是第一面吗（是）？算专业面吗（是）？ 2、做什么工作的？（国外金融银行业务） 3、用到哪些技术栈
2023秋招—数据开发面经—联友科技
面试岗位：数据库工程师两个面试官，一个主要问知识点，另一个主要问实习、项目介绍一下HDFS的写流程 Spark、Flink有哪些部署模式？ Standlone和Yarn（Client、Cluster），会话模式、单作业模式、应用模式有没有写过Flink平台的开发代码？ Yarn由哪些角色组成？各自的任务是什么？ Yarn的调度器有哪些？ Hive和HBase的区别是什么？项目中Kafka的
网易互联网数据开发一面凉经
1、Spark的作业提交流程？ 2、Spark的核心组件有哪些？ 3、宽窄依赖的理解，为什么要分宽窄依赖？ 4、SparkContext在工作时做了什么事？ 5、Spark shuffle有哪些？ 6、Hashpartitioner与RangePartitioner的实现 7、对维度建模的理解？ 8、雪花模型和星形模型的理解以及优劣对比？ 9、线程安全有了解么？介绍下面试官很友好，是我太菜了，全
ACCESS大数据开发实习一面凉经（20min）
自我介绍问对hadoop各个组件的了解解释下mapreduce的过程问有没看过谷歌的GFS论文问项目里数据库咋建模设计的对维度建模的了解对数仓的了解，数仓一般咋分层 GGGG，这之前只关注框架底层了，，没看过数仓的东西#大数据开发面经##实习生[话题]##access#
佳都科技大数据开发后端笔试
笔试时间 90min 20道选择题 + 3道编程题主要还是考数据库的操作如何增删查改如何检索然后阅读数据库代码找错误/模拟运行只有一道算法题是AcWing_3578题的变式个人感觉算是降低难度每次操作选取两个数 ai 与 aj, 并赋值ai = ai + aj, 删除aj; 中位数计算方式为为（m+1)/2向下取整。输入第一行数据组数t 此后每组第一行数组长度n 操作k数
欢聚大数据开发实习面经（已offer）
首先做了三道SQL题，主要涉及分组聚合、窗口函数。 3.3 一面 28min： 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min： 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
美团大数据开发暑期实习一面
时长：1h 由于问题太多，分四类进行整理 0. 实习相关：之前有数据开发的实习经验，就问了之前工作有没有spark或者hivesql优化的经验；如何确保数据的有效性；实习公司数据存储格式（Parquet），还知道哪些数据存储格式 1. 大数据相关问题：为什么Spark比MR快；对Spark的了解；两个表join的优化方法（大小表join可以map-side join, join前过滤null值）；
03/22 美团大数据开发一面凉经
总共33min，凉透了，可能因为我是第一次面试，没经验，被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢？ 7、协同过滤的常用算法有了解吗？ 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql：统计最近下单的用户是在去年12月份的用户数量 11、
美团暑期实习-大数据开发一面
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验，求个好运时长一个小时二十分钟自我介绍因为学统计的，问了中心极限定理和大数据定律机器学习-XGBoost算法简介两道智力题：逻辑判断谁说谎了和分金条问了为什么研究生跨专业保研了？ Hive和MySQL区别数据库的索引有什么用说一下索引的类型，还有B+树索引数据仓库和关系型数据库区别 Hadoop生态圈简介问我SQL写的

首页

54

55

56

57

58

59

60

61

62

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档