当前位置：首页 > 专题 >

《大数据开发实习生》专题

滴滴-数据开发实习二面
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。用户访问日志：user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量，都有重复值，都有可能为空第一次写法： select count(distinct user_id) user_cnt count(distinct
美团数据开发实习面经
26届Java选手，面了很多大厂后端实习基本都挂了，稀里糊涂接了大数据的实习，总体比较顺利，先去沉淀了 9.27 美团数开一面 30min 介绍一个项目项目中的难点 sql 求每月最大和最少的订单数量二分查找面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引介绍一下Hadoop HDFS有几个个副本，为什么深挖Shuffle原理 sql 面试官自
美团数据开发实习已offer
写这篇帖子就是为了回馈广大牛友。美团一志愿投的后端开发，没人捞流程自动结束，二志愿开启后迅速约面。 Timeline 3.29一面 4.3二面 4.8 offer 因为人在海外，hr打不通电话，因此直接就发offer到邮箱了。面经这里就写几个在众多面试中比较让我印象深刻的问题吧。 1. 对于一个电影，怎么设计数据库中的表，怎么加索引？如果用户搜索很复杂，比如可能任何字段都想搜到电影相关信息，
面经|蔚来-数据开发实习
一面： 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的，应该是偏向平台开发那边，所以没问八股二面（5.13）已OC
tplink大数据开发
6.27一面 20min 问简历，介绍项目提到的各种模型，做了什么优化有没有spark实践的经历介绍一下hadoop 了解哪些机器学习算法 xgboost和随机森林的区别有用Java做过项目吗（无...）反问 6.28二面 35min 简历项目一个一个详细讲 transformer编码器解码器区别 transformer位置编码的情况 spark实践经历反问
网易大数据研发实习面经
#23届找工作求助阵地# #实习# #网易智企# 一轮面试： 1.比赛相关（自动化敏感信息提取项目中：数据提取、清洗和转换是怎么做的？数据量大概有多少？最终的训练模型的数据结构是怎么样？有没有涉及到分布式集群来训练模型？） 2.课题相关（刚才说这个项目不是用到多卡多去存储，应该是相当于HDFS文件上面对吧？有没有用到它里面的一些计算的一些引擎，那你存储它的用它的组件的目的是什么？Hadoop的集群
小公司不招Java实习从大数据聊到开发
答的不是很好 #Java# 第一个面试官似乎是个领导跟之前大二面的ruoyi二开那个人脸熟，纯难崩。自我介绍：自学Spring，微服务等等……，拿省赛奖等等，成绩前3%。 pua我学历大专大数据提问：谈了下hadoop生态的hdfs，hbase，hive，kafka，MySQL，pg基本原理以及使用，etl概念（加班潜规则）然后我说想干Java，但是公司不招Java实习，现阶段项目很复杂，
理想汽车 | 实习一面面经 | 大数据开发 |5.18
#在牛客分享我的求职旅程##理想汽车信息集散地##理想汽车##实习##面经#
面经|网易数智-数据开发实习
面试官设备有问题临时改为电话面 1.项目拷打 2.指标下沉怎么做的 3.数据从业务数据库到数仓，怎么估算数仓需要的存储资源 4.了解哪些窗口函数就记得这些了，其他的一会想不起来
字节数据开发实习三面挂
10.23 非科班，只学了离线的技术栈，没项目，投了一个月全被拒了。（百度美团得物滴滴蔚来）一面二面八股问的简单也都答出来了，但是算法题都是暴力求解，竟然过了，三面感觉八股有点冷门，算法题做出来了结果挂了，究极折磨，有点难受！数仓分层，什么是主题 Kafka怎么保证数据一致性 Hdfs有哪些数据存储类型，有什么区别 Spark和MapReduce的比较为什么转行做过的数据分析案例
网易云音乐数据开发实习
一面实习介绍 mr过程 mr和spark的区别 spark shuffle 举例说明事实表和维度表的设计拉链表设计 3道sql题 row_number rank dense_rank区别二面实习介绍怎么设计数据指标集群故障怎么排查解决的自动化运维脚本怎么写的实习的收获项目介绍讲一张你最熟悉的维度表，怎么设计的，说说都有哪些字段拉链表优缺点你觉得实际拉链表用的多吗用的不多为
美团数据开发暑期实习Timeline
岗位：软件开发工程师-数据开发方向部门：核心本地商业-基础研发平台技术岗位处女面，运气挺好，没有被问到完全不会的题，感谢团子缓解我的焦虑 4.30 一面（60min） 1.自我介绍 2.介绍项目架构，数据源等 3.项目中遇到的难点 4.数仓为什么要分层，各层的职能 5.讲一下项目中提到的零点漂移问题 6.hive结构， 7.hive优化 8.数据倾斜 9.tcp三次握手 10.进程和线程的区别
唯品会-数据开发实习-一面
如何将数据导入数仓 ods层数据量有多大 flume如何保证数据的一致性和完整性数仓分了哪几层维度建模的模型，为什么使用这个模型表的数据变化如何进行分区 dws层如何设计，举项目中例子用到了哪些开窗函数 row number遇到数据一样如何排序 left semi join 和？？？的区别 orderby和sortby的区别 sparksql和hivesql的区别 arraylist和li
面经|某小厂-数据开发实习
一面（4.24）：总体30 min 1.为什么在上一家公司离职 2.对公司有什么诉求 3.理解到你的诉求是想提升技术了，那假如在公司干活不能提升你的技术那你会怎么办（跑路） 4.你希望自己以后成为什么样的人 5.AB test 6.标准明细表（没太听懂） 7.数仓的分层 8.spark为什么比MR快 9.项目中具体干了什么活 10.你觉得沟通很重要吗 11.如果你有简单的方案可以完成业务方的需求
好未来数据仓库开发实习
一面项目深挖数仓分几层，每一层的作用事实表如何设计维度表如何设计数据域如何划分业务总线矩阵的概念如何设计完整的指标开发中和上线后数据质量如何保证如何设计调度，依据是什么 hive数据倾斜解决办法 hivesql常见优化手段什么是spark宽窄依赖，起到什么作用 sql题：用户连续登录游戏的最大天数，允许间隔一天反问做什么业务教培业务中的线下面授分析网络问题迟到了一会，面

首页

1

2

3

4

5

6

7

8

尾页

最新发布

西门子AIGC应用开发京东，面试聊天北京四达时代校招运维滴滴-产品与用户运营顾问-春招上岸科大讯飞-产品运营实习面经+实习体验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

有没有开源的仓库管理系统，支持小程序或公众号的？go - Go 怎么基于 chan 实现低延迟队列？vue.js - KeepAlive和携带key属性的RouteView同时使用，routerView初始没有匹配路由，手动跳转页面为什么渲染失败？javascript - Vue3 中使用 import() 和模板字符串时为何找不到模块？前端 - uniapp 本地创建数据库并存储?

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

nativescript-pdfbox Dexie.js isort JeeSite4 Mobile Uni-App CWPopup jwwui Firetable RBDirView

文档资料

百度 Web Uploader 中文文档 LeetBook LeetCode 题解开源书 CTF 竞赛权威指南 Pwn 篇 LocaSpace Viewer 帮助文档百度统计分析云使用手册