1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
26届Java选手,面了很多大厂后端实习基本都挂了,稀里糊涂接了大数据的实习,总体比较顺利,先去沉淀了 9.27 美团数开一面 30min 介绍一个项目 项目中的难点 sql 求每月最大和最少的订单数量 二分查找 面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引 介绍一下Hadoop HDFS有几个个副本,为什么 深挖Shuffle原理 sql 面试官自
写这篇帖子就是为了回馈广大牛友。 美团一志愿投的后端开发,没人捞流程自动结束,二志愿开启后迅速约面。 Timeline 3.29一面 4.3二面 4.8 offer 因为人在海外,hr打不通电话,因此直接就发offer到邮箱了。 面经 这里就写几个在众多面试中比较让我印象深刻的问题吧。 1. 对于一个电影,怎么设计数据库中的表,怎么加索引?如果用户搜索很复杂,比如可能任何字段都想搜到电影相关信息,
一面: 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的,应该是偏向平台开发那边,所以没问八股 二面(5.13) 已OC
6.27一面 20min 问简历,介绍项目提到的各种模型,做了什么优化 有没有spark实践的经历 介绍一下hadoop 了解哪些机器学习算法 xgboost和随机森林的区别 有用Java做过项目吗(无...) 反问 6.28二面 35min 简历项目一个一个详细讲 transformer编码器解码器区别 transformer位置编码的情况 spark实践经历 反问
#23届找工作求助阵地# #实习# #网易智企# 一轮面试: 1.比赛相关(自动化敏感信息提取项目中:数据提取、清洗和转换是怎么做的?数据量大概有多少?最终的训练模型的数据结构是怎么样?有没有涉及到分布式集群来训练模型?) 2.课题相关(刚才说这个项目不是用到多卡多去存储,应该是相当于HDFS文件上面对吧?有没有用到它里面的一些计算的一些引擎,那你存储它的用它的组件的目的是什么?Hadoop的集群
答的不是很好 #Java# 第一个面试官似乎是个领导跟之前大二面的ruoyi二开那个人脸熟,纯难崩。 自我介绍:自学Spring,微服务等等……,拿省赛奖等等,成绩前3%。 pua我学历大专 大数据提问:谈了下hadoop生态的hdfs,hbase,hive,kafka,MySQL,pg基本原理以及使用,etl概念 (加班潜规则) 然后我说想干Java,但是公司不招Java实习,现阶段项目很复杂,
#在牛客分享我的求职旅程##理想汽车信息集散地##理想汽车##实习##面经#
面试官设备有问题临时改为电话面 1.项目拷打 2.指标下沉怎么做的 3.数据从业务数据库到数仓,怎么估算数仓需要的存储资源 4.了解哪些窗口函数 就记得这些了,其他的一会想不起来
10.23 非科班,只学了离线的技术栈,没项目,投了一个月全被拒了。(百度 美团 得物 滴滴 蔚来) 一面二面八股问的简单也都答出来了,但是算法题都是暴力求解,竟然过了,三面感觉八股有点冷门,算法题做出来了结果挂了,究极折磨,有点难受! 数仓分层,什么是主题 Kafka怎么保证数据一致性 Hdfs有哪些数据存储类型,有什么区别 Spark和MapReduce的比较 为什么转行 做过的数据分析案例
一面 实习介绍 mr过程 mr和spark的区别 spark shuffle 举例说明事实表和维度表的设计 拉链表设计 3道sql题 row_number rank dense_rank区别 二面 实习介绍 怎么设计数据指标 集群故障怎么排查解决的 自动化运维脚本怎么写的 实习的收获 项目介绍 讲一张你最熟悉的维度表,怎么设计的,说说都有哪些字段 拉链表优缺点 你觉得实际拉链表用的多吗 用的不多为
岗位:软件开发工程师-数据开发方向 部门:核心本地商业-基础研发平台 技术岗位处女面,运气挺好,没有被问到完全不会的题,感谢团子缓解我的焦虑 4.30 一面(60min) 1.自我介绍 2.介绍项目架构,数据源等 3.项目中遇到的难点 4.数仓为什么要分层,各层的职能 5.讲一下项目中提到的零点漂移问题 6.hive结构, 7.hive优化 8.数据倾斜 9.tcp三次握手 10.进程和线程的区别
如何将数据导入数仓 ods层数据量有多大 flume如何保证数据的一致性和完整性 数仓分了哪几层 维度建模的模型,为什么使用这个模型 表的数据变化如何进行分区 dws层如何设计,举项目中例子 用到了哪些开窗函数 row number遇到数据一样如何排序 left semi join 和???的区别 orderby和sortby的区别 sparksql和hivesql的区别 arraylist和li
一面(4.24): 总体30 min 1.为什么在上一家公司离职 2.对公司有什么诉求 3.理解到你的诉求是想提升技术了,那假如在公司干活不能提升你的技术那你会怎么办(跑路) 4.你希望自己以后成为什么样的人 5.AB test 6.标准明细表(没太听懂) 7.数仓的分层 8.spark为什么比MR快 9.项目中具体干了什么活 10.你觉得沟通很重要吗 11.如果你有简单的方案可以完成业务方的需求
一面 项目深挖 数仓分几层,每一层的作用 事实表如何设计 维度表如何设计 数据域如何划分 业务总线矩阵的概念 如何设计完整的指标 开发中和上线后数据质量如何保证 如何设计调度,依据是什么 hive数据倾斜解决办法 hivesql常见优化手段 什么是spark宽窄依赖,起到什么作用 sql题:用户连续登录游戏的最大天数,允许间隔一天 反问 做什么业务 教培业务中的线下面授分析 网络问题迟到了一会,面