一面: 自我介绍 手撕: 力扣54 + 692 (30min) 八股(15min): 你对装箱和拆箱的理解? Object类方法有哪些? final关键字可以作用在哪里? 集合总体分类? 线程安全的集合? HashMap和hashtable区别? B+树 (八股可能忘记了一些...但都是常规八股) 项目(10min) 简历上两个项目各问了一点 反问(5min) 面试表现 具体业务 多长时间有结果
🕒 岗位/笔试时间 岗位:软件服务工程师(数据开发方向) 6月12日 19:00-20:00 📝 笔试题目 选择题:包括数据库,sql的一些相关知识 还有一道代码题,记不太清了 🤔 笔试感受 当时代码题写了一半,没完成,以为凉了,但是后续通知了一面 🕒 岗位/面试时间 6月18日 11:00(大概四十分钟) 👥 面试题目 自我介绍 介绍项目 大数据开发工具有哪些(详细介绍) 数据倾斜解决
1.自我介绍 2.布隆过滤器如何减少误判? 3.介绍一下点赞系统是怎么做的? 4.点赞系统中的缓存和数据库一致性怎么做的? 5.学习进度记录是如何减少与数据库的写操作的? 6.Java重写和重载的区别? 7.JVM垃圾回收算法介绍一下? 8.ArrayList和LinkedList之间的区别? 9.乐观锁和悲观锁的区别? 10.MySQL中的索引是如何实现的? 11.手撕二叉树中序遍历,非递归 1
系统组 1.自我介绍 2.实习拷打 3.项目拷打 4.spark任务提交过程 5.sparkrdd运行过程shuffle阶段拆分 6.hdfs上文件存储方式 7.hdfs写数据流程 8.算法:判断链表是否有环 9.反问 23大概40min 4567 10min 8 5min
1. 使用过python的哪些库,分别介绍一下。 2. 介绍一下项目。 3. 讲一下项目中你的数据采集链路。 4. 项目中为什么要这样分层。 5. 分层使用的什么建模?讲解一下维度建模。 6. 项目中维度建模使用的什么模型?星型模型和雪花模型的区别? 7. mapreduce过程、调优。 8. combine了解吗?使用条件是什么。 9. hive是什么,了解过hql语句调优吗,选几点讲解一下。
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --
1.自我介绍 2.两道SQL 3.mapreduce中map阶段和reduce阶段的task的数量怎么确定 4.了解哪些建模方式,了解维度建模吗,说说他们的区别 5.rdd有哪些shuffle类算子 6.shuffle的本质是什么 7.为什么数仓要分层,分层的意义在哪 8.四个排序的区别 9.spark的提交流程 10.hive中的元数据存储了哪些内容 已过
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
一面 实习深挖 实习中遇到什么难点 数仓如何分层,每层如何设计模型 发现凌晨任务挂了,讲快速排查思路 几种join方式的区别 如何优化使用row_number的效率 拉链表原理和作用 对etl的理解 cte的特点 sql每个部门薪资最高的员工,要求两种方法 算法构造二叉树 二叉树几种遍历方式实现 介绍栈和队列,以及各自的应用场景 还有些忘记了,都怪库克没做录音功能 二面 实习深挖 有过什么任务优化
写在前面 bg:9本+水硕,投递时实习经历:中厂数分+大厂数据产品+大厂数分本身数学统计基础很差,ml相关基础也差,求职意向主要为业务向数分手动加粗:希望认出的大佬手下留情,私聊就好,社恐害怕评论区掉马甲。也欢迎各位牛友交流哇!打破信息差~ ---分割线--- 岗位:淘天-天猫事业部-数据分析 tl:3.19投递-4.6一面-4.7二面-4.12oc-5.17再次oc。。 ---分割线--- 一面
处女面,很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等(项目上写的组件
1、自我介绍 2、未来职业规划 3、深挖实习 4、因果推断有研究吗?比如作者的勤奋度(供稿量)和收入有没有关系,不能简单做相关性分析,我们要做因果推断,怎么做呢?有没有学过什么算法? 5、手撕SQL(窗口函数,4月份每个用户观看时长排名前五的视频类型) 6、业务问题发现4月份环比3月份供稿量下降了,异动归因,怎么拆指标? 7、反问
一面: 1.自我介绍 2.数仓分层 3.来了新的业务怎么建模 4.选用的什么模型,有什么考量 5.如果现在一张事实表一对多一个维度表,此维度表又一对多一个维度表,怎么设计模型 6.实习过程中用的什么计算引擎 7.spark UI会看哪些内容 8.数据倾斜问题怎么解决 9.介绍一下项目 10.为什么有的指标在下沉的时候要拆开来 11.SQL调优,讲一个具体的例子 12.SQL题:求中位数 二面: 1
#数据分析#6.3号之后面了四家,分别是哈啰、滴滴、菜鸟、蔚来,很多常规的问题都忘了,放一些还记得的 1、哈啰 6.4号一面:两道SQL:每个班级均分最高的学科、次日留存率 6.5号二面: 项目细节(项目难点、强调独立负责的部分、有没有独立完成的项目) 为什么不做程序员 职业规划、实习规划 6.11oc 2、滴滴 6.5一面: 项目(介绍并深挖、异动分析、项目成果、个人贡献、提出了什么建议、如何落
一共三轮,hrbp面完排序挂了,贡献一下面经。 一面+二面: 1.常规自我介绍,讲了学校专业还有几段实习的大概内容和产出。 2.简历和项目深挖,一面面试官让我介绍一个滴滴做的项目,二面面试官让我讲了两个项目一个是滴滴的一个是一家电商公司的,项目背景和我最后的产出以及后面有没有想过之前做的时候没有考虑到的内容,这块问得非常久… 3. 代码考核,这块其实没怎么问我..可能看我实习时间比较长,具体问了j