1、自我介绍 2、MR的执行过程,用了几次排序,Reduce怎么知道拉取哪些数据 3、RDD的底层实现(Spark用的不多就没问了) 4、项目介绍(没有针对项目进行提问) 5、SQL优化思路,具体讲了关于数据倾斜这块 6、SQL题:包含班级、学生、课程、分数的表,查询每个班每门课前三的学生 7、SQL题:包含user_id和target_id的表,找到互相关注的用户,优化不用join实现 8、SQ
1、自我介绍 2、为什么要去北京 3、MR的原理 4、为什么环形缓冲区到80%之后才反向溢写 5、SQL中哪些函数走MR,max走不走 6、select a,count(distinct b) from table group by a,MR的流程 7、SQL优化,如果给你两张表,用户视频表和用户粉丝表,怎么处理数据倾斜 8、SQL题:每个用户都有5门成绩,总计6列。请生成两列,其中1列是用户ID
字节数据分析实习面试(抖音电商) 一面: 表user_log,有user_id, time,求每天用户新增数,次日留存率、30日留存率 ABTest的流程,P值,做留存率的ABTest,选择什么检验,卡方检验的应用场景 逻辑回归的损失函数 出现过拟合的原因 三天后给了感谢信 快手数据分析师(短视频用户增长部门) 一面: 两个SQL题目,都还比较简单,主要涉及到group by和日期函数的处理,还有
1、自我介绍 2、看我用Java,问我Java程序的执行过程,然后Java怎么跨平台 3、基本数据类型,是否可以相互转换 4、自动装箱自动拆箱,Integer i = 100 是什么过程 5、深拷贝浅拷贝 6、Java是值传递还是引用传递 7、JVM的理解 8、堆是怎么划分的,实际有没有用到有关JVM的地方 9、垃圾清除算法说一下,什么时候FullGC 10、多线程,线程安全,线程通信之类的 11
bg:一段数分实习+中台运营 一面(25min): 1.自我介绍 2.简历中提到用过XGB模型,介绍一下:特征选了什么,最后的重要因素是什么(结合落地性),准确率多少 复盘:下次介绍的时候可以先明确自变量和因变量分别是什么,当时以为自己star法则说的还挺清楚的,结果输出一通之后,面试官的第一个问题就是x和y是什么...... 3.case题:目前滴滴在上线阶段,如何做好用户回流,有什么分析思路
2023.2.3 一面 一面面试官小姐姐很友善 问简历,数分和数开实习具体工作,数分实习中的核心指标,敏感指标是否给了权限。 两道sql,一道groupby后再加窗口,有点麻烦;另一道简单,无窗口,分组+sum(case when)行转列 问能实习多久,反问该岗位对统计学和机器学习是否有要求 2023.2.6 二面 面试官气场比较强,比较严肃。 为什么有数开和数分的实习还想做数分 怎么理解数分这个
TimeLine:一面20211109 当时的BG:北邮本硕,管理类专业,一段实习经历:美团商业分析师 写在前面的话:该文档记录日常实习面试的相关问题,面试时间为2021年。以下问题的答案可能存在错误,敬请读者批评指正 一面 1. 数据库种类有哪些?分别举例说明一下? 1)关系型数据库:Oracle,Microsoft SQL Server,MySQL 2)非关系型数据库:HBase 2. 简要介
自我介绍 项目深挖 用到哪些测试 项目两个推荐模块怎么实现的 协同过滤算法的理解 有什么优缺点 实时模块的具体实现流程 对冷启动 系统可解释性的理解 怎么解决(个人的研究方向是推荐,面试官说和岗位比较匹配 所以问了些推荐) JAVA的数据结构 数据库事务的特点 join区别比较 事务隔离的级别 默认级别是哪一个 表 字段是 商家 商品 销售额 查询销售额大于10万的商家 设计测试用例 针对自己的项
#滴!实习打卡##数据分析##数据分析实习##快手##面经快手#
项目中表是如何设计的? 项目中使用Redis缓存了什么数据? Redis的缓存更新策略有哪些? 双写一致策略能保证缓存和数据库中数据永远是一致的吗? 项目中数据库有遇到慢查询语句吗?如何排查慢查询 有建立联合索引吗?建立联合索引时要遵循哪些原则? MySQL中索引的数据结构是什么样的? b+树索引中叶子节点构成的双向链表有什么优点? 项目中什么场景用到了数据库的事务? 事务隔离级别有哪些? 项目中
面试官是个小姐姐,面试体验非常好! 自我介绍 实习经历都做了什么 我看你用了docker,讲一下docker流程 你的项目里有登录的功能,那你怎么区分是哪一个用户传的东西呢(session) 你的项目里有webbench讲一下原理 讲一下聚簇索引和非聚簇索引 讲一下测试流程 讲一下页面置换算法 url输入浏览器的请求过程 写一个sql吧,单表查询,但是需要查出分数排名第21的学生id,我不会 场景
终于轮到哥们给各位牛油们发面经贴了,回馈大家,么么哒。 流程: 11.20 投递 11.24 一面(过了) 11.25 二面 先说流程方面吧,感觉小米速度还是很迅速的,会有hr打电话联系你约时间、发短信、然后发邮件,流程很快、也很清晰,这个我先点个赞吧。看到各位说小米校招开的价很少,实习的话我不知道待遇好不好,如果过了有可能我就去了。 小米一面(11.24)(30~40min) 1.自我介绍 2.
1、java 里有哪些数据类型,他们的包装类是什么 2、java 里有哪些锁 3、static 关键字 4、锁升级机制 5、volatile 关键字作用? 6、String、Stringbuilder、Stringbuffer 的区别?底层原理,String 为什么不可变? 7、双亲委派模型 8、Springboot 有哪些注解? 9、什么是 AOP?怎么实现的 AOP? 10、mysql 的事物
一面: 1. 对推荐算法大概有多少了解 2. kaggle比赛用了什么模型,做了什么优化 3. 你是如何把几个模型的分数做融合的 4. 如果这个权重也作为一个变量参与到训练,这种方式和你手动调参相比会有什么样的差异呢 这题我回答的是串行训练会更多耗时,但是参数精度会提高效果会更好,但是总觉得还是没答到点子上 5. 随机森林的具体运行过程 6. 如何判断过拟合和欠拟合,怎么解决 7. 如何解决梯度消
本人211本,985硕,目前研二,预计25年6月毕业。医学图像处理方向,导师放养,9月份投了一篇很水的小论文,无项目无实习。10月开始找日常实习,预计实习三个月,找的主要是深度学习和图像算法方面的,在这里总结一下面试经历和遇到的问题。 1、科大讯飞RDG-AI研究院-算法测试(AIGC方向):①自我介绍;②简历上科研经历;③是否了解大模型,diffusion;④有什么了解前沿技术的渠道,平时会关注