1.自我介绍 2.项目介绍 3.MapReduce揪着排序问 Spark揪着OOM问题问 hr和技术一起面,总共20min
1.自我介绍 2.项目 3.问项目有没有遇到数据倾斜怎么处理 项目有没有OOM怎么处理 项目有没有遇到数据丢失怎么处理 4.lc全排列
面试官设备有问题临时改为电话面 1.项目拷打 2.指标下沉怎么做的 3.数据从业务数据库到数仓,怎么估算数仓需要的存储资源 4.了解哪些窗口函数 就记得这些了,其他的一会想不起来
自我介绍 讲项目(but项目经历貌似不匹配)全程都是我在输出 然后问了一下java new一个对象还有其他方式吗?克隆?? 操作系统进程和线程的区别 讲一些数据科学和数据开发的区别(他说我更适合数据科学qwq) 后面反问:你们是做什么的 好像是爬取数据建数仓emmmmm Over 他让我去做一下笔试题我也不知道这是什么意思emmmmm (可能是看我笔试成绩再决定挂不挂我???)
人生处女面献给了腾讯, 惨败...... 把人家面试官都搞无语了....就很离谱 流程大概就是 1.自我介绍 2.项目 3.PCA 4.数据库事务特性 5.大数据平台hadoop,hive 6.操作系统线程进程区别 7.手撕两个栈实现队列 ....... 啥也不是,还差好远好远 开始怀疑是不是要走技术这条路了 差点泪洒当场 吓得我赶紧说再见
面了快二十次了,从没有见过压迫力这么强的面试官,压力爆大,寄。 面试一共30多分钟,无手撕,感觉面试官不是很想面了。 先介绍自己,没让我介绍项目。 1.开篇很美好,问了hive内部表和外部表的区别。 2.问有没有遇见数据倾斜的问题。宽表建设的时候遇见过。 3.怎么解决。使用map join。 4.map join是什么。大表join小表,小表加载内存里面,map端实现join无需reduce。 5
饿了么暑实数据研发工程师-数据科学方向 一面技术面: 1.工作中遇到的难点 2.数仓分层 3.数仓建模 4.对数据科学的理解 5.sql开窗函数 6.链表和数组区别 链表具体应用 7.python用什么库 什么场景用到这些库 散点图用什么函数以及有什么用 二面业务面: 1.拷打项目 2.身边朋友的评价 自己的优劣势 3.业务题。。。面试官说我的业务sense太稚嫩 数科对业务理解要求还是比较高的
来源VIP学员反馈的快手面试题【2024/05/15】 推荐阅读文章列表 我的大数据开发学习之路 2024最新大数据开发面试笔记V6.0 大数据开发面经汇总【持续更新】 SQL题目 有一张用户关注表dwd_online_user_follow_dd, 包含用户id(user_id)和关注者id(follower_id) 求相互关注的用户对 答案解析 模拟数据 insert into dwd_onl
1.简历 2.标准化和归一化 3.ab test 4.如何与非技术人员进行沟通
bg:双非本,c9硕,一段小厂数分,两段大厂数分/商分 一面45min: 1.自我介绍 2.详细介绍一个工作中的项目 3.四道sql口述思路 难度不大,但答得很一般,因为没好好思考,面试官问完我就开始说..... 4.日留存下降,怎么分析 老八股文了 5.平时看b站吗?b站首页的视频推荐,如何选择指标评估其效果 瞎说了一堆指标,被面试官一直追问和补充细节 6.看过b站财报吗,知道b站利润构成吗 答
#我的实习求职记录# #面试# 5-24上午 博西家电数据分析岗(应该是挂了,唉!) 实习经历介绍深挖 SQL drop和delete区别 (我答的一个删除列一个删除行,但面试官说是一个新建表一个没新建) 辛普森悖论(没答上来,提示了之后总结了一下) 还有几个不记得了 最后是思维题:黑盒拿球问题,烧绳子问题(一根30秒,怎么计算15秒) 反问:工作内容,后续面试流程 面试官问我为什么问第二个问题,
目前去团子了。总结一下一个多月以来找实习的历程,也算是非常坎坷了,好在最后结果还行,最后说一句我是团孝子 #暑假实习# #美团# #大数据开发#
就面了十几分钟 面试官说我更适合去做算法 1.实习经历 2.数仓和数仓建模的理论知识(我说了维度建模 范式建模 问知不知道维度退化 不知 3.SQL:怎么找A表有B表没有的数据 数据倾斜怎么处理(不会 #发面经攒人品#
公司:联易融 岗位:数据分析师 工作职责 1、负责研发面向供应链金融场景的核心算法模型,如风险预测,潜客挖掘,关联图谱等; 2、与团队成员一起负责以上能力的产品化工作; 3、参与以上能力的应用落地工作。 工作要求 1、硕士或以上学历,统计学、计算机、数学、经济学、计量心理学、人工智能等相关专业; 2、熟练掌握Hive\SQL\Hadoop,熟练使用JAVA/R/SAS/Python等编程语言,熟悉
1.挖项目 2.jvm垃圾回收 3.找问题,String类型循环内使用+= 4.mysql 聚簇索引和非聚簇索引 5.hashmap原理 6.索引数据结构(b+树),特点 7.hive数据倾斜 8.hive mapjoin ,bucket map join ,SMB join 9.flink watermark 10.flink checkpoint. 三种分布式快照算法 11.flink 状态