当前位置: 首页 > 面试经验 >

京东暑期 大数据开发 二面

优质
小牛编辑
136浏览
2023-04-19

京东暑期   大数据开发 二面

一、spark如何划分job,stage,task
遇到一个action算子开启一个job
stage是遇到一个action开始,从后往前以shuffle为边界划分
stage划分成多个task,一个分区对应一个task
二、sql题:一个用户点击记录表t,有三个字段user_id,item_id,category_id
统计每个用户的每个商品类别的点击总量排名中,top3的商品 类别
select user_id, row number() over(partition by user_id order by click_cnt) as rk
from
(
select user_id,category_id, count(item_id) as click_cnt from t
group by user_id, category_id
) tmp
where rk <= 3
三、算法:最长不重复字串的长度
滑动窗口
 类似资料: