当前位置: 首页 > 面试经验 >

茄子快传 大数据 一面 挂

优质
小牛编辑
84浏览
2023-03-28

茄子快传 大数据 一面 挂

1.mapreduce的shuffle过程。
2.海量节点的情况下,NameNode如何扩展用多台NameNode保存元数据。
3.多个NameNode,其中一个NameNode挂了,其它NameNode如何上线。
4.海量的(userid,pageid)二元组数据,内存小的情况,用java或者sql计算每个pageid的userid top10的方法?
Java:数据切块并按pageid分区,每个数据块中的各区求userid的top10。如此,汇总各个数据块的各区userid top10后,再进行各区求top10。



#茄子快传##茄子科技#
 类似资料: