我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊!
直接拿走去复习!!!
Hive 知识点(上)- HSQL 语法
- 什么是窗口函数?
- ROW_NUMBER() / RANK() / LAG() / LEAD() 的含义?
- RANK() 和 DENSE_RANK() 的区别?
- 上述窗口函数的使用场景?
- PARTITION / CLUSTER BY / DISTRIBUTE BY 的含义和区别?
- 使用 STACK 进行列转行?
- 使用 EXPLODE 进行行转列?
Hive 性能优化
- 数据倾斜的场景有哪些?
- 如何在 Hive 中判断数据发生了倾斜?
- 数据倾斜一般如何处理?
- Shuffle 的类型和性能优化手段?
- Hive 的存储格式有哪些?有什么优劣势?
#牛客在线求职答疑中心##机械人晒出你的简历##机械人的春招flag#
#牛客解忧铺##大数据#