当前位置: 首页 > 面试经验 >

明源云数据开发实习

优质
小牛编辑
52浏览
2024-08-19

明源云数据开发实习

拷打实时数仓(建模,为什么要分层,为什么选择HBase作为数据库,所有数据都要旁路缓存吗,旁路缓存HBase数据经常变更,Flink工作流程)
怎么处理数据倾斜
数仓常用的维度建模方案有哪些
建模模型有哪几个,分别适用于什么场景
Hadoop生态圈、MapReduce工作流程、
为什么大数据用Kafka多、Kafka工作流程、Kafka怎么保证数据有序、Kafka同一个主题下分区之间是否有序
SQL题:
用户电话联系表(id,uid,电话号码,创建时间),粒度为电话号码,一个用户可以有多个号码,每一个占一行。
对数据聚合,将粒度变为用户,将电话号码结合用逗号隔开,并根据创建时间顺序排序
 类似资料: