1、介绍项目
这里都根据个人项目去聊的,问了很久
2.数据怎么来的(ods层数据同步问题)ads层下游怎么做,数据怎么来的报表直接查的ads层吗 数据抓过来存在哪
3.hadoop了解吗hdfs有那些组件,
4.聊聊mapreduce进行几次排序
一个sql题,按分数进行排序
count(*) count(1) count(col)三者有什么区别
数据倾斜 pv值
1、面向业务的数据库设计
面向业务的数据库设计流程通常分为以下6个阶段1:
2、为什么要有三范式,三范式的意义是什么
3、mysql建索引需要注意那些事项,常见的索引有哪些
4、数据结构有哪几种类型 找两个介绍
5、实习中做了什么东西
6、dataworks 维度建模有哪些,你们用了星型模型还是雪花模型,雪花模型相对星型模型有哪些不同点,阿里用的哪种,为什么用这种(之前在阿里系实习)
7、数仓分层,为什么要放在s层,明细层是什么,汇总层是什么,我为什么不可以把明细层的东西放在s层里呢,汇总层的作用又是什么呢,要细致的了解
8、业务数据存到mysql、hive这些地方,谈谈有关hive优化会用到哪些方法
9、数据研发的了解 ,除了大数据组件以外你觉得还需要掌握哪些内容
10、实时flink ,实时数仓你是否有了解,会不会
二面挂
#数据开发工程师面经#