1)10道不定向选择题,共40分,包括知识点:
关系型数据库
有限自动机
进制转化
HIVE特点、复杂数据类型
Flink窗口分类、通过什么方式处理数据迟到、时间语义
SPARK RDD特性
LSM
2)1道数据库,给出一个表,包括三个小题:
1. 玩家在线时间排名
2. 计算 pv, uv
3. 计算第一天留存率
3)2道编程题,题目描述中有说 若写不出来 也可以在注释中写思路或伪代码
1. Java编写一个多线程,实现生产者消费者模式(可选语言 java, python)
2. 2.5亿个整数中找出不重复的整数(编程语言随意)
#恒生##大数据开发#