#软件开发2024笔面经# 2024字节跳动面试 数据岗位
1.模型开发的流程,需求调研过程中有哪些人员参加,调研过程,你会输出什么文档?
2.如何保障数据质量(准确性)?
3.spark有什么优缺点?在使用过程如何规避缺点?
4.spark内存模型?
5.spark和MR为什么会进行shuffle,如何减少shuffle?
6.小文件治理的方式?
7.主题域建设的流程?
8.大表join大表的优化(10亿与1千万数据关联)?
9.为什么存在ods穿透?
10.你希望公司工作强度如何?
#数据人的面试交流地# #第一次面试# #如何确定求职岗位#
#大数据#