美团 2022暑期实习 面经
数据开发工程师
2022.03.18 笔试 2h 5题 300多分
2022.03.28 一面 50min左右
自我介绍
数据开发:
- 了解计算机的混沌理论/空值/还是什么?, 没听清,不了解
- hive和sql的区别?了解spark?hive中如何自定义函数?hive中的UDF?
- Hive只有有限的索引功能,没有普通关系型数据库中键的概念,但是可以对一些字段来建立索引,加速某些操作,一张表的索引数据存储在另外一张表中。维护索引需要额外的存储空间,同时创建索引也需要消耗计算量。
- 数据仓库,在你用sql提取数据的时候,影响其他进程吗?具体怎么样?
想问我计算机网络,我说我不会,不是计算机系的。
机器学习:
为什么会overfitting,如何解决?了解朴素贝叶斯吗?
深度学习:
做过NLP吗?pre-train是什么?(没有深问,我就回答了个概念)
和他们在做的项目相关的问题:(难)
时间序列如何检测出异常值?传感器问题,如何判断当前传感器是不是异常值?
#实习##暑期实习##美团##美团面试#