一面40min,base西安
面试官人挺好的,体验也很好,但我太菜了,尤其是数学,凉凉
概率论和代数相关的(最开始忘录了,大概是这类题)
机器学习中做回归和分类能用到哪些损失函数?
最小二乘法MSE能不能用到分类问题上?
(这里我回答是分类问题预测标签是离散的,使用MSE计算梯度回传的函数不可导。面试官说主要是因为通过softmax函数后,使用MSE计算会梯度消失。这两个解释有区别吗?)
计算协方差矩阵时各个值的含义是什么?对角线的值和非对角线的值分别是什么意义?
怎样计算两个向量的相关性?
线性代数中特征值和特征向量的几何意义是什么?一个向量乘以一个矩阵表示什么?
平面上两个向量内积和外积的几何意义分别是什么?
SVD奇异值分解的结果有什么意义?
牛顿法求极值的原理是什么?
优化求极值的方法?
SGD的过程?
接下来介绍自己的项目,并根据项目提问。
在这个项目中你做了哪些工作?
开发平台和开发语言?
有没有使用GPU?
为什么挑选这样的数据集?
模型的选择与搭建,是基于开源项目还是自己从头搭建起来的?
模型和框架是自己选择还是师兄师姐或导师的帮助?
主要用了哪些网络结构?
数据集大小,训练时长,有没有遇到什么问题?
训练步骤,训练过程的设计?
使用什么方式冻结部分模型?
训练过程中有没有遇到梯度消失或者梯度爆炸?遇到的话该怎么处理?
正则有了解吗?一般在什么地方使用正则?
平时的开发环境和编程语言?
其它技术比如docker和网络有没有了解?(不会)
课程不学操作系统和网络吗?
啊,原来现在都不开这些课了吗?(我回答的是操作系统学过,好像没听到,但网络协议真不知道)
#众合科技##AI算法工程师##面试##面经#