项目问题:
1、常用目标检测算法?区别?
2、基于人脸识别的目标检测有无研究?
3、yolo最初是谁提出的?
4、bert、trasformer的每一层具体结构?
5、transformer的输入输出?
6、如果用bert来做中译英任务,输入输出会是什么?QKV会是什么?
7、gpt的结构?gpt相当于transformer的哪一部分?
8、编码器、解码器的作用?
八股问题:
1、常用激活函数?
2、梯度消失、梯度爆炸的解决方案?
3、attention机制的数学公式?除以根号dk的目的?(正则化,以防梯度消失)
4、一阶梯度、二阶梯度对应的优化器?
5、梯度的定义?
代码问题:
假设输入是x(n, k),n为samples数量,k为特征数量,输出y(n, 1),请实现一个线性回归模型:y=w*x+b。
要求:
1、只能使用标准库
2、使用SGD实现
3、batch_size > 1
面了一个小时...
#淘天##淘天实习#
#面经#