无手撕纯八股
--------
描述一下transformer的结构,解释单头注意力机制
为什么要使用多头注意力机制?
在encoder/decoder部分是否都要做masking?
map和优先队列是如何实现元素有序的?简单解释下红黑树/最大堆
C++单例模式一般是怎么实现的?用static的形式是否是线程安全的?
shared_ptr线程安全吗?不安全的话如何解决?
nn.Module需要实现哪些方法?
CMake编译时会发生什么?有哪些常用的CMake指令?
Pytorch和Numpy的标准差是一样的吗?
哪个linux指令是查目前的GPU占用的?
.......
其实还有很多,但是有点汗流浃背一部分想不起来了只能说是八股大轰炸攒攒人品先
#科大讯飞##科大讯飞求职进展汇总##科大讯飞飞星计划##科大讯飞校园招聘##科大讯飞信息集散地#