面试
自我介绍
项目介绍
1. img2col 的原理
2. RMSnorm的计算过程
3. reduce的计算流程
4. SIMD 是只能对fp32的算子使用吗(因为我没讲清楚)
5. effective transformer的好处,怎么加速的(没答太对)
6. embedding 和 building casual mask 怎么加速的
7. casual mask 有什么作用
8. 大模型推理的过程, 输出是什么, 下一次是怎么输出的。(没答的很满意)
9. 对移动端推理加速的理解
10. 一道力扣mid 里的简单题 搜索二维矩阵
11. 说出几种思路,这么做的理由。
面试官人特别好,特别耐心,希望有二面。