当前位置: 首页 > 面试经验 >

北京智源研究院-AI编译器工具链-二面

优质
小牛编辑
51浏览
2024-09-13

北京智源研究院-AI编译器工具链-二面

二面
1. 自我介绍
2. 推理框架的设计,计算图,运行图,内存管理
3. 动态图,静态图,动态shape
4. 图优化
5. warp之间通信
6. cuda reduce
7. cuda softmax,warp处理与block处理的区别
8. block,grid的设置,调度,为什么会影响算子速度
9. CUDA的计算模型
10.flash attention v1 v2
面试时间:45分钟
#面经#
#高性能计算#
#高性能计算面经#
#模型部署#
 类似资料: