MegEngine 框架设计

李建中
2023-12-01

MegEngine 框架设计
MegEngine 技术负责人许欣然将带了解一个深度学习框架是如何把网络的定义逐步优化并最终执行的,从框架开发者的视角来看待深度学习。
背景
AI 浪潮一波又一波,仿佛不会算法就落后于时代。
深度学习框架处理了各种设备的计算细节、求导、计算优化序列的工作,而在动态、静态两套截然不同的世界中,这些步骤又各自有他们不同的优化点和瓶颈。
如何在中间获取一个高效的平衡呢?以及如何克服训练完的模型在推理部署中无数的坑(闻者落泪),那个堪称对此进行降维打击的“训练推理一体化”到为何物?
分享内容
MegEngine 天元作为旷视全员自用6年的自研深度学习框架,是一个在淘金热时,坚持选择卖铲子的团队。了解一个深度学习框架是如何把网络的定义逐步优化并最终执行的,从框架开发者的视角来看待深度学习。
视频地址: https://www.bilibili.com/video/BV11C4y1t7xH
课件地址:金枪鱼之夜:MegEngine 框架设计.pdf
分享大纲
• 背景介绍
o 深度学习框架是干啥的?
o 道理我都懂,为什么又搞一个深度学习框架?
o 你们为啥不用 PyTorch / TensorFlow?
o 训推一体是个啥玩意?
• 如何写出一个深度学习框架?(超简化版)
o 动态图训练
o 调用 = 执行
o 依赖关系图 forward & backward
o megdnn kernel
o exec
o Shape Deduce
o 静态图训练 + 推理(粗糙版)
 Tensor
 Graph、SymborVar
 CompNode
 Shape Inference
 Graph Optimization
 拓扑排序
 内存优化
 Computing Sequence
• 一个陈年静态图框架是怎么变成动态图框架的?
o Dynamic Region
o Eager Graph
o Eager Runtime + Proxy Graph
• 对未来的展望
o 各种芯片模组的对接,挑战训推一体的理念
o MLIR 等技术的兴起
o 如何做到真 JIT

 类似资料: