Pytorch是一个深度学习框架,提供了高性能的环境以及容易使用的自动微分模块,并能在不同设备上运行
Variable flags
为不需要计算梯度的变量做标记,节约计算和存储资源,需要梯度的变量会被标记为require_grad=True
,对于任意输入变量若被标记为require_grad=True
,则输出变量也会自动标记为require_grad=True
Hooks
通过x.register_hook(lambda grad: print(grad))
来随时检查x的梯度
扩展
可以自定义微分操作
变量和它的转置等会共享内存