求梯度实例
from mxnet import autograd, nd
# 对函数y=2x(转置)x 求列向量x的梯度
x = nd.arange(4).reshape(4,1)
print(x)
# 调取attach_grad函数申请计算存储梯度所需的内存
x.attach_grad()
# record 函数要求mxnet记录求梯度相关的计算
with autograd.record():
y = 2 * nd.dot(x.T, x)
# 调用backward自动求梯度
y.backward()
# 梯度应该为4x 验证梯度是否正确
assert (x.grad - 4 * x).norm().asscalar() == 0
print(x.grad)
训练模式和预测模式
调用record函数后,mxnet会记录并计算梯度。此外还将运行模式从预测模式转为训练模式。
from mxnet import autograd
print(autograd.is_training())
with autograd.record():
print(autograd.is_training())
对python控制流求梯度
from mxnet import autograd, nd
def f(a):
b = a * 2
while b.norm().asscalar() < 1000:
b = b * 2
if b.sum().asscalar() > 0:
c = b
else:
c = 100 * b
return c
a = nd.random.normal(shape=1)
a.attach_grad()
with autograd.record():
c = f(a)
c.backward()
print(a.grad == c / a)
上面定义的函数。给定任意的a,其输出必然是的形式,其中标量西施x的值取决于输入a,由于有段a的梯度为x,且值为c/a。
网友评论