1. seq2seq中使用teacher forcing
在前面的seq2seq的案例中,我们介绍了teacher frocing
是什么,当时我们的输入和输出很相似,所以当时我们的teacher forcing
是在每个time step中实现的,那么现在我们的输入和输出不同的情况下,该如何使用呢?
我们可以在每个batch遍历time step的外层使用teacher forcing
代码如下:
use_teacher_forcing = random.random() > 0.5
if use_teacher_forcing: