当前位置: 首页 > 工具软件 > seq2seq > 使用案例 >

seq2seq模型简介

暨曾笑
2023-12-01
  1. 它是一个n对m的结构,包括编码器和解码器结构,从一个句子生成另外一个句子。
  2. 提出了注意力机制,这个注意力机制通过上下文向量来体现。
  3. 后续的transformer 和 bert 结构都继承了seq2seq。

结构说明:

编码器是一个RNN,读取输入句子,可以是双向
解码器: 使用另外一个RNN来输出

运行机制:
编码器的最后一层输出,作为解码器的输入。

训练
用的是真实的label值。

评价翻译结果:
BLEU:考察这个子序列是否出现在标签序列中。

参考链接:https://blog.csdn.net/angus_huang_xu/article/details/115873866

 类似资料: