seq2seq

通用编码器&解码器框架
授权协议 Apache
开发语言 Python
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 不详
投 递 者 姬捷
操作系统 跨平台
开源组织 Google
适用人群 未知
 软件概览

seq2seq 是 Google 开源的一款用于 TensorFlow 的通用编码器&解码器框架(encoder-decoder framework),可用于机器翻译、文本摘要、会话建模、图像描述等。

设计目标/特性

  • 通用性:Google 最初为机器翻译开发了这个框架,但是后来用于各种其他任务,包括摘要、会话建模和图像描述。只要你的问题可以以一种格式编码输入数据,并解码为另一种格式,你应该能够使用或扩展这个框架。

  • 可用性:你可以使用单行命令训练模型。支持多种类型的输入数据,包括标准的原始文本。

  • 再现性:使用 YAML 文件配置训练流程和模型。这也允许其他人运行和你完全相同的模型配置。

  • 可扩展性:代码以模块化的方式构建,并且易于拓展。例如,添加新类型的注意机制或编码器架构仅需要最少量的代码即可修改。

  • 文档:所有代码都使用标准的 Python docstrings 记录,有书面指南帮助开始执行常见任务。

  • 良好的性能:为了使代码足够简洁,没有试图榨干所有性能,但是实现速度已足以涵盖几乎所有的生产和研究用例。tf-seq2seq 还支持分布式训练,从而折中计算能力和训练时间。

  • 它是一个n对m的结构,包括编码器和解码器结构,从一个句子生成另外一个句子。 提出了注意力机制,这个注意力机制通过上下文向量来体现。 后续的transformer 和 bert 结构都继承了seq2seq。 结构说明: 编码器是一个RNN,读取输入句子,可以是双向 解码器: 使用另外一个RNN来输出 运行机制: 编码器的最后一层输出,作为解码器的输入。 训练 用的是真实的label值。 评价翻译结果

 相关资料
  • 我们已经在前两节中表征并变换了不定长的输入序列。但在自然语言处理的很多应用中,输入和输出都可以是不定长序列。以机器翻译为例,输入可以是一段不定长的英语文本序列,输出可以是一段不定长的法语文本序列,例如 英语输入:“They”、“are”、“watching”、“.” 法语输出:“Ils”、“regardent”、“.” 当输入和输出都是不定长序列时,我们可以使用编码器—解码器(encoder-de

  • 问题内容: Android中是否存在用于String的base-64解码器和编码器? 问题答案: 看到 似乎这是在API版本8或android 2.2中添加的,因此在较旧的平台上将不可用。 但是它的来源是这样,如果需要的话,可以将其原样复制为旧版本。

  • Netty 的是一个复杂和先进的框架,但它并不玄幻。当我们请求一些设置了 key 的给定值时,我们知道 Request 类的一个实例被创建来代表这个请求。但 Netty 并不知道 Request 对象是如何转成 Memcached 所期望的。Memcached 所期望的是字节序列;忽略使用的协议,数据在网络上传输永远是字节序列。 将 Request 对象转为 Memcached 所需的字节序列,N

  • 编解码器 服务端和客户端拥有各自的编解码器接口定义。虽然在形式上,不同的语言有所不同,但参数都是一样的。 例如在 C# 中,接口定义为: public interface IServiceCodec { MemoryStream Encode(object result, ServiceContext context); (string, object[]) Decode(Memo

  • 我正在尝试显示从一个android设备到另一个android设备的实时预览。这是我所做的, 发送器 ;:1.摄像机帧(YUV)->2.MediaCodec(编码h264字节[])->3.MediaMuxer->4.MP4

  • 提纲ceph-dencoder [commands...] 描述 ceph-dencoder 工具用来编码、解码和转储 Ceph 数据结构。常用于调试或测试版本间的兼容性。 ceph-dencoder 只是简单地读入命令列表并依次执行。 命令 version 打印 ceph-dencoder 二进制程序的版本字符串。 import <file> 从指定文件读入已编码的二进制数据块。它将被放入内存驻

  • 我正在尝试检索Google Reporting API的库: 但是我收到了一个未解决的依赖项错误,我不知道该怎么办: 我检查了.grails\ivy-cache\文件夹,有一个公共编解码器文件夹,里面有共享资源编解码器1.5的罐子,几个xml文件常春藤-1.5.xml和常春藤-1.6.xml和常春藤数据-1.5.属性和常春藤数据-1.6.属性。我也试图删除整个常春藤缓存文件夹,但结果是一样的。

  • 编码器和解码器完成,但仍有一些缺失:测试。 没有测试你只看到如果编解码器工作对一些真正的服务器运行时,这并不是你应该是依靠什么。第十章所示,为一个自定义编写测试 ChannelHandler通常是通过 EmbeddedChannel。 所以这正是现在做测试我们定制的编解码器,其中包括一个编码器和解码器。让重新开始编码器。后面的清单显示了简单的编写单元测试。 Listing 14.5 Memcach