NiuTrans

统计机器翻译
授权协议 GPL
开发语言 C/C++ Perl
所属分类 企业应用、 教学科研相关
软件类型 开源软件
地区 国产
投 递 者 商畅
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

NiuTrans 统计机器翻译开源系统由东北大学自然语言处理实验室开发。该系统使用 C++/C 编程语言进行编码,具有运行速度快、使用内存少等优点。目前 NiuTrans 支持基于(层次)短语的模型。

NiuTrans 特性如下:

1. 在同一的框架下支持目前所有最优的统计机器翻译模型(句法系统即将推出)

2. 集中多种内置解码算法供用户选择

3. 易于使用,用户仅需简单执行几个脚本即可使用本系统

4. 使用 c++语言进行开发,系统稳定且运行速度快

5. 内置简单有效 n-gram 语言模型

自从2011年7月份 NiuTrans ver0.1.0推出后,得到了很多修改反馈意见。基于大家的建议,曾在去年十月份推出一个新版0.2.0,修正了一些 Bugs 和支持了32位 OS.

目前 NiuTrans Ver0.3.0已经发布,这个新版升级的主要特征:1)新支持了层次短语模型(hierarchical phrase-based model)NiuTrans.Hierarchy;2)提供了详细描述 NiuTrans.Phrase 系统的文档,层次短语模型的文档准备正在进行之中,完成后随时更新。访问入口显示在东北大学自然语言处理实验室网站(http://www.nlplab.com)首页左上角。

NiuTrans 开发组所有成员和实验室主任朱靖波教授非常感谢大家的关注,也欢迎大家给我们提建议,可以直接 e-mail to niutrans@mail.neu.edu.cn

  • NiuTrans统计机器翻译开源系统由东北大学自然语言处理实验室开发。该系统使用C++/C编程语言进行编码,具有运行速度快、使用内存少等优点。目前NiuTrans支持基于(层次)短语的模型。 NiuTrans特性如下: 1. 在同一的框架下支持目前所有最优的统计机器翻译模型(句法系统即将推出) 2. 集中多种内置解码算法供用户选择 3. 易于使用,用户仅需简单执行几个脚本即可使用本系统 4. 使用

  •   NiuTrans是一个开源的统计机器翻译系统,由中国的 东北大学 自然语言处理实验室 开发,相对于moses,笔者认为Niutrans更好搭建,比如Niutrans内嵌小巧、高效的N-元语言模型,无需其它软件(如SRILM)的外部支持。     另外: NiuTrans支持多个统计机器翻译模型:    a) 基于短语的模型    b) 基于层次短语的模型    c) 基于句法(树到串,串到树,

  • NiuTrans统计机器翻译开源系统由东北大学自然语言处理实验室开发。该系统使用C++/C编程语言进行编码,具有运行速度快、使用内存少等优点。目前NiuTrans支持基于(层次)短语的模型。 NiuTrans特性如下: 1. 在同一的框架下支持目前所有最优的统计机器翻译模型(句法系统即将推出) 2. 集中多种内置解码算法供用户选择 3. 易于使用,用户仅需简单执行几个脚本即可使用本系统 4. 使用

  • Niutrans:基于短语的统计翻译系统 1. Data preparation数据准备阶段 a) Training data 训练数据 LM-training-set和 LM-training-set b) Tuning data 调参参数(相当于超参数:来调整权重参数) c) Test data 测试效果的(类似交叉验证) d) Evaluation data 评估 注意: 1)、LM:语言模

 相关资料
  • 机器翻译是指将一段文本从一种语言自动翻译到另一种语言。因为一段文本序列在不同语言中的长度不一定相同,所以我们使用机器翻译为例来介绍编码器—解码器和注意力机制的应用。 读取和预处理数据 我们先定义一些特殊符号。其中“<pad>”(padding)符号用来添加在较短序列后,直到每个序列等长,而“<bos>”和“<eos>”符号分别表示序列的开始和结束。 import collections impo

  • 我们知道学习正则表达式的时候,经常遇到pattern 这个单词,一般是怎么翻译它的呢? 比如: A query consists of one or more patterns

  • 计算机操作系统

  • 编译系统的四个阶段 预处理:将头文件的内容直接插入到文本 编译:源码到汇编 汇编:汇编指令到机器指令,这时得到的可重定位目标程序还无法执行 链接:将标准库函数所在的预编译文件合入到上一步的程序中,得到最终的可执行文件 系统硬件组成 32 位、64 位也是计算机总线依次传递的字的大小 控制器和适配器:控制器存在硬件上,硬件直接与 I/O 总线相连,在主板内部;适配器:不在主机内部而是通过扩展槽相连到

  • Axiom是一个通用的计算机代数系统,用于研究和开发数学算法,定义了强类型的数学形式上正确的类型系统,拥有自己的编程语言和内置编译器。

  • 编译系统 静态链接 目标文件 动态链接 编译系统 以下是一个 hello.c 程序: // c #include int main() { printf("hello, world\n"); return 0; } 在 Unix 系统上,由编译器把源文件转换为目标文件。 // bash gcc -o hello hello.c 这个过程大致如下: 预处理阶段:处理以 # 开