Vekou

Java粤语语音合成系统
授权协议 Apache
开发语言 Java
所属分类 程序开发、 TTS/语音合成和处理
软件类型 开源软件
地区 不详
投 递 者 仲浩旷
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作'vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。

Vekou目前虽然发音质量不是相当好,但基本上还可以工作了。你可以给一个String让它发音,也可以给一个txt文档让它发音,当然你也可以让程序给你生成一个语音文件。0.0.4版的功能详细的功能说明如下:

       1. String发音
       2. txt文档文件发音,txt文档编码自动检测
       3. 语音文件生成
       4. 粤语口语转换发音
       5. time scaling(未实现)
       6. pitch scaling(未实现)
       7. 繁简支持
       8. 语音库自定义
       9. 词典自定义
      10. 口语字典自定义

Vekou的诞生离不开Ekho(余音)的支持,Vekou的语音库以及初始词典全部来自于它,还有基于中科院的imdict 智能词典所采用的智能中文分词程序,Vekou的底层使用到中文分词。

你可以很简单的使用它,初次尝试的时候你可以建立一个如下的 Test.java文件来测试:

import java.io.File;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;

import org.lib.speech.engine.Engine;
import org.lib.speech.engine.SpeechEngine;
import org.lib.speech.process.DefaultStreamProcess;
import org.lib.speech.process.ProcessCenter;

public class Test {
        public static void main(String[] args) {

                // 建造一个流处理器,参数设置是否重新读取字典文件
                ProcessCenter pc = new DefaultStreamProcess(true);

                // 建立一个语音引擎,第二个参数设置是否转换为粤语口语发音
                Engine engine = new SpeechEngine(pc, true);

                // 任何一个String作为你想要它发音的句子
                String sentences = "你可以在这里尝试任何一个句子,看看它是如何发音的。";

                // 第一种方法:直接要它发音
                engine.getPronounces(sentences);

                // 第二种方法:句子在一个txt文档中,你要它把txt中的内容读出来,第二个参数设置是否将文档内容输出到控制台显示
                try {
                        engine.getPronounces(new File("C:/a.txt"), false);
                } catch (IOException e) {
                        e.printStackTrace();
                }

                // 第三种方法:把发音保存在一个.au的声音文件中,目前只支持保存到这种文件,当然你也可以自己扩展
                try {
                        engine.getPronouncesFile(sentences, new File(
                                        "C:/a.au"));
                } catch (IOException e) {
                        e.printStackTrace();
                }

                // 另外,如果你想获得初始的发音素材,可以这样显示到控制台
                List<Object[]> list = engine.getPronounceElements(sentences);
                Iterator<Object[]> iter = list.iterator();
                while (iter.hasNext()) {
                        Object[] obj = iter.next();
                        if (obj[0] instanceof File) {
                                for (int i = 0; i < obj.length; i++) {
                                        File file = (File) obj[i];
                                        System.out.print(file.getName() + " ");
                                }
                        } else {
                                for (int i = 0; i < obj.length; i++) {
                                        System.out.print(obj[i] + " ");
                                }
                        }
                        System.out.println();
                }
        }
}

  • 软件简介 至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作’vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。 Vekou目前虽然发音质量不是相

  • 软件介绍 至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作'vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。 Vekou目前虽然发音质量不是相

 相关资料
  • 我试着用将文本转换为语音,但不起作用。 我正在使用64位Windows7和VisualStudio2010(我想是用.NETFramework 4.0吧?) 该方案: 发生在第

  • 1.1.1. TTS 1.1.1. TTS 我们的语音合成接口使用 C/S 架构,服务端默认启动,开发者需要通过调用客户端接口与服务端通讯,TTS服务架构图如下: 客户端头文件目录位于: #include <tts/tts_client.h> 除了要 include 头文件外,还需要链接 -lrktts。 API int tts_init(); // tts初始化接口 int tts_spe

  • 1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议概述 1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)HTTP接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务地址 环境 地址 用途 线上 https://ma

  • 1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)WebSocket接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2.

  • 1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 1.1.3. 编解码 1.1.4. 认证方式 1.1.5. Curl示例 1.1.6. 设备认证 1.2. 语音合成API 1.2.1. 请求URL 1.2.2. proto 文件 1.2.3. 请求和回复数据 1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 Rokid语音合成服

  • 1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 1.1.3. 协议详解 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 本文档目的是描述云端语音接口的 WebSocket 版本的开放协议,面向想要了解语音合成(TTS)细节,并具有一定开发能力的开发者或用户。 1.1.

  • 1.1. 语音合成 1.1.1. 技术简介 1.1.2. 主要功能 1.1.3. 优势亮点 1.1. 语音合成 语音合成(TTS, Text-to-speech),用于将文本转换为语音,让应用或设备具备开口说话的能力,提升人机交互体验。语音合成广泛应用于人机对话、新闻朗读、语音导航等场景。 1.1.1. 技术简介 Rokid TTS采用参数合成方法,结合深度学习技术的运用,让机器可以生成真实自然的

  • 导语今天就给大家带来个语言识别跟语言转文字的小工具,1.直接使用在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,保存为online_tts.py,在命令行执行python online_tts.py -client_secret=你的client_secret -client_id=你的client_id -file_save_path=test.wav --text=今天天气不错1. 获取权限Pyth