至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作'vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。
Vekou目前虽然发音质量不是相当好,但基本上还可以工作了。你可以给一个String让它发音,也可以给一个txt文档让它发音,当然你也可以让程序给你生成一个语音文件。0.0.4版的功能详细的功能说明如下:
1. String发音
2. txt文档文件发音,txt文档编码自动检测
3. 语音文件生成
4. 粤语口语转换发音
5. time scaling(未实现)
6. pitch scaling(未实现)
7. 繁简支持
8. 语音库自定义
9. 词典自定义
10. 口语字典自定义
Vekou的诞生离不开Ekho(余音)的支持,Vekou的语音库以及初始词典全部来自于它,还有基于中科院的imdict 智能词典所采用的智能中文分词程序,Vekou的底层使用到中文分词。
你可以很简单的使用它,初次尝试的时候你可以建立一个如下的 Test.java文件来测试:
import java.io.File;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
import org.lib.speech.engine.Engine;
import org.lib.speech.engine.SpeechEngine;
import org.lib.speech.process.DefaultStreamProcess;
import org.lib.speech.process.ProcessCenter;
public class Test {
public static void main(String[] args) {
// 建造一个流处理器,参数设置是否重新读取字典文件
ProcessCenter pc = new DefaultStreamProcess(true);
// 建立一个语音引擎,第二个参数设置是否转换为粤语口语发音
Engine engine = new SpeechEngine(pc, true);
// 任何一个String作为你想要它发音的句子
String sentences = "你可以在这里尝试任何一个句子,看看它是如何发音的。";
// 第一种方法:直接要它发音
engine.getPronounces(sentences);
// 第二种方法:句子在一个txt文档中,你要它把txt中的内容读出来,第二个参数设置是否将文档内容输出到控制台显示
try {
engine.getPronounces(new File("C:/a.txt"), false);
} catch (IOException e) {
e.printStackTrace();
}
// 第三种方法:把发音保存在一个.au的声音文件中,目前只支持保存到这种文件,当然你也可以自己扩展
try {
engine.getPronouncesFile(sentences, new File(
"C:/a.au"));
} catch (IOException e) {
e.printStackTrace();
}
// 另外,如果你想获得初始的发音素材,可以这样显示到控制台
List<Object[]> list = engine.getPronounceElements(sentences);
Iterator<Object[]> iter = list.iterator();
while (iter.hasNext()) {
Object[] obj = iter.next();
if (obj[0] instanceof File) {
for (int i = 0; i < obj.length; i++) {
File file = (File) obj[i];
System.out.print(file.getName() + " ");
}
} else {
for (int i = 0; i < obj.length; i++) {
System.out.print(obj[i] + " ");
}
}
System.out.println();
}
}
}
软件简介 至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作’vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。 Vekou目前虽然发音质量不是相
软件介绍 至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作'vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。 Vekou目前虽然发音质量不是相
我试着用将文本转换为语音,但不起作用。 我正在使用64位Windows7和VisualStudio2010(我想是用.NETFramework 4.0吧?) 该方案: 发生在第
1.1.1. TTS 1.1.1. TTS 我们的语音合成接口使用 C/S 架构,服务端默认启动,开发者需要通过调用客户端接口与服务端通讯,TTS服务架构图如下: 客户端头文件目录位于: #include <tts/tts_client.h> 除了要 include 头文件外,还需要链接 -lrktts。 API int tts_init(); // tts初始化接口 int tts_spe
1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议概述 1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)HTTP接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务地址 环境 地址 用途 线上 https://ma
1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)WebSocket接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2.
1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 1.1.3. 编解码 1.1.4. 认证方式 1.1.5. Curl示例 1.1.6. 设备认证 1.2. 语音合成API 1.2.1. 请求URL 1.2.2. proto 文件 1.2.3. 请求和回复数据 1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 Rokid语音合成服
1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 1.1.3. 协议详解 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 本文档目的是描述云端语音接口的 WebSocket 版本的开放协议,面向想要了解语音合成(TTS)细节,并具有一定开发能力的开发者或用户。 1.1.
1.1. 语音合成 1.1.1. 技术简介 1.1.2. 主要功能 1.1.3. 优势亮点 1.1. 语音合成 语音合成(TTS, Text-to-speech),用于将文本转换为语音,让应用或设备具备开口说话的能力,提升人机交互体验。语音合成广泛应用于人机对话、新闻朗读、语音导航等场景。 1.1.1. 技术简介 Rokid TTS采用参数合成方法,结合深度学习技术的运用,让机器可以生成真实自然的
导语今天就给大家带来个语言识别跟语言转文字的小工具,1.直接使用在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,保存为online_tts.py,在命令行执行python online_tts.py -client_secret=你的client_secret -client_id=你的client_id -file_save_path=test.wav --text=今天天气不错1. 获取权限Pyth