当前位置: 首页 > 工具软件 > Ekho > 使用案例 >

windows java ekho_基于linux的ekho(余音)安装与开发

殷宇
2023-12-01

基于linux的ekho(余音)安装与开发

转发时请注明出处,否则.......你懂的,呵呵

Ekho(余音)是一个把文字转换成声音的软件。它目前支持粤语、普通话(国语)、诏安客语和韩语(试验中),英文则通过Festival间接实现。它比eSpeak的设计更简易,但文件较大。由于使用了真人发声,它比eSpeak的发音更自然。

一、Ekho的安装

# tar xjvf ekho-4.8.tar.bz2

# cd ekho-4.8

# ./configure

# make

#make install

安装成功~~~

测试一下吧:  #ekho  "我爱你余音"

注意:

如果./configure配置出错,可能是你缺少libsndfile, libportaudio, libvorbis-dev and liblame-dev ,你可以通过yum search +包名 和

yum install +包名 命令搜索安装,例如:缺少libsndfile,先yum search sndfile (一般安装包名中含有-devel的开发包),然后

yum install  +包名

http://www.eguidedog.net/cn/ekho_cn.php

二、Ekho语音开发

( ~.~ 开发部分待续  ~.~  敬请期待~.~)

附录:  (Festival的安装)

Festival提供了一个通用的框架,用于构建语音合成系统,该系统包含了各种模块示例。它提供了完整的文本转语音的API,可以通过shell、C++静态库等多种方式调用,原生支持Mac OS,支持的语言包括英语和西班牙语;而且系统是使用c++编写,底层调用Edinburgh Speech Tools;

先阅读它的手册知,下载需要的压缩包(http://festvox.org/packed/festival/2.1/):

festival-2.1-release.tar.gz Festival语音合成系统源文件

speech_tools-2.1-release.tar.gz Edinburgh语音工具库

festlex_CMU.tar.gz  festlex_POSLEX.tar.gz词典

festvox_kallpc16k.tar.gz 语料库

前两个解压后需要配置编译,后三个解压后自动解压在festival文件夹中。首先编译speech_tools,进入该文件夹,输入:

#./configure

#make

其它如在Cygwin、vc下的编译在INSTALL文件中有说明。然后进入festival文件夹,按照INSTALL文件中的说明进行安装,是可以看到详细的安装说明,以及需要文件夹festival speech_tools的。还是一般的./configure make即可,由于仅是在本地使用,没有了Site initialization这一步,在安装完成后运行bin/festival,如无错误提示出现:

Festival Speech Synthesis System 2.1:release November 2010

Copyright (C) University of Edinburgh, 1996-2010. All rights reserved.

clunits: Copyright (C) University of Edinburgh and CMU 1997-2010

clustergen_engine: Copyright (C) CMU 2005-2010

hts_engine:

The HMM-based speech synthesis system (HTS)

hts_engine API version 1.04 (http://hts-engine.sourceforge.net/)

Copyright (C) 2001-2010  Nagoya Institute of Technology

2001-2008  Tokyo Institute of Technology

All rights reserved.

For details type `(festival_warranty)'

festival>

可以输入help或者(SayText "Hello World!")测试。如果出现Can't open /dev/dsp的错误,可以在~/.festivalrc文件写入:

(Parameter.set 'Audio_Method 'Audio_Command)

(Parameter.set 'Audio_Command "aplay -q -c 1 -t raw -f s16 -r $SR $FILE")

=============================================================

一、  介绍

1.          用途:可识别多语言的朗读软件

2.          特点:

1)         能读中文:相对英文,更适合朗读中文

2)         可以在程序中被调用——提供c++接口及库

3)         支持词的识别和

4)         安装简单,安装文件少,依赖库少,移植方便

a)          源码32981行

b)         espeak_1.36.orig.tar.gz,只有1M多,源码及数据(多语言规则)

5)         相对比较平滑

6)         能处理多音字

二、  平台

1.          有windows,Linux系统版本支持

2.          ubuntu 8.04系统自带espeak

三、  试试中文发音

$ espeak -vzh “hello world”

$ espeak -vzh “你好”

四、  编译

1.          下载espeak-1.36-orig.tar.gz

2.          安装

$ tar xvzf espeak-1.36-orig.tar.gz

$ cd espeak-1.36

$ cd src

$ make

$ make install

3.          注意:

它需要portaudio库的支持,如ubuntu 8.04中自带这个库,但库名不同,可做个链接

ln -s /usr/lib/libportaudio.so.0 /usr/libportaudio.so

4.          编译后主要产生三个文件

espeak是可执行文件,它依赖libespeak.so.1.1.36库

speak是不依赖库的可执行文件

libspeak.so.1.1.36是动态库,一方面对espeak做支持,也可被C程序调用

五、  安装结构

1.          库

2.          可执行程序

3.          数据

1)         字与读音对应(一级汉字)

2)         词

3)         多音字

六、  c程序调用试例

1.          代码

#include // 包括espeak的头文件

#include

#include

int main(int argc, char **argv)

{

char word[] = "吃葡萄不吐葡萄皮";

espeak_Initialize(AUDIO_OUTPUT_PLAYBACK, 0, NULL, 0);// 初始化

espeak_SetVoiceByName("zh+f2");// 设置音源为中文女声

espeak_Synth(word, strlen(word) + 1, 0, POS_CHARACTER, 0,

espeakCHARS_UTF8, NULL, NULL);// 发音

sleep(3);// 等一段时间,否则程序会立即退出,听不到发音

espeak_Terminate();// 回收资源

}

2.          编译

$ g++ test1.c -o test1 -lespeak

 类似资料: