当前位置: 首页 > 工具软件 > Jtalk > 使用案例 >

open-jtalk 编译与使用

施令雪
2023-12-01

1.  open-jtalk

    [open-jtalk](http://open-jtalk.sourceforge.net/ )  是一个开源的日语合成系统,相当于日文版的festival。 该系统包括的日语合成系统的前端处理和后端合成,使用C语言编写。

 

2. 编译:

  • http://open-jtalk.sourceforge.net/   source code下载源码
  • 解压 open_jtalk-1.11
  • 查看/INSTALL, 确定如何编译
  • 下载 hts_engine_API-1.10.tar.gz   https://sourceforge.net/projects/hts-engine/files/hts_engine%20API/hts_engine_API-1.10/hts_engine_API-1.10.tar.gz/download?use_mirror=nchc
  • 解压 hts_engine_API-1.10.tar.gz, 按照hts_engine_API-1.10/INSTALL编译,注意make install需要跟用户权限
  • 注意Make install 之后, include, bin, lib都默认放在了/usr/local/{bin, include, lib}
  • 回到 open_jtalk-1.11, 按照INTALL进行编译

                1) ./configure 参数需要修正:
                         % ./configure \
                         --with-hts-engine-header-path=/usr/local/include \
                           --with-hts-engine-library-path=/usr/local/lib
                2) Make
                3) Make install

  • 编译完成后, 可执行文件和静态库都在 open-jtalk/bin

 

3. 下载执行所需要的字典和HTSVOICE

   解压上述文件,并存放在自己指定的目录

 

4. 回到 open-jtalk/bin/

 

5. 查看执行方法:

 usage:

       open_jtalk [ options ] [ infile ]

  options:                                                                   [  def][ min-- max]

      -x  dir        : dictionary directory                                    [  N/A]

      -m  htsvoice   : HTS voice files                                         [  N/A]

      -ow s          : filename of output wav audio (generated speech)         [  N/A]

      -ot s          : filename of output trace information                    [  N/A]

      -s  i          : sampling frequency                                      [ auto][   1--    ]

      -p  i          : frame period (point)                                    [ auto][   1--    ]

      -a  f          : all-pass constant                                       [ auto][ 0.0-- 1.0]

      -b  f          : postfiltering coefficient                               [  0.0][ 0.0-- 1.0]

      -r  f          : speech speed rate                                       [  1.0][ 0.0--    ]

      -fm f          : additional half-tone                                    [  0.0][    --    ]

      -u  f          : voiced/unvoiced threshold                               [  0.5][ 0.0-- 1.0]

      -jm f          : weight of GV for spectrum                               [  1.0][ 0.0--    ]

      -jf f          : weight of GV for log F0                                 [  1.0][ 0.0--    ]

      -g  f          : volume (dB)                                             [  0.0][    --    ]

      -z  i          : audio buffer size (if i==0, turn off)                   [    0][   0--    ]

  infile:

      text file 

6. 注意:

  • 选项
    • 把音量调小就会发出女性的声音,调大就会发出男性的声音。
    • 通过调整音高移位值,可按照半音单位改变合成声音的高度。
    • 语速值小则慢,大则快。
  • 复合文本
    • 可以合成最多200字的文章。
 类似资料: