当前位置: 首页 > 工具软件 > Merlin.jl > 使用案例 >

merlin笔记

傅经业
2023-12-01

1. lab文件

编写格式-An example of context-dependent label format for HMM-based speech synthesis in English

slt_arctic_full_data/merlin_baseline_practice/duration_data/label_phone_align/

 0 1750000 x^x-sil+sil=w@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/
 C:0+0+0/D:0_0/E:x+x@x+x&x+x#x+x/F:0_0/G:0_0/H:x=x@1=2|0/I:0=0/J:14+8-2

说明:

起止时间 前一个phn^当前-下一个+下下个=下下下个@n_m/A/B/C/D/E/F/G/H/I/J 
(分别表示在音素中/字/词/句子中的位置,详情见上方pdf文件)

merlin_baseline_practice/acoustic_data/label_state_align/

0 50000 x^x-sil+sil=w@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/
C:0+0+0/D:0_0/E:x+x@x+x&x+x#x+x/F:0_0/G:0_0/H:x=x@1=2|0/I:0=0/J:14+8-2[2]

将phone_align分成5份(or7份),每份长度不一定等长,剩下的信息一样,最后的[2/3/4/5/6/]表示的是在phone_align中的位置,并不是从1开始编号的,顺序递减1or2

 类似资料: