编写格式-An example of context-dependent label format for HMM-based speech synthesis in English
slt_arctic_full_data/merlin_baseline_practice/duration_data/label_phone_align/
0 1750000 x^x-sil+sil=w@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/
C:0+0+0/D:0_0/E:x+x@x+x&x+x#x+x/F:0_0/G:0_0/H:x=x@1=2|0/I:0=0/J:14+8-2
说明:
起止时间 前一个phn^当前-下一个+下下个=下下下个@n_m/A/B/C/D/E/F/G/H/I/J
(分别表示在音素中/字/词/句子中的位置,详情见上方pdf文件)
merlin_baseline_practice/acoustic_data/label_state_align/
0 50000 x^x-sil+sil=w@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/
C:0+0+0/D:0_0/E:x+x@x+x&x+x#x+x/F:0_0/G:0_0/H:x=x@1=2|0/I:0=0/J:14+8-2[2]
将phone_align分成5份(or7份),每份长度不一定等长,剩下的信息一样,最后的[2/3/4/5/6/]表示的是在phone_align中的位置,并不是从1开始编号的,顺序递减1or2