Julius项目地址:https://github.com/julius-speech/julius
最近在写一个日语语音识别的项目,Julius相关资料太少,在此记录一下自己在运行配置时遇到的各种问题。
Julius是日本京都大学和日本IPA(Information-tech-nology Promotion Agency)联合开发的一个实用高效双通道的大词汇连续语音识别引擎。目前已经能较好地应用于日语和汉语的大词汇量连续的语音识别系统。Julius由纯C语言开发,遵循GPL开源协议,能够运行在Lin-ux、Windows、Mac:OS X、Solaris以及其他Unix平台。Julius最新的版本采用模块化的设计思想,使得各功能模块可以通过参数配置。
Julius的运行需要一个语言模型和一个声学模型。利用Julius,通过结合语言模型和声学模型,可以很方便地建立一个语音识别系统。语言模型包括一个词的发音字典和语法约束。Julius支持的语言模型包括:N-gram模型,以规则为基础的语法和针对孤立词识别的简单单词列表。声学模型必须是以分词为单位且由HMM定义的。
Julius Demo地址:https://github.com/julius-speech/dictation-kit
根据Github上的描述,由于Demo文件过大,所以需要采用git-lfs进行下载。(git-lfs下载地址:https://git-lfs.github.com/)
下载好之后,重点来了!敲黑板!!
在运行git lfs clone 指令前之前一定要运行:
git lfs install
不然就会出现各种奇怪的错误!亲测一条指令解决很多问题!
初始化后就可以进行clone指令:
git lfs clone https://github.com/julius-speech/dictation-kit.git
运行环境:win10
按照Demo的说明,windows下应该运行的是.bat为结尾的文件,如果没有安装过gpu加速的话,直接运行第一个就好。
运行时如果遇到无法显示日文,请用指令:
chcp 932
将当前代码页的编码调整为sjis——日语编码,即可正确运行啦