话说当今语音识别界有两大巨头,分别是百度语音平台与讯飞语音平台。他们都被广泛应用与手机上。当然,伟大而又神奇的linux也能完成这一个实现。语音识别,也是机器人智能化的一个关键技术,废话不多说,上日志:
root@OpenWrt:/tts# ./iatdemo
[ 1171.740000] RTMP_TimerListAdd: add timer obj c0d0ff80!
luacFramework_Init() [in]CALL MSPFsetworkdirCALL configMgr_InitCALL envMgr_InitCALL globalLogger_InitCALL MSPThreadPool_InitCALL MSPSocketMgr_InitCALL MSPAsyncDns_Initdns_main's id=76d90520CALL framework_addInitCALL luaLoader_InitCALL luaEngine_InitluacFramework_Init() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addlua() [in]luacFramework_Addlua() [out] 0luacFramework_Addluac() [in]luacFramework_Addluac() [out] 0luacFramework_Addluac() [in]luacFramework_Addluac() [out] 0luacFramework_Addluac() [in]luacFramework_Addluac() [out] 0luacFramework_Addluac() [in]luacFramework_Addluac() [out] 0luacFramework_Addluac() [in]luacFramework_Addluac() [out] 0InterfaceInit() [in]InterfaceInit() [out] ret=0luacFramework_RegisterCallBack() [in]luacFramework_RegisterCallBack() [out] 0dns_main() [in]gethostbyname(dev.voicecloud.cn) startluacFramework_GetEnv() [in]luacFramework_SetEnv() [out]gethostbyname(dev.voicecloud.cn) ret=0, errno=0, h_errno=166gethostbyname(dev.voicecloud.cn) startgethostbyname(dev.voicecloud.cn) ret=0, errno=0, h_errno=166gethostbyname(dev.voicecloud.cn) startgethostbyname(dev.voicecloud.cn) ret=0, errno=0, h_errno=166
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=0,aus=1,eps=0,rss=2,ret=0gethostbyname(dev.voicecloud.cn) startgethostbyname(dev.voicecloud.cn) ret=0, errno=0, h_errno=166
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=1,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=2,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=3,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=4,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=5,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=6,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=7,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=8,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=9,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=10,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=11,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=12,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=13,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=14,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=15,aus=2,eps=1,rss=2,ret=0
csid=cisr1PdHHBHyuty3dxdMHHmqRaxW1Y5l7L,count=16,aus=2,eps=1,rss=2,ret=0
=============================================================
The result is: {"sn":1,"ls":false,"bg":0,"ed":0,"ws":[{"bg":0,"cw":[{"sc":0.00,"w":"开发"}]},{"bg":0,"cw":[{"sc":0.00,"w":"版"}]}]}{"sn":2,"ls":true,"bg":0,"ed":0,"ws":[{"bg":0,"cw":[{"sc":0.00,"w":"。"}]}]}
=============================================================
以上是我对着开发板录的两秒的声音文件的识别结果。
演示视频:
http://pan.baidu.com/share/link?shareid=3049474976&uk=2769189111