当前位置: 首页 > 知识库问答 >
问题:

基于CMU Sphinx的慢速语音识别

阎修杰
2023-03-14

我想使用CMU Sphinx 5 prealpha进行实时语音识别(用于检测一些热词)并使用此命令:

pocketsphinx_continuous -inmic yes\
                        -hmm zero_ru.cd_cont_4000\
                        -dict ru-dict-min.dic\
                        -lm ru-cmds-min.lm\
                        -samprate 16000

我对准确度很满意,但我注意到一个滞后。例如,我开始识别并说“你好”,Sphinx在1-3秒后打印“你好”(太棒了!),我等待几分钟后再次说“你好”,Sphinx在10-18秒后打印“你好”。我等待几分钟后再次说“你好”,Sphinx在3-7秒后打印“你好”。任务管理器显示Sphinx使用了2-17%的CPU。我该如何修复它?有什么问题?

我使用非常小的文件:ru-dict-min.dic有28个字,ru-min.lm有24个ngram。

共有1个答案

龙佐
2023-03-14

语音活动检测器拾取的噪音太大,这就是斯芬克斯在处理上花费太多时间的原因。

 类似资料:
  • 我想在phonegap中创建应用程序,在Android和IOS中使用连续语音识别。我的应用程序应该等待用户的声音,当他/她说“下一步”时,应用程序应该更新屏幕并执行一些操作。 我发现这个插件:https://github.com/macdonst/SpeechRecognitionPlugin而且它工作得非常快。但在语音识别启动几秒钟后,语音识别器停止工作,但并没有语音。是否有任何方法或标志,如i

  • 我想构建一个android应用程序,它可以识别我的声音,将其转换为文本,并显示我刚才在祝酒词中所说的内容。我可以通过使用一个按钮来完成这项工作,该按钮将为我启动语音识别器。但现在我想让它只在我的声音的基础上工作。 应用程序应触发语音识别器,仅当我开始说话时才开始听我说话,当它感觉到沉默时应停止听我说话。就像会说话的tom应用程序的功能一样。它记录了声音,但我想用语音识别器识别它。像这样的事情: 主

  • 本文向大家介绍Android基于讯飞语音SDK实现语音识别,包括了Android基于讯飞语音SDK实现语音识别的使用技巧和注意事项,需要的朋友参考一下 一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机 关于科大讯飞SDK及API文档,请到科大语音官网下载:http://www.xfyun

  • 我目前正在开发一个智能助手程序(基本上,它只是听用户说什么,然后根据用户说的内容对代码进行处理)。直到今天,当我切换到笔记本电脑时,它一直工作正常。程序不会打印出任何错误,但也不会打印出我说的话。我正在使用Python语音识别库3.8版。1.有人知道这个图书馆的替代品吗?如果是,请尝试解释我将如何“即时”使用它(无需先录制文件,然后将其发送到服务器,更像是实时语音)。 编辑:我忘了在帖子里说,我正

  • 我使用RecognizerIntent并实现RecognitionListener,并实现其所有回调方法来执行语音命令。我试着调整参数EXTRA\u SPEECH\u INPUT\u MINIMUM\u LENGTH\u MILLIS、EXTRA\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u LENGTH\u MILLIS和EXTRA\u SPEE

  • 我知道“x-webkit-speech”能够进行某种语音识别,实际上识别效果很好。 我发现“x-webkit-语音”有利于开发Q 然而,我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如,如果我在网上听到一个讲座,我想实时转录教授正在谈论的内容。 是否可以使用“x-webkit-speech”?我的感觉是,“x-webkit-speech”在检测到一段很短的静默期时会自动停止,这很烦人。我知