问题：

基于CMU Sphinx的慢速语音识别

阎修杰

2023-03-14

我想使用CMU Sphinx 5 prealpha进行实时语音识别（用于检测一些热词）并使用此命令：

pocketsphinx_continuous -inmic yes\
                        -hmm zero_ru.cd_cont_4000\
                        -dict ru-dict-min.dic\
                        -lm ru-cmds-min.lm\
                        -samprate 16000

我对准确度很满意，但我注意到一个滞后。例如，我开始识别并说“你好”，Sphinx在1-3秒后打印“你好”（太棒了！），我等待几分钟后再次说“你好”，Sphinx在10-18秒后打印“你好”。我等待几分钟后再次说“你好”，Sphinx在3-7秒后打印“你好”。任务管理器显示Sphinx使用了2-17%的CPU。我该如何修复它？有什么问题？

我使用非常小的文件：ru-dict-min.dic有28个字，ru-min.lm有24个ngram。

共有1个答案

龙佐

2023-03-14

语音活动检测器拾取的噪音太大，这就是斯芬克斯在处理上花费太多时间的原因。

类似资料：

基于phonegap的连续语音识别

我想在phonegap中创建应用程序，在Android和IOS中使用连续语音识别。我的应用程序应该等待用户的声音，当他/她说“下一步”时，应用程序应该更新屏幕并执行一些操作。我发现这个插件：https://github.com/macdonst/SpeechRecognitionPlugin而且它工作得非常快。但在语音识别启动几秒钟后，语音识别器停止工作，但并没有语音。是否有任何方法或标志，如i
基于语音（噪声）强度水平的语音识别？

我想构建一个android应用程序，它可以识别我的声音，将其转换为文本，并显示我刚才在祝酒词中所说的内容。我可以通过使用一个按钮来完成这项工作，该按钮将为我启动语音识别器。但现在我想让它只在我的声音的基础上工作。应用程序应触发语音识别器，仅当我开始说话时才开始听我说话，当它感觉到沉默时应停止听我说话。就像会说话的tom应用程序的功能一样。它记录了声音，但我想用语音识别器识别它。像这样的事情：主
Android基于讯飞语音SDK实现语音识别

本文向大家介绍Android基于讯飞语音SDK实现语音识别，包括了Android基于讯飞语音SDK实现语音识别的使用技巧和注意事项，需要的朋友参考一下一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机关于科大讯飞SDK及API文档，请到科大语音官网下载：http://www.xfyun
Python语音识别非常慢

我目前正在开发一个智能助手程序（基本上，它只是听用户说什么，然后根据用户说的内容对代码进行处理）。直到今天，当我切换到笔记本电脑时，它一直工作正常。程序不会打印出任何错误，但也不会打印出我说的话。我正在使用Python语音识别库3.8版。1.有人知道这个图书馆的替代品吗？如果是，请尝试解释我将如何“即时”使用它（无需先录制文件，然后将其发送到服务器，更像是实时语音）。编辑：我忘了在帖子里说，我正
关于Android语音识别

我使用RecognizerIntent并实现RecognitionListener，并实现其所有回调方法来执行语音命令。我试着调整参数EXTRA\u SPEECH\u INPUT\u MINIMUM\u LENGTH\u MILLIS、EXTRA\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u LENGTH\u MILLIS和EXTRA\u SPEE
用于连续语音识别的HTML5语音输入API

我知道“x-webkit-speech”能够进行某种语音识别，实际上识别效果很好。我发现“x-webkit-语音”有利于开发Q 然而，我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如，如果我在网上听到一个讲座，我想实时转录教授正在谈论的内容。是否可以使用“x-webkit-speech”？我的感觉是，“x-webkit-speech”在检测到一段很短的静默期时会自动停止，这很烦人。我知

基于CMU Sphinx的慢速语音识别

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档