[可能重复]但我没有找到下面问题的答案。
在过去的两天里,我一直在做一些语音识别方面的研究,但我的问题没有得到答案:
1)将语音识别放入服务是正确的方法,就像在Google api中制作的一样,其中使用回调方法来获取结果。为了使其连续运行,服务必须处理wakelock,以避免陷入睡眠模式。这里提供了更多信息唤醒锁定android服务重复出现它有一个很大的缺点——电池使用率高,这是由CPU的持续工作和传入声音数据的连续计算造成的。(可以通过过滤器、阈值等减少)
2)语音识别不是一项简单的任务。它需要大量的计算和数据来参考。如果输入音频不清晰(噪声、许多人声等),则很难获得正确的输出。可以做些什么来提高准确性是,过滤输入音频:噪声抑制、低通滤波器等。您不能期望100%的准确率,但可以达到80-95%。
更难的是过滤许多人声。但也可以使用一些简单的振幅(音频强度级别)算法,这些算法具有自适应阈值,决定单词的开始和结束时间。想法是,正确的声音是最响亮的=离电话/设备最近。因此,根据4)所述,当用户靠近麦克风说话时,准确度会更好,因为这是最响亮的声音。
3)我不知道你说的传感器是什么意思,但是有一些算法可以简单地检测人类的声音,而不是解码单词。这些算法被称为语音endpoint检测(VAD)一些代码应该在Speex项目留档中找到http://www.speex.org/
处理语音识别最简单的方法是使用谷歌语音api,它非常好,可以识别多种语言,但需要连接互联网,而且需要一段时间才能得到结果
我正在寻找一个Android语音识别库。我只需要它来理解“是/否”的答案(用不同的语言,如英语、德语、法语)。 有什么建议吗?
我想制作一个语音识别器应用程序来转录用户的语音。我不想在这样做的时候有任何对话,所以是不可能的。(我知道如果我使用这种方法,我可以获得音频) 我正在使用SpeechRecognitor,并调用startListening来收听用户的音频。我在onResults中得到了非常准确的结果。 现在,我还需要在我的设备SD卡中存储用户的音频。为此,我尝试了MediaRecorder和AudioRecord,
问题内容: 我正在研究语音识别,需要一些示例程序。 谁能指导我? 问题答案: 让我剪切粘贴一下,向您展示所需的代码。 编辑:您还可以从该项目下载一个方便的抽象类。 您将需要此意图(在您认为合适的情况下进行参数化): 然后,您需要将自己的意图发送到语音识别活动,例如, 然后,您需要让自己的活动处理语音结果:
我使用RecognizerIntent并实现RecognitionListener,并实现其所有回调方法来执行语音命令。我试着调整参数EXTRA\u SPEECH\u INPUT\u MINIMUM\u LENGTH\u MILLIS、EXTRA\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u LENGTH\u MILLIS和EXTRA\u SPEE
我已经使用HTK(Hidden Markov Model Tool Kit)来识别用于控制Android应用程序的特定命令,但在这种情况下,我需要将一些语音数据传递给服务器,这可能会耗费更多时间。 为了防止这种延迟,我正在考虑使用pocketsphinx通过Android应用程序在本地识别语音数据,这样我就不需要将音频传递给服务器。 如果这是一个好主意,那么从头开始学习pocketsphinx容易
我想开发一个模块,它将使用Android中的语音到文本支持。我发现了许多与RecogenerIntent等相关的文档和演示。但我发现所有这些演示都只是在10秒左右的时间里播放声音。但我想让我的演示运行5-10分钟以上。如果不是离线运行,我不会有任何问题,因为我的应用程序总是在线运行。 我也看过Android上的Pocketsphinx,但效果不太好。此外,它只支持Android Studio,而不