当前位置: 首页 > 知识库问答 >
问题:

Android语音识别器

易自珍
2023-03-14

我想制作一个语音识别器应用程序来转录用户的语音。我不想在这样做的时候有任何对话,所以start ActivityForResult with识别意图是不可能的。(我知道如果我使用这种方法,我可以获得音频)

我正在使用SpeechRecognitor,并调用startListening来收听用户的音频。我在onResults中得到了非常准确的结果。

现在,我还需要在我的设备SD卡中存储用户的音频。为此,我尝试了MediaRecorder和AudioRecord,但都没有成功。我总是在识别侦听器错误中遇到网络错误。我找不到如何克服这个问题。我还尝试从onBufferReceived获取数据,但没有成功。

如果有人能对此有所了解,那就太好了。

[编辑]

伙计们,这不是来自语音识别意图的录制/保存音频的重复,它略有不同。你给的答案是谷歌保留。保持使用对话框获取数据。我不需要屏幕上挂着对话框。

共有1个答案

何松
2023-03-14

在云语音API的帮助下,我成功地完成了这项工作。你可以通过谷歌语音找到它的演示。

该API可识别80多种语言和变体,以支持您的全球用户群。您可以转录用户对应用程序麦克风口述的文本,通过语音启用命令和控制,或转录音频文件,以及许多其他用例。使用Google用于支持自己产品的相同技术,识别请求中上传的音频,并与Google Cloud Storage上的音频存储集成。

它使用音频缓冲区在Google语音API的帮助下转录数据。在录音机的帮助下,我用这个缓冲区来存储录音。

因此,通过这个演示,我们可以与音频录制并行地转录用户的语音。

 类似资料:
  • 我正在寻找一个Android语音识别库。我只需要它来理解“是/否”的答案(用不同的语言,如英语、德语、法语)。 有什么建议吗?

  • [可能重复]但我没有找到下面问题的答案。 在过去的两天里,我一直在做一些语音识别方面的研究,但我的问题没有得到答案: 是否可以将语音识别作为一项服务运行?我想实现这样的功能:虽然我的手机处于睡眠模式,但我需要拨打一个号码

  • 问题内容: 我正在研究语音识别,需要一些示例程序。 谁能指导我? 问题答案: 让我剪切粘贴一下,向您展示所需的代码。 编辑:您还可以从该项目下载一个方便的抽象类。 您将需要此意图(在您认为合适的情况下进行参数化): 然后,您需要将自己的意图发送到语音识别活动,例如, 然后,您需要让自己的活动处理语音结果:

  • 我使用RecognizerIntent并实现RecognitionListener,并实现其所有回调方法来执行语音命令。我试着调整参数EXTRA\u SPEECH\u INPUT\u MINIMUM\u LENGTH\u MILLIS、EXTRA\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u LENGTH\u MILLIS和EXTRA\u SPEE

  • 我已经使用HTK(Hidden Markov Model Tool Kit)来识别用于控制Android应用程序的特定命令,但在这种情况下,我需要将一些语音数据传递给服务器,这可能会耗费更多时间。 为了防止这种延迟,我正在考虑使用pocketsphinx通过Android应用程序在本地识别语音数据,这样我就不需要将音频传递给服务器。 如果这是一个好主意,那么从头开始学习pocketsphinx容易

  • 由于连接到不同的API,我目前正在开发一个工具,允许我阅读所有的通知。 它工作得很好,但现在我想用一些声音命令来做一些动作。 就像当软件说“一封来自Bob的邮件”时,我想说“阅读”或“存档”。 我的软件是通过一个节点服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。 在NodeJS中,启用语音到文本的最佳方式是什么? 我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我希望在一