问题：

语音识别，录制的音频去哪里了？

商正诚

2023-03-14

我正在开发一个语音识别应用程序，用户会在其中说一句话或任何东西，然后将其转换为文本......（语音到文本的转换通过谷歌进行）

我的问题是，，，当这个人说话时，保存或记录他的声音（语音）的文件/缓冲区在哪里？（在谷歌收购并转换之前）

并且是否可以持有此文件或缓冲区？

共有1个答案

南宫书

2023-03-14

是的，对于小于4的版本（不知道3），它位于onBufferReception（byte[]缓冲区）上。在版本4（ICS）中，那里没有任何返回。

类似资料：

录制/保存语音识别意图中的音频

我想保存/录制Google识别服务用于语音转文本操作的音频（使用识别意图或语音识别器）。我经历了很多想法： > 使用了媒体录制器：不工作。这破坏了语音识别。mic只允许一次操作在执行语音到文本API复制临时音频文件之前，尝试查找识别服务在何处保存该文件，但未成功我几乎绝望了，但我只是注意到Google Keep应用程序正在做我需要做的事情！我使用logcat调试了一点keep应用程序，该应用
语音识别和录音

我在设计一个可以同时录制语音和将语音转换为文本的应用程序时遇到了这个bug。我使用Google API进行语音识别部分，并使用audioRecorder对象进行录音。它没有成功，因此我转而使用onBufferReceived（）来检索过程中的字节（当用户说话时）。Google API代码现在是我代码的onResults（）部分，它可以在没有UI的情况下进行语音识别。这是代码
Android上的长音频语音识别

我想开发一个模块，它将使用Android中的语音到文本支持。我发现了许多与RecogenerIntent等相关的文档和演示。但我发现所有这些演示都只是在10秒左右的时间里播放声音。但我想让我的演示运行5-10分钟以上。如果不是离线运行，我不会有任何问题，因为我的应用程序总是在线运行。我也看过Android上的Pocketsphinx，但效果不太好。此外，它只支持Android Studio，而不
识别音频的音调

问题内容：我有一把吉他，我需要我的电脑能够分辨出正在演奏的音符，并识别出音调。可以在python中做到吗，也可以在pygame中做到吗？能够在pygame中做到这一点将非常有帮助。问题答案：要识别音频信号的频率，可以使用FFT（快速傅立叶变换）算法。据我所知，PyGame无法记录音频，也不支持FFT转换。首先，您需要从声卡捕获原始采样数据。这种数据称为PCM（脉冲编码调制）。在Python
音频流Python上的Google流语音识别

我已经搜索了Google的所有可用文档，但我找不到Python音频流上的流式语音识别示例。目前，我正在Django中使用Python语音识别从用户那里获取音频，然后收听音频。然后，我可以保存文件并运行google语音识别，或者直接从创建的音频实例中运行。有人能指导我如何对音频流执行流式语音识别吗？
正在录制语音时，语音识别无法工作

我正在开发一个功能，当按下一个按钮时，它将启动语音识别，同时将记录用户所说的话。代码如下：我一步一步地制作了这个应用程序，起初这个应用程序没有录音功能，语音识别效果非常好。在我多次测试并认为语音识别正常后，我开始使用合并录音功能。然后，我进行了测试，一旦按下按钮\u start，甚至在我试图说话之前，就会立即出现ERROR3音频信息。我播放录音。语音也被正确记录和保存。发生什么事了？为什

语音识别，录制的音频去哪里了？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档