Google云语音API实时识别

孔寒

2023-03-14

我正在开发一个用于实时翻译的Python应用程序。我需要实时识别语音：当用户说话时，它会自动将这段音频发送到谷歌语音API并返回文本。因此，我希望在说话时立即显示已识别的文本。

我发现了流式语音识别，但似乎我仍然需要先录制完整的语音，然后将其发送到服务器。此外，没有关于如何在Python中使用它的示例

是否可以使用Google Speech API执行此操作？

共有3个答案

高晋

2023-03-14

使用Google Speech API进行实时转录有点麻烦。您可以使用此存储库获取灵感https://github.com/saharmor/realtime-transcription

它实时转录客户端的麦克风（免责声明：我是作者）。

贾飞章

2023-03-14

查看此链接：

https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py

这是从麦克风获取音频的示例。识别过程有几个组件。根据我的经验，斯芬克斯识别缺乏准确性。谷歌语音识别工作得很好。

松钊

2023-03-14

你可以用谷歌语音API来实现。

但是，它有1分钟的内容限制。

请检查下面的链接。

https://cloud.google.com/speech/quotas

因此，您必须每1分钟重新启动一次。

下面的链接是python的麦克风流示例代码。

https://cloud.google.com/speech/docs/streaming-recognize#speech-流式识别python

类似资料：

google云语音api实时流识别

我已经实现了云语音API流识别服务。我能够通过FLAC文件并获得输出，但它不能连续识别，也不能发出放着还在说话。一旦我的录音完成，那么只有我从云API得到响应。请建议我如何从谷歌语音API获得连续识别。请帮助我
AppEngine上的Google语音/语音识别API？

我目前正在从事一个Android AppEngine项目，使用语音作为主要输入方法。在android上，您可以使用语音包将语音命令转换为纯文本。语音识别不是在设备本身上完成的，而是发送到一个谷歌服务器，该服务器返回文本。供您参考：http://developer.android.com/resources/articles/speech-input.html 我的目标是使用相同的google服务
如何使用谷歌云语音API进行实时语音识别？

我正在努力寻找使用谷歌云语音API进行实时连续语音识别的例子。我的要求是使用麦克风，检测语音，并在用户说话时进行转录。我知道他们的RESTAPI没有这种支持，所以我研究了grpc示例，包括他们提供的示例。但它们似乎都是用户可以上传音频并检测语音的例子。我在Java，谷歌grpc也支持java。有人遇到一个很好的例子，展示了如何通过麦克风持续进行这种识别吗？
Python语音识别与谷歌云语音API

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。使用Python语音识别：不使用Python SpeechRecognition：
使用Google语音识别API的JAVA

问题内容：我正在尝试使用Google语音识别API。这是我编写的代码： http://pastebin.com/zJEhnJ74 有用。我从服务器得到答案：现在的问题是“状态：5”。实际上，这是状态码：我的问题是“音频文件不正确”。我不知道这是不是.flac文件错误（您可以在此处下载我的测试.flac文件：http ://www21.zippyshare.com/v/61888405/fil
python语音识别实践之百度语音API

本文向大家介绍python语音识别实践之百度语音API，包括了python语音识别实践之百度语音API的使用技巧和注意事项，需要的朋友参考一下百度语音对上传的语音要求目前必须是单声道，16K采样率，采样深度可以是16位或者8位的PCM编码。其他编码输出的语音识别不出来。语音的处理技巧：录制为MP3的语音（通常采样率为44100），要分两步才能正确处理。第一步：使用诸如GoldWave的软件，

Google云语音API实时识别

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档