问题：

如何使用谷歌云语音API进行实时语音识别？

夹谷琨

2023-03-14

我正在努力寻找使用谷歌云语音API进行实时连续语音识别的例子。我的要求是使用麦克风，检测语音，并在用户说话时进行转录。

我知道他们的RESTAPI没有这种支持，所以我研究了grpc示例，包括他们提供的示例。但它们似乎都是用户可以上传音频并检测语音的例子。

我在Java，谷歌grpc也支持java。有人遇到一个很好的例子，展示了如何通过麦克风持续进行这种识别吗？

共有1个答案

葛嘉悦

2023-03-14

在“在音频流上执行流式语音识别”子章节的“执行流式语音识别”文档页上，有一个对从麦克风接收的音频流执行流式语音识别的示例。C选项卡应该提供一个与Java最相似的代码示例。

类似资料：

如何进行实时语音识别|谷歌云语音到文本

我正在尝试从扬声器转录音频我正在将声音从扬声器传送到节点。js文件(https://askubuntu.com/a/850174) 这是我的抄本。js公司但谷歌云语音到文本在1分钟内对流媒体识别有一个限制。所以我有一个错误“超过了允许的最大流持续时间65秒” 如何将流拆分为以静默为拆分器的块，或拆分为持续30秒的块？
Python语音识别与谷歌云语音API

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。使用Python语音识别：不使用Python SpeechRecognition：
谷歌云语音NoSuchFieldError:CONTEXT_SPAN_KEY

我在尝试使用谷歌云语音库时出错。这可能是关于我的依赖项。在添加Firebase身份验证依赖项之前，库是无缝工作的。所以它可能是关于endpoint-管理-控制-应用引擎-所有依赖项。 Stackdriver日志：这是类的唯一方法：项目的依赖关系：
Google云语音API实时识别

我正在开发一个用于实时翻译的Python应用程序。我需要实时识别语音：当用户说话时，它会自动将这段音频发送到谷歌语音API并返回文本。因此，我希望在说话时立即显示已识别的文本。我发现了流式语音识别，但似乎我仍然需要先录制完整的语音，然后将其发送到服务器。此外，没有关于如何在Python中使用它的示例是否可以使用Google Speech API执行此操作？
如何加速谷歌云语音

我使用的麦克风通过浏览器录制声音，将其转换为文件并将文件发送到java服务器。然后，我的java服务器将文件发送到云语音api并给我转录。问题是转录超长（2秒对话约为3.7秒）。所以我想加快转录速度。首先要做的是流式传输数据（如果我在记录开始时开始转录。问题是我并不真正了解api。例如，如果我想从源（浏览器/麦克风）转录我的音频流，我需要使用某种JS api，但我找不到任何可以在浏览器中使用的东
谷歌云语音命令

谷歌云平台语音命令[Listend]和[Listend-Infinite]在C#中，这两个选项是否可以立即语音识别，并存储在一个变量中，而不需要录音文件？我将制作一个程序，比较存储的语音数据，并在信息亭上表示它。我参考了https://github.com/googlecloudplatform/dotnet-docs-samples/tree/master/speech/api 我的项目的名字是

如何使用谷歌云语音API进行实时语音识别？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档