问题：

谷歌云语音未返回全文

轩辕奕

2023-03-14

我正在开发google云语音api，我用我的flac文件尝试了他们的api，但他们只是转录了我的flac格式文件的一部分。我能对我的文件做些什么使它完美地工作吗。我试着在他们的链接上测试他们的api。我在请求正文中传递这个

{“audio”：{“uri”：“gs://kami1994/file-1506682082651.flac”}，“config”：{“encoding”：“flac”，“languageCode”：“en-US”，“sampleRateHertz”：44100，“maxAlternatives”：1}}

但它并没有像我所说的那样返回文本。

共有1个答案

裴劲

2023-03-14

语音识别引擎预计高度准确，但不是100%。要进一步调试您的问题，您可以在识别配置中启用单词时间偏移。

"config": { "encoding": "FLAC", "languageCode": "en-US", "sampleRateHertz": 44100, "maxAlternatives": 1, **"enable_word_time_offsets": True** }

这将帮助您检查是否检测到单词边界。

类似资料：

谷歌云语音api返回空结果

我一直在使用Chromium谷歌语音API，最近我改用谷歌云语音API。自从Google云语音API发布以来，其性能在识别准确率方面似乎有所下降。此外，我还看到越来越多的“空结果”返回音频流。我同时将音频流传输到多个不同的服务，谷歌云语音API返回空结果，而其他一些服务返回转录文本。让我想知道Chromium语音API和Google Cloud语音API的工作方式是否有任何改变？我验证了音频的
谷歌云语音NoSuchFieldError:CONTEXT_SPAN_KEY

我在尝试使用谷歌云语音库时出错。这可能是关于我的依赖项。在添加Firebase身份验证依赖项之前，库是无缝工作的。所以它可能是关于endpoint-管理-控制-应用引擎-所有依赖项。 Stackdriver日志：这是类的唯一方法：项目的依赖关系：
谷歌云语音命令

谷歌云平台语音命令[Listend]和[Listend-Infinite]在C#中，这两个选项是否可以立即语音识别，并存储在一个变量中，而不需要录音文件？我将制作一个程序，比较存储的语音数据，并在信息亭上表示它。我参考了https://github.com/googlecloudplatform/dotnet-docs-samples/tree/master/speech/api 我的项目的名字是
谷歌云语音到文本AP

我正在使用谷歌云语音到文本AP，并试图转录长音频文件。但是，无法检测到桶中的音频文件。我得到一个错误，说明：IOError：[Errno 2]没有这样的文件或目录： transcribe_gcs（gcs_uri）：
Python语音识别与谷歌云语音API

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。使用Python语音识别：不使用Python SpeechRecognition：
如何加速谷歌云语音

我使用的麦克风通过浏览器录制声音，将其转换为文件并将文件发送到java服务器。然后，我的java服务器将文件发送到云语音api并给我转录。问题是转录超长（2秒对话约为3.7秒）。所以我想加快转录速度。首先要做的是流式传输数据（如果我在记录开始时开始转录。问题是我并不真正了解api。例如，如果我想从源（浏览器/麦克风）转录我的音频流，我需要使用某种JS api，但我找不到任何可以在浏览器中使用的东

谷歌云语音未返回全文

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档