问题：

Python语音识别与谷歌云语音API

艾谦

2023-03-14

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。

我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。

使用Python语音识别：

import speech_recognition as sr
r = sr.Recognizer()
r.recognize_google_cloud()
harvard = sr.AudioFile('harvard.wav')
with harvard as source:
   audio = r.record(source)
r.recognize_google(audio)

不使用Python SpeechRecognition：

from google.cloud import speech_v1 as speech


def speech_to_text(config, audio):
    client = speech.SpeechClient()
    response = client.recognize(config, audio)
    print_sentences(response)


def print_sentences(response):
    for result in response.results:
        best_alternative = result.alternatives[0]
        transcript = best_alternative.transcript
        confidence = best_alternative.confidence
        print('-' * 80)
        print(f'Transcript: {transcript}')
        print(f'Confidence: {confidence:.0%}')


config = {'language_code': 'en-US'}
audio = {'uri': 'gs://cloud-samples-data/speech/brooklyn_bridge.flac'}

共有2个答案

金阳曜

2023-03-14

Google Cloud Client库是以编程方式访问Cloud API的推荐选项：

提供每种语言的惯用、生成或手写代码，使Cloud API使用简单直观。
处理与服务器通信的所有低级细节，包括与Google进行身份验证。
可以使用熟悉的包管理工具（例如npm和pip）进行安装。
在某些情况下，通过使用gRPC为您提供性能优势。您可以在下面的gRPC API部分中找到更多信息。

此外，要了解从API中获得更好结果的最佳实践。

司徒宏远

2023-03-14

如果你只计划使用谷歌云平台进行语音识别，那么SpeechClient会更好，因为它是由谷歌维护的。

如果您想尝试不同的语音识别服务，speech\u recognition会有所帮助，因为它更通用。

任何调用api的方式都可以。库只是为了让您更轻松。

类似资料：

谷歌电影语音识别

我用Google API对自然对话的语音识别取得了很好的效果，但是对于Youtube视频或电影中的声音，识别效果很差或根本不存在。在iPhone 4上录制西班牙语到英语的声音是可以识别的，但在电影中使用同一部手机几乎是不可能的，即使是一个角色在几乎没有背景噪音的情况下说话的场景。只有一次成功。我试图清理声音与SoX（声音交换）使用噪声和comand efects，没有任何成功。有什么想法吗？
谷歌云语音NoSuchFieldError:CONTEXT_SPAN_KEY

我在尝试使用谷歌云语音库时出错。这可能是关于我的依赖项。在添加Firebase身份验证依赖项之前，库是无缝工作的。所以它可能是关于endpoint-管理-控制-应用引擎-所有依赖项。 Stackdriver日志：这是类的唯一方法：项目的依赖关系：
如何使用谷歌云语音API进行实时语音识别？

我正在努力寻找使用谷歌云语音API进行实时连续语音识别的例子。我的要求是使用麦克风，检测语音，并在用户说话时进行转录。我知道他们的RESTAPI没有这种支持，所以我研究了grpc示例，包括他们提供的示例。但它们似乎都是用户可以上传音频并检测语音的例子。我在Java，谷歌grpc也支持java。有人遇到一个很好的例子，展示了如何通过麦克风持续进行这种识别吗？
Android离线谷歌语音识别

我正在开发一个android应用程序，它将监听语音命令并相应地触发动作。以下是一些疑问： > 谷歌语音识别离线库是否可用于android应用程序我们能创建自己的词汇词典吗应用程序应在脱机模式下工作（无Internet）。
如何进行实时语音识别|谷歌云语音到文本

我正在尝试从扬声器转录音频我正在将声音从扬声器传送到节点。js文件(https://askubuntu.com/a/850174) 这是我的抄本。js公司但谷歌云语音到文本在1分钟内对流媒体识别有一个限制。所以我有一个错误“超过了允许的最大流持续时间65秒” 如何将流拆分为以静默为拆分器的块，或拆分为持续30秒的块？
谷歌云语音命令

谷歌云平台语音命令[Listend]和[Listend-Infinite]在C#中，这两个选项是否可以立即语音识别，并存储在一个变量中，而不需要录音文件？我将制作一个程序，比较存储的语音数据，并在信息亭上表示它。我参考了https://github.com/googlecloudplatform/dotnet-docs-samples/tree/master/speech/api 我的项目的名字是

Python语音识别与谷歌云语音API

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档