当前位置: 首页 > 知识库问答 >
问题:

谷歌语音APIiOS词汇训练集

乌璞瑜
2023-03-14

我正在做一个在iOS项目中使用谷歌语音应用编程接口的项目。该项目涉及语音输入来识别许多基本上是术语的术语。谷歌语音应用编程接口优雅地无法识别这个术语的语音输入。

在移动iOS应用程序中输入语音时,有没有办法训练google语音API学习这些行话并轻松识别它们?

共有1个答案

马梓
2023-03-14

我相信你指的是(最近更名的)谷歌云语音转文本应用编程接口。如果是这样,现在没有办法训练它。

 类似资料:
  • 我在尝试使用谷歌云语音库时出错。 这可能是关于我的依赖项。在添加Firebase身份验证依赖项之前,库是无缝工作的。所以它可能是关于endpoint-管理-控制-应用引擎-所有依赖项。 Stackdriver日志: 这是类的唯一方法: 项目的依赖关系:

  • 谷歌云平台语音命令[Listend]和[Listend-Infinite]在C#中,这两个选项是否可以立即语音识别,并存储在一个变量中,而不需要录音文件?我将制作一个程序,比较存储的语音数据,并在信息亭上表示它。我参考了https://github.com/googlecloudplatform/dotnet-docs-samples/tree/master/speech/api 我的项目的名字是

  • 我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API,这仍然是使用API的有效方式吗?我只想转录文本。 我对它们之间的区别感到困惑,如果我只想转录音频,是否有任何建议的方法。 使用Python语音识别: 不使用Python SpeechRecognition:

  • 我用Google API对自然对话的语音识别取得了很好的效果,但是对于Youtube视频或电影中的声音,识别效果很差或根本不存在。 在iPhone 4上录制西班牙语到英语的声音是可以识别的,但在电影中使用同一部手机几乎是不可能的,即使是一个角色在几乎没有背景噪音的情况下说话的场景。只有一次成功。 我试图清理声音与SoX(声音交换)使用噪声和comand efects,没有任何成功。 有什么想法吗?

  • 可以使用Google的语音识别API来获取音频文件(WAV、MP3等)的转录。)通过请求 示例:我在WAV文件中说过“一二三五”。谷歌API给了我这个: 问:有没有可能得到每个单词说出的时间(以秒为单位)? 以我的例子: 即单词一已经在时间00:00:00.23和00:00:00.80之间说了, 单词二已经在时间00:00:01.03和00:00:01.45之间说了(以秒为单位)。 PS:寻找支持

  • 我正在使用谷歌云语音到文本AP,并试图转录长音频文件。但是,无法检测到桶中的音频文件。我得到一个错误,说明:IOError:[Errno 2]没有这样的文件或目录: transcribe_gcs(gcs_uri):