问题：

谷歌电影语音识别

淳于知

2023-03-14

我用Google API对自然对话的语音识别取得了很好的效果，但是对于Youtube视频或电影中的声音，识别效果很差或根本不存在。

在iPhone 4上录制西班牙语到英语的声音是可以识别的，但在电影中使用同一部手机几乎是不可能的，即使是一个角色在几乎没有背景噪音的情况下说话的场景。只有一次成功。

我试图清理声音与SoX（声音交换）使用噪声和comand efects，没有任何成功。

有什么想法吗？或者仅仅是谷歌API无法识别的声音，让你改变更多？它将与其他语音识别软件取得更好的成功？

共有1个答案

邵伟泽

2023-03-14

谷歌语音识别器（和大多数其他识别器）与混响效果不兼容。在大多数视频场景中，人与麦克风之间的距离超过1-3米。试着把你的手机放在桌子上，从3米远的地方认出smth。这将不会导致任何问题，但音质将非常好。

类似资料：

Python语音识别与谷歌云语音API

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。使用Python语音识别：不使用Python SpeechRecognition：
Android离线谷歌语音识别

我正在开发一个android应用程序，它将监听语音命令并相应地触发动作。以下是一些疑问： > 谷歌语音识别离线库是否可用于android应用程序我们能创建自己的词汇词典吗应用程序应在脱机模式下工作（无Internet）。
谷歌语音识别媒体记录器

如果可能的话，我需要一些意见或建议。我有一个使用语音识别api和媒体记录器的应用程序。该应用程序的要点是当用户说“注意”时，它会记录语音消息，直到用户说“完成”。之后，应用程序将语音消息保存到手机中。我目前有一个带有按钮（记录、保存、停止、完成）的弹出框，用户可以手动按下按钮来记录他们的语音信息。我正在考虑完全改造用户拥有完全语音控制的应用程序。所以基本上，它越免提越好。我从这里开始研究连续语
谷歌语音识别API返回空结果

我正在尝试从shell命令使用Google的语音识别API，但我遇到了问题。我的Shell文件包含以下代码：记录-D plughw： 1,0-q-f cd-t wav-R 16000|flac-f--Best--samplughw=16000-s-otest.flac wget-q-U“Mozilla/5.0”--文件后测试。flac--标题“内容类型：音频/x-flac；速率=16000”-
谷歌云语音NoSuchFieldError:CONTEXT_SPAN_KEY

我在尝试使用谷歌云语音库时出错。这可能是关于我的依赖项。在添加Firebase身份验证依赖项之前，库是无缝工作的。所以它可能是关于endpoint-管理-控制-应用引擎-所有依赖项。 Stackdriver日志：这是类的唯一方法：项目的依赖关系：
使用谷歌语音识别时忽略背景音乐

我正在尝试制作一款可以通过语音识别停止的闹钟Android应用程序。为此，我正在使用Google语音识别API（这段代码可以连续进行语音识别）。它工作得很好，直到我同时演奏音乐。在这种情况下，语音识别的效率会大大降低。这个问题是合乎逻辑的，因为音乐会增加一些噪音，使识别变得更加困难。但是由于播放的音乐是已知的，我想知道是否有可能告诉谷歌尝试忽略这些额外的噪音。我知道信号处理中存在一些滤波器来做

谷歌电影语音识别

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档