我正在使用SpeechRecognitor API在Google Glass上制作一个可以接收语音的应用程序。我遇到的问题是,如果语音检测器没有听到任何声音,它会很快停止收听并结束识别过程。
我发现可以添加以下额外内容:Extra\u SPEECH\u INPUT\u COMPLETE\u SILENCE\u LENGTH\u MILLIS Extra\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u MILLIS
这可能会延迟它停止监听的时间。我将此实现到我的代码中,接近提出此问题的用户的做法(在onClick()方法中设置为5000毫秒):关于语音识别的Android附加功能不起作用
添加额外功能并没有改变程序的运行方式,因此仍然没有延迟。
答案是,它当时停止了对果冻豆的使用。使用KitKat的谷歌眼镜也是这样吗?如果是的话,还有其他方法来解决这个问题吗?
任何帮助都将不胜感激!
如果您有一个定义的命令列表,您可能需要考虑使用上下文语音菜单,如本文所述。
使用SpeechRecognitor,您可以在启动活动时添加以下附加内容:EXTRA\u PROMPT、EXTRA\u RESULTS\u PENDINGINTENT、EXTRA\u RESULTS\u PENDINGINTENT\u BUNDLE
有关更多信息,请参阅此页面。
我目前正忙于语音识别,我希望语音识别器能永远不间断地听我说话。该应用程序的目的是,它将等待特定关键字的语音:当用户说出该关键字时,服务将准备好接收用户语音命令。经过研究,我发现我们可以手动计算识别器收听的时间。通过这些常量: 顺便说一下,默认识别器服务侦听大约10秒。(谷歌api) http://java.llp2.dcc.ufmg.br/apiminer/docs/reference/andro
我用Google API对自然对话的语音识别取得了很好的效果,但是对于Youtube视频或电影中的声音,识别效果很差或根本不存在。 在iPhone 4上录制西班牙语到英语的声音是可以识别的,但在电影中使用同一部手机几乎是不可能的,即使是一个角色在几乎没有背景噪音的情况下说话的场景。只有一次成功。 我试图清理声音与SoX(声音交换)使用噪声和comand efects,没有任何成功。 有什么想法吗?
小能sdk有语音识别功能,即可以将语音转为文字发送出去,SDK的语音识别功能使用的是科大讯飞的包,因此针对具体情况提供以下方案,请根据自己的需求选择方案: 一、不需要该功能,SDK集成不需要做任何的操作,可以在PC端客服端设置下该功能的开关:设置—>访客客服设置—>访客聊窗—>SDK—>访客端功能进行开关控制,如果您不需要该功能可以不勾选该选项。 二、需要该功能,又分为以下具体情况: (1)如果您
小能sdk有语音识别功能,即可以将语音转为文字发送出去;该功能的开关可以在客服端的设置—>访客客服设置—>访客聊窗—>SDK—>访客端功能进行开关控制,如果您不需要该功能可以勾掉该选项。 具体界面如下: 语音识别功能使用的是科大讯飞的包。 如果您的APP也使用了科大讯飞的语音识别功能,则请使用下面的接口传入您的appid,同时将NtalkerChatUI/libs目录下的与科大讯飞相关的jar和s
我正在开发一个android应用程序,它将监听语音命令并相应地触发动作。 以下是一些疑问: > 谷歌语音识别离线库是否可用于android应用程序 我们能创建自己的词汇词典吗 应用程序应在脱机模式下工作(无Internet)。
我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API,这仍然是使用API的有效方式吗?我只想转录文本。 我对它们之间的区别感到困惑,如果我只想转录音频,是否有任何建议的方法。 使用Python语音识别: 不使用Python SpeechRecognition: