问题：

用于连续语音识别的HTML5语音输入API

曹旭东

2023-03-14

我知道“x-webkit-speech”能够进行某种语音识别，实际上识别效果很好。

我发现“x-webkit-语音”有利于开发Q

然而，我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如，如果我在网上听到一个讲座，我想实时转录教授正在谈论的内容。

是否可以使用“x-webkit-speech”？我的感觉是，“x-webkit-speech”在检测到一段很短的静默期时会自动停止，这很烦人。我知道它实际上将音频转换成flac并发送回google服务器。是否可以发回更长的音频？我需要在网络上进行连续语音识别。

共有1个答案

丌官哲彦

2023-03-14

Chrome刚刚在版本25中发布了这个。请参见：http://updates.html5rocks.com/2013/01/Voice-Driven-Web-Apps-Introduction-to-the-Web-Speech-API

类似资料：

启用识别连续语音

如何使用REST API（带javascript SDK）Bing语音API实现连续语音识别？使用do Javascript SDK示例：https://github.com/Microsoft/Cognitive-Speech-STT-JavaScript只能用麦克风转录短句
基于phonegap的连续语音识别

我想在phonegap中创建应用程序，在Android和IOS中使用连续语音识别。我的应用程序应该等待用户的声音，当他/她说“下一步”时，应用程序应该更新屏幕并执行一些操作。我发现这个插件：https://github.com/macdonst/SpeechRecognitionPlugin而且它工作得非常快。但在语音识别启动几秒钟后，语音识别器停止工作，但并没有语音。是否有任何方法或标志，如i
连续语音识别Android-无间隙

我有一个实现识别侦听器（RecognitionListener）的活动。要使其连续，每次我再次启动侦听器时：但是，它需要一些时间（大约半秒钟）才能开始，所以有半秒钟的间隙，没有人在听。因此，我怀念那段时差中所说的话。另一方面，当我使用谷歌的语音输入时，代替键盘来口述消息——这个时间间隔不存在。意思是——有一个解决方案。这是什么？谢谢
使用Microsoft认知语音Websocket进行连续语音识别-Xamarin

我正在尝试使用适用于Xamarin Android的Microsoft认知语音从麦克风构建连续语音识别。我认为没有Xamarin的库，所以我稍微修改了“Xamarin。认知。BingSpeech”库（endpoint等）以使其正常工作。我有一些问题我想通过以下教程连接到microsoft web套接字https://docs.microsoft.com/en-us/azure/cognitive
语音相关语音识别

我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我已经研究过Pocketsphinx，但由于我仍然不熟悉它，我想也许更有经验的人可能会知道。是否有可能使用Pocketsphinx来实现这样的语音识别。它应该记录音频，提取其特征，然后将其与所说的任何内容进行匹配，而不是使用声学和语言模型。是否有可能使用Pocketsphinx实现此流程？如果没有，有人能为这样的解决方案指出正确的方向吗？谢
语音识别

由于连接到不同的API，我目前正在开发一个工具，允许我阅读所有的通知。它工作得很好，但现在我想用一些声音命令来做一些动作。就像当软件说“一封来自Bob的邮件”时，我想说“阅读”或“存档”。我的软件是通过一个节点服务器运行的，目前我没有任何浏览器实现，但它可以是一个计划。在NodeJS中，启用语音到文本的最佳方式是什么？我在它上面看到了很多线程，但主要是使用浏览器，如果可能的话，我希望在一

用于连续语音识别的HTML5语音输入API

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档