使用WebRTC、Node.js和语音识别引擎的实时语音识别

魏波娃

2023-03-14

A.我正在努力实现的目标。

允许在网络浏览器内进行实时语音识别的网络应用程序（像这样）。

B.我目前正在考虑使用的技术来实现A。

JavaScript
节点。js
WebRTC
微软语音API或Pocketsphinx。js或其他东西（不能使用Web语音API）

C.非常基本的工作流程

Web浏览器建立到节点服务器的连接（服务器充当信令服务器，还提供静态文件）

D.问题

将节点。js是否适合实现C

共有2个答案

夏侯朝斑

2023-03-14

你应该联系安德烈·纳塔尔，他在去年秋天的火狐峰会上展示了类似的演示，现在正在谷歌代码夏季项目中实现火狐/FxOS离线语音识别：http://cmusphinx.sourceforge.net/2014/04/speech-projects-on-gsoc-2014/

潘修文

2023-03-14

Node.js适合实现C吗？

是的，尽管没有硬性要求。例如，有些人使用gstreamer运行服务器

http://kaljurand.github.io/dictate.js/

节点也应该很好。

如何将接收到的音频流从节点服务器传递到与服务器分开运行的语音识别引擎？

节点到节点的通信有很多种方式。其中之一是http://socket.io.也有普通插座。特定的框架取决于您对容错性和可伸缩性的需求。

我的语音识别引擎可以作为另一个节点应用程序运行吗（如果我使用Pocketsphinx）？所以我的节点服务器与我的节点语音识别服务器通信。

当然可以。您可以创建一个节点模块来扭曲pocketsphinx API。

更新：选中此项，它应该与您需要的内容类似：

http://github.com/cmusphinx/node-pocketsphinx

类似资料：

语音识别和录音

我在设计一个可以同时录制语音和将语音转换为文本的应用程序时遇到了这个bug。我使用Google API进行语音识别部分，并使用audioRecorder对象进行录音。它没有成功，因此我转而使用onBufferReceived（）来检索过程中的字节（当用户说话时）。Google API代码现在是我代码的onResults（）部分，它可以在没有UI的情况下进行语音识别。这是代码
语音识别

由于连接到不同的API，我目前正在开发一个工具，允许我阅读所有的通知。它工作得很好，但现在我想用一些声音命令来做一些动作。就像当软件说“一封来自Bob的邮件”时，我想说“阅读”或“存档”。我的软件是通过一个节点服务器运行的，目前我没有任何浏览器实现，但它可以是一个计划。在NodeJS中，启用语音到文本的最佳方式是什么？我在它上面看到了很多线程，但主要是使用浏览器，如果可能的话，我希望在一
语音识别

语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科，它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术，语音技术的应用已经成为一个具有竞争性的新兴高技术产
语音识别

识别简单的语句。
语音识别

光环板内置的麦克风和Wi-Fi功能相结合，可以实现语音识别相关的应用。通过接入互联网，可以使用各大主流科技公司提供的语音识别服务，像是微软语音识别服务。使用联网功能需要登陆慧编程账号。注册/登陆慧编程点击工具栏右侧的登陆/注册按钮，依据提示登陆/注册账号。启用上传模式点击启用上传模式。新建语音识别项目我们将新建一个语音识别项目，使用语音来点亮光环板的LED灯。连接网络 1. 添加事件
语音识别

1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. HTTP API 接入参考Demo 1.1.5. 协议概述 1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述本文档目的是描述Rokid云ASR(语音识别)Http接口协议，面向想要了解ASR细节，并具有一定开发能力的开发者或用户。 1.1.2. 服务

使用WebRTC、Node.js和语音识别引擎的实时语音识别

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档