Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。
特性:
100% 纯 JavaScript API,
可通过 Web Workers 录制
支持 PocketSphinx 所支持的所有声音模型
支持大多数 PocketSphinx 的命令行参数
支持 JavaScript 有限状态语法 FSG 输入
支持在编译时的来自文件的统计语言模型
支持键盘监测
可用于实时识别的可选音频录制库
示例代码:
var array = ... // array that contains an audio buffer var buffer = new Module.AudioBuffer(); for (var i = 0 ; i < array.length ; i++) buffer.push_back(array[i]); // Feed the array with audio data var output = recognizer.start(); // Starts recognition on current language model output = recognizer.process(buffer); // Processes the buffer var hyp = recognizer.getHyp(); // Gets the current recognized string (hypothesis) /* ... */ for (var i = 0 ; i < array.length ; i++) buffer.set(i, array[i]); // Feed buffer with new data output = recognizer.process(buffer); hyp = recognizer.getHyp(); /* ... */ output = recognizer.stop(); // Gets the final recognized string: var final_hyp = recognizer.getHyp(); buffer.delete();
在线演示:http://syl22-00.github.io/pocketsphinx.js/live-demo-chinese.html
PocketSphinx语音识别系统的编译、安装和使用 zouxy09@qq.com http://blog.csdn.net/zouxy09 Sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。Sphinx从开发之初就得到了CMU、DARPA等多个部门的资助和支持,后来逐步发展为开源项目。目前CMU Sphinx小组开发的下列译码器:
I have some questions on installing Pocketsphinx on and Android phone, and I haven't been able to find answers on CMUSphinx's support forum, IRC, existing StackOverflow posts, or intensive Googling. I
我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我已经研究过Pocketsphinx,但由于我仍然不熟悉它,我想也许更有经验的人可能会知道。是否有可能使用Pocketsphinx来实现这样的语音识别。它应该记录音频,提取其特征,然后将其与所说的任何内容进行匹配,而不是使用声学和语言模型。是否有可能使用Pocketsphinx实现此流程?如果没有,有人能为这样的解决方案指出正确的方向吗?谢
由于连接到不同的API,我目前正在开发一个工具,允许我阅读所有的通知。 它工作得很好,但现在我想用一些声音命令来做一些动作。 就像当软件说“一封来自Bob的邮件”时,我想说“阅读”或“存档”。 我的软件是通过一个节点服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。 在NodeJS中,启用语音到文本的最佳方式是什么? 我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我希望在一
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产
识别简单的语句。
光环板内置的麦克风和Wi-Fi功能相结合,可以实现语音识别相关的应用。通过接入互联网,可以使用各大主流科技公司提供的语音识别服务,像是微软语音识别服务。使用联网功能需要登陆慧编程账号。 注册/登陆慧编程 点击工具栏右侧的登陆/注册按钮,依据提示登陆/注册账号。 启用上传模式 点击启用上传模式。 新建语音识别项目 我们将新建一个语音识别项目,使用语音来点亮光环板的LED灯。 连接网络 1. 添加事件
1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. HTTP API 接入参考Demo 1.1.5. 协议概述 1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)Http接口协议,面向想要了解ASR细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务
1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1.6. ASR 云端一些细节 1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)WebSocket接口协议,面向想要了解ASR细节,并具有一定开发
1.1.1. 开放平台接口定义文档(http版) - 语音识别 1.1.2. 前言 1.1.3. 文档版本 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.7. 示例 1.1.1. 开放平台接口定义文档(http版) - 语音识别 Table of Contents 前言 文档版本 服务地址 协议地址 协议概述 认证 说明 语音识别 请求 响应 示例 1.1.2.