vosk-api

授权协议 Apache-2.0 License
开发语言 Python
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 不详
投 递 者 段干宾白
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

About

Vosk is an offline open source speech recognition toolkit. It enablesspeech recognition models for 18 languages and dialects - English, IndianEnglish, German, French, Spanish, Portuguese, Chinese, Russian, Turkish,Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino,Ukrainian.

Vosk models are small (50 Mb) but provide continuous large vocabularytranscription, zero-latency response with streaming API, reconfigurablevocabulary and speaker identification.

Speech recognition bindings implemented for various programming languageslike Python, Java, Node.JS, C#, C++ and others.

Vosk supplies speech recognition for chatbots, smart home appliances,virtual assistants. It can also create subtitles for movies,transcription for lectures and interviews.

Vosk scales from small devices like Raspberry Pi or Android smartphone tobig clusters.

Documentation

For installation instructions, examples and documentation visit VoskWebsite.

  • 1.升级pip python3 -m pip install -U pip 2.安装vosk python3 -m pip install -U vosk 3.直至成功安装,比如: Successfully installed vosk-0.3.10 测试: Running the example code with python 1.mkdir src 2.cd src 3.git clone

  • vosk开源语音识别 Vosk是开源的语音识别工具包。Vosk支持的事情包括: 支持十九种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语, 哈萨克语。 移动设备上脱机工作-Raspberry Pi,Android,iOS。 使用简单的 pip3 install vosk 安装。

  • 我们在编制应用软件的过程中,常常需要对光标和鼠标操作,本人在文中介绍了Windows系统中有关实现对鼠标和光标进行操作的API函数,并给出了在Visual C6.0++中利用所介绍的API函数实现对鼠标和光标的操作的代码。   一、隐藏和显示光标   函数: int ShowCursor ( BOOL bShow );   参数 bshow,为布尔型,bShow的值为False   时隐藏光标,为

  • #!/usr/bin/env python3 from vosk import Model, KaldiRecognizer, SetLogLevel import sys import os import wave SetLogLevel(0) if not os.path.exists("model"): print ("Please download the model fro

  • 简介 Vosk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式,支持中英文等18种语言。 安装vosk python -m pip install -U vosk 直至成功安装,比如: Successfully installed vosk-0.3.10 测试 Running the ex

  • 引入vosk "vosk": "^0.3.32" 创建js文件 import vosk from 'vosk' import fs from "fs" const { Readable } = require("stream"); const cp = require("child_process"); const wav = require("wav"); export default {

  • 概述 近几年由于AI的迅速发展,语音相关的自然语言处理NLP项目也变多了,新的技术也越来越成熟,其中TTS(语音生成)和ASR(语音识别)是NLP中非常重要的环节。 今天我们介绍一个开源的ASR项目vosk,以及vosk的简单应用方法。 Vosk是开源的语音识别工具包。Vosk支持的事情包括: 1.    支持十九种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越

 相关资料
  • 问题内容: 我有一个使用Google Maps API来显示地图的页面。当我直接加载页面时,地图出现。但是,当我尝试使用AJAX加载页面时,出现错误: 为什么是这样? 这是带有地图的页面: 这是带有AJAX调用的页面: 谢谢你的帮助。 问题答案: 默认情况下,文档完成加载后无法加载该API,您需要异步加载该API。 用地图修改页面:

  • 问题内容: 我有以下情况 我已经合并所有列表从从对象地图。 知道如何使用Java 8流API吗? 问题答案: 我想这就是您要寻找的。 例如:

  • 问题内容: 我正在尝试 通过使用opencv java api 实现以下问题的示例代码 。为了用Java 实现,我使用了这种语法。 因此,现在轮廓应为而不是。 然后我需要实现这个。在java api中,Imgproc.approxPolyDP将参数接受为。我如何将MatOfPoint转换为MatOfPoint2f? 或者有没有办法使用与c ++接口相同的向量来实现这一点。任何建议或示例代码将不胜感

  • 问题内容: 我需要访问以获得有关某个存储库的一些数据。以下命令很好用 现在,我需要调用相同的名称来操纵输出。这是我尝试过的代码, 当我调试代码时,它向我显示此错误, HttpResponseProxy {HTTP / 1.1 400错误的请求[服务器:GitHub.com,日期:2017年2月3日,星期五,格林尼治标准时间12:14:58,内容类型:application / json; char

  • 问题内容: 我正在使用的库使用回调对象发出一系列对象。 使用某些调用添加回调,并使用非阻塞方法调用启动该过程。 创建将发射这些对象的的最佳方法是什么? 如果阻止了该怎么办? 问题答案: 我认为您需要这样的东西(scala中给出的示例) 至于阻塞/非阻塞:通常,基于回调的体系结构将回调订阅与进程启动分开。在这种情况下,您可以完全独立于进程的时间创建任意数量的。另外,是否分叉的决定完全取决于您。您的体

  • 问题内容: 是否有用于标签装饰的示例? 从外观上看,类似乎提供了某种形式的上下文装饰支持,但是对于我来说,我无法使用此功能找到任何示例代码… 是否有人实际使用过装饰上下文功能,如果可以,它解决了哪些用例? PS: 我正在寻找一种将图像修饰应用于对象标签的方法,并且根据对象的显示位置,基本图标的大小会有所不同(例如,表和树项目中的传统“小”图标,以及内容标题中的大图标)。 应用于原始图标的装饰应相应