Live Transcribe Speech Engine

实时语音转录引擎
授权协议 Apache-2.0
开发语言 Java
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 不详
投 递 者 葛俊
操作系统 跨平台
开源组织 Google
适用人群 未知
 软件概览

Live Transcribe 是一款 Android 应用程序,可为失聪或有听力障碍的人提供实时字幕。此存储库包含用于与 Live Transcribe 中使用的 Google Cloud Speech API 进行通信的 Android 客户端库。

自动语音识别(ASR)模块具有以下功能:

  • 无限流媒体
  • 支持 70 多种语言
  • 文字不会丢失,只会延迟
  • 即使网络已经停电数小时,也会重新连接。当然,没有连接就不能进行语音识别。
  • 可以轻松启用和配置 Opus、AMR-WB、FLAC 编码
  • 包含文本格式库,用于可视化 ASR 置信度、发言人 ID 等
  • 可离线模型扩展
  • 内置支持语音检测器,可在延长静音期间用于停止 ASR 以节省资金和数据(请注意,未提供语音检测器实现)
  • 内置支持扬声器识别,可根据扬声器编号标记或着色文本(请注意,未提供扬声器识别实现)

提供的库几乎与生产应用程序 Live Transcribe 中运行的库相同。它们经过了广泛的现场测试和单元测试。但是,测试本身目前尚未开源。

 相关资料
  • 我想用nodejs和googlespeech-to-text api制作一个实时转录应用程序。 我正在使用RecordRTC和socket。io将音频块获取到后端服务器。目前,我正在录制1秒长的块,并且转录工作正常,但它没有将其视为流,而是在处理每个块后发送响应。这意味着我要收回半句话,谷歌无法利用上下文帮助自己识别演讲。 我的问题是,如何让谷歌将我的块视为一个连续的流。或者是否有其他解决方案可以

  • A.我正在努力实现的目标。 允许在网络浏览器内进行实时语音识别的网络应用程序(像这样)。 B.我目前正在考虑使用的技术来实现A。 JavaScript 节点。js WebRTC 微软语音API或Pocketsphinx。js或其他东西(不能使用Web语音API) C.非常基本的工作流程 Web浏览器建立到节点服务器的连接(服务器充当信令服务器,还提供静态文件) D.问题 将节点。js是否适合实现C

  • 更新时间:2018-09-17 11:39:47 功能说明 录音语音模块驱动程序。该模块是 10s 录音的语音模块,能进行高质量语音还原。 硬件资源 1.ESP32 开发板 2.ISD1820 模块 3.接线 isd1820 模块 REC 引脚接 ESP32 19 引脚 isd1820 模块 P-E 引脚接 ESP32 18 引脚 isd1820 模块 VCC 引脚接 ESP32 VCC 引脚 i

  • 为了方便的确认麦克风和ref的问题,或者配合算法来调试,需要抓取声音 8008 可以配置为标准的 usb 声卡,在 linux 上识别为一个 uac 设备, linux 可以通过 usb 声卡进行声音的采集和声音的播放,录制的格式是单声道, 16K , 16bit 8008 编译的固件需要支持 usb 声卡模式

  • 我在设计一个可以同时录制语音和将语音转换为文本的应用程序时遇到了这个bug。我使用Google API进行语音识别部分,并使用audioRecorder对象进行录音。它没有成功,因此我转而使用onBufferReceived()来检索过程中的字节(当用户说话时)。Google API代码现在是我代码的onResults()部分,它可以在没有UI的情况下进行语音识别。 这是代码

  • 我正在开发一个功能,当按下一个按钮时,它将启动语音识别,同时将记录用户所说的话。代码如下: 我一步一步地制作了这个应用程序,起初这个应用程序没有录音功能,语音识别效果非常好。 在我多次测试并认为语音识别正常后,我开始使用合并录音功能。 然后,我进行了测试,一旦按下按钮\u start,甚至在我试图说话之前,就会立即出现ERROR3音频信息。 我播放录音。语音也被正确记录和保存。 发生什么事了?为什

  • 本文向大家介绍android语音即时通讯之录音、播放功能实现代码,包括了android语音即时通讯之录音、播放功能实现代码的使用技巧和注意事项,需要的朋友参考一下 在android中,实现录音与语音播放的功能算是比较简单的,但是作为参考,还是很有必要将语音相关的知识做一个简要的记录。 首先,在android中,支持录音支持两种方式。主要包括:字节流模式和文件流模式。用文件流模式进行录音操作比较简单

  • Convert text to speech using the Wifi Block