1.1.1. TTS 1.1.1. TTS 我们的语音合成接口使用 C/S 架构,服务端默认启动,开发者需要通过调用客户端接口与服务端通讯,TTS服务架构图如下: 客户端头文件目录位于: #include <tts/tts_client.h> 除了要 include 头文件外,还需要链接 -lrktts。 API int tts_init(); // tts初始化接口 int tts_spe
1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议概述 1.1. TTS(语音合成) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)HTTP接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务地址 环境 地址 用途 线上 https://ma
1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. HTTP API 接入参考Demo 1.1.5. 协议概述 1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)Http接口协议,面向想要了解ASR细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务
1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1. TTS(语音合成) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云TTS(语音合成)WebSocket接口协议,面向想要了解TTS细节,并具有一定开发能力的开发者或用户。 1.1.2.
1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1.6. ASR 云端一些细节 1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)WebSocket接口协议,面向想要了解ASR细节,并具有一定开发
1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 1.1.3. 编解码 1.1.4. 认证方式 1.1.5. Curl示例 1.1.6. 设备认证 1.2. 语音合成API 1.2.1. 请求URL 1.2.2. proto 文件 1.2.3. 请求和回复数据 1.1.1. 开放平台接口定义文档(http版) - 语音合成 1.1.2. 简介 Rokid语音合成服
1.1.1. 开放平台接口定义文档(http版) - 语音识别 1.1.2. 前言 1.1.3. 文档版本 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.7. 示例 1.1.1. 开放平台接口定义文档(http版) - 语音识别 Table of Contents 前言 文档版本 服务地址 协议地址 协议概述 认证 说明 语音识别 请求 响应 示例 1.1.2.
1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 1.1.3. 协议详解 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.1. 语音合成 WebSocket 接口定义文档 1.1.2. 概述 本文档目的是描述云端语音接口的 WebSocket 版本的开放协议,面向想要了解语音合成(TTS)细节,并具有一定开发能力的开发者或用户。 1.1.
1.1.1. 语音识别 WebSocket 接口定义文档 1.1.2. 概述 1.1.3. 协议详解 1.1.4. 服务地址 1.1.5. 协议地址 1.1.6. 协议概述 1.1.7. 典型场景 1.1.8. speech异常 1.1.9. speech 特殊逻辑 1.1.1. 语音识别 WebSocket 接口定义文档 1.1.2. 概述 本文档目的是描述云端语音接口的 WebSocket 版
YodaOS Event Event rokid.turen.start_voice 表示语音请求开始,参数描述如下: 参数名称 类型 描述 trigger int 唤醒词 triggerStart int 唤醒词在语音流的开始偏移量 triggerLength int 唤醒词语音流长度(按采样点计算) soundIntensity float 音强 enableCloudVerification
语音焦点概述 语音交互不同于图形交互,相比于 GUI,VUI 在使用中用户更难以同时处理多个交互并行的场景,所以为了更好的用户体验,我们需要协调多个应用的语音交互请求,给用户一个专注的语音交互使用体验。 AudioFocus 如果把我们的设备当作一个机场,应用们代表了待机的飞机,YodaOS 系统相当于控制塔。我们的应用可以申请期望优先级的语音焦点,但最终的授权决定会由系统发出。我们通过 Audi
酷狗音乐 Skill 授权 概述 本文档适用于第三方厂商使用酷狗音乐技能。用户登录酷狗音乐账号并获取token,使用酷狗音乐账号token将酷狗音乐账号与Rokid账号进行绑定。 酷狗音乐SDK及文档 文档地址:https://github.com/Rokid/RokidMobileSDKiOSDemo/tree/master/Third/KuGou 酷狗音乐接入流程 RokidSDK接口调用 获
概述 本文档适用于第三方厂商使用酷狗音乐技能。用户登录酷狗音乐账号并获取token,使用酷狗音乐账号token将酷狗音乐账号与Rokid账号进行绑定。 酷狗音乐SDK及文档 请联系商务获取 说明 时序图: 上报酷狗音乐授权信息 上传酷狗登录成功后的用户相关信息 入参: 字段 类型 是否必须 说明 deviceId String 是 设备Id号 deviceTypeId String 是 设备类型I
获取设备音量 API 说明 先通过 SDK API 请求获取设备音量,再监听 SDKVolumeChange 来接收设备音量。 参数说明 字段 类型 必须? 说明 deviceId String 是 设备ID 举个大栗子: Kotlin val deviceId = "XXX" RokidMobileSDK.device.getVolume(deviceId) @Subscribe fun on
为了方便的确认麦克风和ref的问题,或者配合算法来调试,需要抓取声音 8008 可以配置为标准的 usb 声卡,在 linux 上识别为一个 uac 设备, linux 可以通过 usb 声卡进行声音的采集和声音的播放,录制的格式是单声道, 16K , 16bit 8008 编译的固件需要支持 usb 声卡模式