语音交互

优质
小牛编辑
129浏览
2023-12-01

YodaOS Event

Event rokid.turen.start_voice

表示语音请求开始,参数描述如下:

参数名称类型描述
triggerint唤醒词
triggerStartint唤醒词在语音流的开始偏移量
triggerLengthint唤醒词语音流长度(按采样点计算)
soundIntensityfloat音强
enableCloudVerificationint是否开启云端激活词确认
extrastring拓展字段

Event rokid.turen.voice

表示收到声学模块的语音数据,参数如下:

参数名称类型描述
voicebinary音频数据
idint音频请求ID

YodaOS Method

yodaos.voice-interface.tts.speak(dataChannel, utterance)

  • 调用该接口可以发起语音合成请求
  • 实现该接口可实现连接自定义的语音合成服务

参数如下:

参数名称类型描述
dataChannelstring合成后的语音数据将通过此 channel 广播发送
utterancestring需要合成语音的文本,如:“你好”

返回数字,具体含义如下:

返回值代表含义
0成功,仅表示 Voice Interface Driver 成功接收请求
1参数错误
2Voice Interface Driver 请求队列过长

调用者通过 dataChannel 会传递一个广播名给 Voice Interface Driver, 后者收到后会在获取到语音数据后,通过这个名称广播出来,具体消息格式如下:

参数名称类型描述
stateint0表示语音数据,1表示语音结束,-1表示云端请求超时,-2表示其他错误
databinary语音数据(可选)

yodaos.voice-interface.nlp(asr)

  • 调用该接口可以发起 NLP 请求
  • 实现该接口可实现连接自定义的 NLP 服务

参数如下:

参数名称类型描述
asrstring输入的语音

返回数字,具体含义如下:

返回值代表含义
0成功,仅表示 Voice Interface Driver 成功接收请求