当前位置: 首页 > 知识库问答 >
问题:

WhatsApp音频媒体消息(MediaUrl0)转录为文本

瞿子濯
2023-03-14

我想增强聊天机器人的“聊天”功能,并允许whatsapp用户也能够发送语音消息。

    Request Inspector
    + Expand All
    POST
    https://xxxxxxxxxxxx
    2021-04-27 08:35:39 UTC502
    Request
    URL
    ParametersShow Raw
    MediaContentType0   "audio/ogg"
    SmsMessageSid   "MMea4e6bcb3a9654a03d8d2a607c6d4cdd"
    NumMedia    "1"
    ProfileName "xxxxx"
    SmsSid  "MMea4e6bcb3a9654a03d8d2a607c6d4cdd"
    WaId    "xxxxxxxxx"
    SmsStatus   "received"
    Body    ""
    To  "whatsapp:+32460237475"
    NumSegments "1"
    MessageSid  "MMea4e6bcb3a9654a03d8d2a607c6d4cdd"
    AccountSid  "ACef27744806d8f8e68f25211b2ba8af60"
    From    "whatsapp:+32474317098"
    MediaUrl0   "https://api.twilio.com/2010-04-01/Accounts/ACef27744806d8f8e68f25211b2ba8af60/Messages/MMea4e6bcb3a9654a03d8d2a607c6d4cdd/Media/ME27fbc66d47d8de49f1ae00e433884097"
    ApiVersion  "2010-04-01"
    Message TextShow Raw
    sourceComponent "14100"
    httpResponse    "502"
    url "https://xxxxxxxxx"
    ErrorCode   "11200"
    LogLevel    "ERROR"
    Msg "Bad Gateway"
    EmailNotification   "false"

共有1个答案

薛征
2023-03-14

我认为您不需要这个用例的扩展,您可能需要生成文本的语言代码,也可能需要转录服务的AudioEncoding和样本评级。

下面是我为whatson/google coud speech编写的代码中的一些示例,这些代码可以转换为文本和DialogFlow..AWS和微软非常相似

//for ibm watson
RecognizeOptions recognizeOptions = new RecognizeOptions.Builder()
     .model(RecognizeOptions.Model.ES_ES_NARROWBANDMODEL)
     .audio(new ByteArrayInputStream(bytes))
     .contentType(HttpMediaType.AUDIO_WAV)
     .build();

// google speech to text
RecognitionConfig config = RecognitionConfig.newBuilder()
     .setSampleRateHertz(48000)
     .setLanguageCode(langcode)
     .setEncoding(RecognitionConfig.AudioEncoding.OGG_OPUS)
     .build();

// Dialogflow (sending audio directly)
 InputAudioConfig inputAudioConfig = InputAudioConfig
     .newBuilder()
     .setLanguageCode(langcode)
     .setSampleRateHertz(sampleRateHertz)
     .build();

最后,在所有情况下,您发送给服务的不是文件,而是字节数组(某种程度上)

 类似资料:
  • 我正在为WhatsApp使用Twilio沙箱,当我发送一个图像时,我在webhook中收到的有效负载工作正常,我可以获得图像的url,但不能使用音频文件(语音消息)。 我正面临一个音频问题,如果我从WhatsApp发送语音消息,我的webhook中的有效负载不包括音频URL。 这里是有效载荷: 我希望url媒体如下所示:

  • 多媒体 HTML5 前的多媒体需要借助第三方插件,例如 Flash,但是 HTML5 将网页中的多媒体带入了新的一章。 基本用法 // 音频 // 指定资源类型可以帮助浏览器更快的定位解码 <audio autobuffer autoloop loop controls> <source src="/media/audio.mp3" type="audio/mpeg"> <source s

  • 本文向大家介绍iOS多媒体音频(下)-录音及其播放的实例,包括了iOS多媒体音频(下)-录音及其播放的实例的使用技巧和注意事项,需要的朋友参考一下 上一篇中总结了iOS中音效和音频播放的最基本使用方法,其中音频的播放控制是使用AVFoundation.framework框架中的AVAudioPlayer播放器对象来实现的,而这里音频的录制则是使用了同样框架下的一个叫AVAudioRecorder的

  • 问题内容: 我只想知道在Java或C#中是否有任何库或外部库中的构建允许我获取音频文件并对其进行解析并从中提取文本。 我需要创建一个应用程序,但是我不知道从哪里开始。 问题答案: 以下是您的一些选择: 微软演讲 光明 龙自然讲 狮身人面像4

  • 函数名称:添加音频文件到媒体库 函数功能: 添加音频文件到媒体库 函数方法 media.addToLib(path) 参数 类型 必填 说明 path number 是 需要添加到媒体库的文件 函数用例 path = "/sdcard/TouchSprite/res/1.mp3" media.addToLib(path) 注意事项 目前积木编程函数和触动精灵函数不通用,请仔细查看本手册,此手册中