当前位置: 首页 > 知识库问答 >
问题:

azure - 解决Azure文本转语音服务不必要中断的方法?

连时铭
2024-03-26

我正在使用 azure 的文本转语音服务,当语音在一句话的说话之间会出现不必要的中断。

例如:“预示着(休息 2 秒)他将踏上一条(休息 1 秒)充满挑战与危险的道路”

我想让它说:“预示着他将踏上一条充满挑战与危险的道路”(就是连着一口气读完的意思)

这只是一个例子,我不确定他具体会在哪个地方停顿。

那么我怎样做才能实现这个效果呢,是需要调接口的参数问题,还是说我需要在获得声音后在做其他的操作从而解决这个问题。

有没有大佬可以给个解决问题的方法(有偿的)

我试过在文本中分别添加
<break strength="none" />还有
<mstts:ttsbreak strength="none" />这两个元素,但是都没有达到实际的效果。

共有1个答案

章宏峻
2024-03-26

Azure 文本转语音服务在生成语音时,会在某些情况下自动插入停顿,这是为了模拟人类说话的自然节奏。虽然可以通过在文本中添加 <break strength="none" /><mstts:ttsbreak strength="none" /> 标签来尝试阻止这种停顿,但并非所有情况都有效,因为服务可能仍会在其他位置插入停顿。

为了解决这个问题,你可以尝试以下方法:

  1. 调整文本结构:尽可能使文本句子流畅,减少可能导致停顿的词或短语。例如,将长句拆分成短句,或使用连词来连接句子。
  2. 使用 SSML (Speech Synthesis Markup Language):SSML 提供了一种在文本中插入更多控制元素的方式,比如调整语速、音量和音调等。你可以尝试使用 SSML 来更精确地控制停顿。
  3. 更新 Azure 文本转语音服务:确保你正在使用最新版本的 Azure 文本转语音服务,因为新版本可能包含性能改进和错误修复。
  4. 联系 Azure 支持:如果以上方法都无法解决问题,建议联系 Azure 支持以获取更专业的帮助。他们可能能提供更具体的解决方案或建议。

需要注意的是,虽然 Azure 文本转语音服务提供了许多控制选项,但完全模拟人类说话的自然节奏仍然是一个挑战。因此,可能需要根据具体情况进行多次尝试和调整,以获得最佳效果。

最后,如果你愿意为解决这个问题付费,也可以考虑寻找专业的语音合成服务或公司,他们可能提供更高级的控制选项和更好的效果。

 类似资料:
  • 在处理消息时,我不断收到。 我正在使用Microsoft. Azure. ServiceBus 3.2.0和. NET Core 2.1。 我有一个锁持续时间设置为30秒的队列,其中已经包含了许多要处理的消息。 我从https://docs.microsoft.com/en-us/azure/service-bus-messaging/service-bus-dotnet-get-started-

  • 我已将spring-boot应用程序部署到IIS/嵌入式tomcat,作为一个azure应用程序服务。当应用程序服务启动时,应用程序日志显示同一实例大约每10分钟发生一次重新启动(新的pid)。90分钟后,它将最终成功部署。我从嵌入的tomcat日志和org.springframework日志中看不到任何问题,但有时它可能在2分钟内开始。 我还可以在哪里查找启动错误,有没有办法增加应用服务启动时间

  • 我们使用Azure应用程序洞察并生成警报,还使用Webhooks。我们正在为生成的警报寻找应用程序洞察本身的日志(这不是应用程序的日志,而是关于生成的应用程序洞察警报的诊断日志),因为我们想要调试警报的webhook中发送了哪些数据以及url是什么的详细信息(应用程序洞察的详细日志)。有人知道我们在哪能找到那根木头吗?在AzureDiagnostics和Log Analytics中会有KQL吗?

  • [][1]我正在尝试用Vala语言做一个类似siri的应用程序。然而,我找不到任何语音识别或文本到语音库的vala,这是必不可少的。瓦拉有语音识别和语音文字转换吗?如果是的话,你能说出他们的名字吗? 顺便说一句,我是新的vala编程,所以也请做一些例子... 非常感谢。

  • 我想使用AWS服务和AWS java sdk将语音转换为文本,但在AWS java sdk中找不到任何API。有没有这样的服务?我使用AWS Polly服务使用AWS java sdk将文本转换为语音,但没有使用相反的方式(语音转换为文本)。如何做到这一点?

  • 我们继续看到Azure服务总线的不稳定性,并正在寻找替代方案。理想情况下,我们希望能够在Windows 2012 R2域中本地运行,并拥有许多与Azure SB相同的功能集。我们已经查看了Windows 1.1的服务总线,但是该产品已经有一段时间没有更新了,我们也不确定它的未来。我们使用C#,因此理想情况下会有一个客户端API/包装器,使与现有应用程序的集成相对容易。完全可以接受开源和自由软件。: