当前位置: 首页 > 知识库问答 >
问题:

语音到文本大型音频文件[Microsoft语音API]

钱华晖
2023-03-14

使用Microsoft语音API转录中/大型音频文件(每个文件约6-10分钟)的最佳方式是什么?比如批量音频文件转录?

我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码,用于连续转录语音,但它在某个时候停止转录。转录有任何限制吗?我只使用免费试用帐户atm。

顺便说一句,我假设Bing语音API和新的语音服务API没有区别,对吗?

感谢大家!

共有2个答案

梁丘高朗
2023-03-14

语音服务允许每月5000笔交易,在免费试用期间每分钟20笔,因此可能在某个时候,由于实时连续识别,您会超过每分钟20笔的限制。

华星文
2023-03-14

感谢您的反馈。

我同意样品(以及您正在查看的留档)不是很清楚,我们将很快更新。

该示例使用RecognizeAsync,它应该是call RecognizeOnceAsync。它当前正在尝试从服务返回第一个最终结果。您应该使用Start/StopRecognitizeAsync和register来接收结果事件。

再次为这里的错误文档感到抱歉,我们将很快更新此文档,并且可能会在刷新时重命名API。

如果您有音频文件,还可以使用批转录功能。也许这有帮助?https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

沃尔夫冈干杯

 类似资料:
  • 带有en-us语音的AVSpeechsynthesizer是“A”的发音,是“大写字母A”,但只想要“A”,怎么能做到呢?

  • 有没有任何开源项目或库(在java或c),我可以用来将文本转换为用户语音。

  • 我似乎在这上面找不到任何东西。iOS7中是否有任何Siri类或API允许您进行文本到语音转换?我所要做的就是如下所示: 然后让Siri从我的应用程序中说出来。 看来我们应该有能力做到这一点,不是吗?似乎是一件微不足道的事情。

  • 我是快速和iOS应用程序开发的新手。我正在使用AVSpeechSynthesiser创建一个文本到语音应用程序。我想设置一个字符串说在英语,但我希望它把那个特定的字符串翻译成语音,但在不同的语言,如阿拉伯语。我是否能够使用AVSpeechSynthesizer做到这一点,或者我需要使用翻译API来做到这一点。 谢谢你

  • 我能够使用链接中包含的教程转录音频(https://cloud.google.com/speech-to-text/docs/async-recognize),但它仅适用于WAV格式的音频。我想让它与MP3或M4A格式的音频一起工作。 我已经测试了链接中包含的所有可能性(https://github.com/GoogleCloudPlatform/java-docs-samples/blob/ma

  • 我已经查看了语音识别的Android示例,但我并不真正了解它应该做什么或它是如何工作的。在清单中没有任何类型的主要活动要运行,因此当我在手机上安装该应用程序时,我无法运行它。 我还试图找到一个简单的语音到文本的示例,它将语音作为输入并在屏幕上输出文本。这样我就可以研究它来看看它是如何工作的,但是我在网上找不到任何展示它的示例。