问题：

谷歌云语音到文本API-多说话人识别？

唐骏祥

2023-03-14

新的谷歌云语音文本转换API据说是市场上最好的。它是否提供了说话人注释（或其他说话人信息）？比如谁在什么时候说什么。我似乎在它的文档或提供的例子中找不到任何提到它的地方。

IBM和亚马逊都这样做。

如果有人能告诉我，我将不胜感激，谢谢！

共有1个答案

凌声

2023-03-14

个人说话人识别目前不是API提供的功能。问题追踪器【1】中指出这是一个功能请求，但目前还没有ETA。我建议将该问题列为主角，以便将来收到有关该问题的评论和更新。

[1]https://issuetracker.google.com/35901846

类似资料：

Python语音识别与谷歌云语音API

我正在玩Google Cloud Speech API。我想知道我是否使用python语音识别库并调用google cloud语音API，这仍然是使用API的有效方式吗？我只想转录文本。我对它们之间的区别感到困惑，如果我只想转录音频，是否有任何建议的方法。使用Python语音识别：不使用Python SpeechRecognition：
谷歌云语音到文本AP

我正在使用谷歌云语音到文本AP，并试图转录长音频文件。但是，无法检测到桶中的音频文件。我得到一个错误，说明：IOError：[Errno 2]没有这样的文件或目录： transcribe_gcs（gcs_uri）：
谷歌语音到文本api android

Android谷歌语音转文本SDK，语音录制由SDK控制。我需要将其设置为手动按钮，用于启动和停止语音录制，以便将语音转换为文本。例如：当单击按钮开始语音识别时，它会继续录制音频，直到单击停止按钮。但在android SDK中，它会自动停止录制并将录制的音频传递给处理。
如何进行实时语音识别|谷歌云语音到文本

我正在尝试从扬声器转录音频我正在将声音从扬声器传送到节点。js文件(https://askubuntu.com/a/850174) 这是我的抄本。js公司但谷歌云语音到文本在1分钟内对流媒体识别有一个限制。所以我有一个错误“超过了允许的最大流持续时间65秒” 如何将流拆分为以静默为拆分器的块，或拆分为持续30秒的块？
API谷歌语音到文本-mp3文件

我能够使用链接中包含的教程转录音频(https://cloud.google.com/speech-to-text/docs/async-recognize)，但它仅适用于WAV格式的音频。我想让它与MP3或M4A格式的音频一起工作。我已经测试了链接中包含的所有可能性(https://github.com/GoogleCloudPlatform/java-docs-samples/blob/ma
如何使用谷歌云语音API进行实时语音识别？

我正在努力寻找使用谷歌云语音API进行实时连续语音识别的例子。我的要求是使用麦克风，检测语音，并在用户说话时进行转录。我知道他们的RESTAPI没有这种支持，所以我研究了grpc示例，包括他们提供的示例。但它们似乎都是用户可以上传音频并检测语音的例子。我在Java，谷歌grpc也支持java。有人遇到一个很好的例子，展示了如何通过麦克风持续进行这种识别吗？

谷歌云语音到文本API-多说话人识别？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档