问题：

语音到文本的标点符号时间戳？

濮俭

2023-03-14

谷歌云语音转文本和亚马逊转录都提供标点符号和单词时间戳。我可以得到标点符号时间戳吗？具体来说，我想要分句时间戳（句号、问号、感叹号），例如0:33秒、1:01、1:23、1:49、2:05等。

我想我可以使用谷歌或AWS用标点符号转录一个文件，然后将抄本分解成句子，然后为每个句子做单词时间戳。如果我可以为getpustutuationtimestamps设置一个参数，这将更容易（对于一个包含500个句子的文件来说，大约是计算机时间的1/500）。

IBM Watson语音到文本提供关键字识别，但不提供标点符号。

共有1个答案

况鸿雪

2023-03-14

我尝试了IBM Watson语音到文本的关键字识别。我提供了一个48分钟的Radio Abulante播客，其中有一份官方记录。这是一个高质量的NPR播客。我从成绩单中选取了一句话作为“关键词”来点击。沃森用了大约48分钟的时间转录了48分钟的播客。主持人转录好于90%，受访者好于80%。问题是为了工作，我需要100%的准确性。例如，一名古巴医生说“你我考虑到，没有comunista”（“我不认为自己是共产主义者”），但沃森听到了“考虑到communesto”。沃森一直没有找到目标句。

类似资料：

AVSpeechSynthesizer文本到语音

带有en-us语音的AVSpeechsynthesizer是“A”的发音，是“大写字母A”，但只想要“A”，怎么能做到呢？
Android语音到文本：：实时更新文本

我想在我的应用程序中转换语音到文本...对于这个，我正在使用识别监听器界面一切正常，但如何更新和显示文本，即使说话（像在谷歌现在语音搜索）我已经设置了识别意图。EXTRA_PARTIAL_RESULTS，为真，并且还使用了识别监听器界面的onPARAL结果（Bundle arg（）方法来设置文本通过语音识别完成后立即显示整个文本，但是我希望实时文本在用户说话时显示我的活动怎么让这一切发生
自定义文本到语音中的语音

有没有任何开源项目或库（在java或c），我可以用来将文本转换为用户语音。
标点符号

原则中文语句的标点符号，均应该采取全角符号，这样可以保证视觉的一致。如果整句为英文，则该句使用英文/半角标点。句号、问号、叹号、逗号、顿号、分号和冒号不得出现在一行之首。句号中文语句中的结尾处应该用全角句号（。）。句子末尾用括号加注时，句号应在括号之外。错误：关于文件的输出，请参照第 1.3 节（见第 26 页。）正确：关于文件的输出，请参照第 1.3 节（见第 26 页）。逗号
语音到文本大型音频文件[Microsoft语音API]

使用Microsoft语音API转录中/大型音频文件（每个文件约6-10分钟）的最佳方式是什么？比如批量音频文件转录？我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码，用于连续转录语音，但它在某个时候停止转录。转录有任何限制吗？我只使用免
iOS文本到语音API

我似乎在这上面找不到任何东西。iOS7中是否有任何Siri类或API允许您进行文本到语音转换？我所要做的就是如下所示：然后让Siri从我的应用程序中说出来。看来我们应该有能力做到这一点，不是吗？似乎是一件微不足道的事情。

语音到文本的标点符号时间戳？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档