当前位置: 首页 > 知识库问答 >
问题:

如何为CMU Sphinx创建语音语言模型?

笪烨
2023-03-14

我需要对俄语进行语音识别。我遵循了项目页面上的教程。

在我看到的教程中

您可以使用语言的语音词典将文本转换为语音字符串。只需将单词替换为相应的抄本即可。由于电话的数量很小,文本也不应该很大,只要一本书就可以了。

但我在哪里能找到语音词典呢?我怎样才能用整本书中相应的抄本来替换这些单词?

或在哪里可以找到完整的语音模型?

已更新

我创建了文件测试。带行的txt:

SIL i0 lj j a1 i1 lj f j e0 v gj e1 nj i0 j pj e0 t r o1 v z o0 l o0 t o1 j tj e0 lj o1 n o0 k SIL

这是一个线条形式的测试wav文件,它将俄语单词替换为拼音表示形式词典(ru.dic)。

然后,我使用SRILM命令构建模式:

ngram计数-插值-文本测试。txt-lm测试。表示语音的lm公司

接下来,我用命令启动它:

pocketsphinx\bin\Debug\Win32\pocketsphinx\u连续。exe-samprate 16000-allphone testModel\test。表示语音的lm-hmm cmusphinx-ru-5.2-删除\u噪声否-填充测试模型\解码器测试。wav-回溯是

但是当我使用它时,我看到错误的结果与错误的音调。

共有1个答案

陆博易
2023-03-14

但我在哪里能找到语音词典呢?

归档ru。dic内部

https://sourceforge.net/projects/cmusphinx/files/Acoustic和语言模型/俄语/cmusphinx-ru-5.2.tar.gz/download

我怎样才能用整本书中相应的抄本来替换这些单词?

带有Python脚本

或在哪里可以找到完整的语音模型?

你必须自己创造它。

 类似资料:
  • 如何将语言模型集成到tensorflow语音识别体系结构中? 在Tensorflow中建立字符级语音识别有很多例子(例如。https://github.com/nervanasystems/neon, https://github.com/buriburisuri/speech-to-text-wavenet),这很有趣,但实际上毫无用处,除非集成了语言模型。我找不到使用语言模型的示例。 如何集成

  • 问题内容: 有一个普通的Java API的JavaDoc,有英文版和中文版,但似乎每个版本都需要单独的源代码。还有其他更方便的方法吗? 问题答案: 不,基本上没有办法。 想到的唯一变通方法适用于生成的HTML页面:您可以将JavaDocs包围在使用CSS在语言之间切换的块元素中。考虑: 随后编辑JavaDocs的CSS,以便用户可以切换语言,例如:

  • Hyperledger Composer包含一个面向对象的建模语言,用于定义业务网络定义的领域模型。 Hyperledger Composer CTO文件由以下元素组成: 一个单一的命名空间。文件中的所有资源声明都隐含在这个命名空间中。 一组资源定义,包括资产、交易、参与者和事件。 从其他命名空间导入资源的可选导入声明。   组织和Hyperledger Composer系统命名空间 你的组织命名

  • 声音语言 选择影像的声音语言。

  • 我在XText中定义了我的DSL,它自动生成了Java版本的语言解析器和代码生成框架,这真的很酷。 问题是我的DSL被使用多种语言的项目所消耗。你可以想象我们可能至少需要用C#、Java和Ruby来解析DSL。 所以问题是:有没有办法在xtext的帮助下为多种语言生成解析器?

  • 本文向大家介绍Erlang语言创建过程,包括了Erlang语言创建过程的使用技巧和注意事项,需要的朋友参考一下 示例 我们通过调用spawn函数来创建一个新的并发进程。该spawn函数将获得Fun该过程将评估的函数作为参数。该spawn函数的返回值是创建的进程标识符(pid)。 您还可以spawn/3用来启动一个流程,该流程将从模块执行特定功能:spawn(Module, Function, Ar