问题：

如何为CMU Sphinx创建语音语言模型？

笪烨

2023-03-14

我需要对俄语进行语音识别。我遵循了项目页面上的教程。

在我看到的教程中

您可以使用语言的语音词典将文本转换为语音字符串。只需将单词替换为相应的抄本即可。由于电话的数量很小，文本也不应该很大，只要一本书就可以了。

但我在哪里能找到语音词典呢？我怎样才能用整本书中相应的抄本来替换这些单词？

或在哪里可以找到完整的语音模型？

已更新

我创建了文件测试。带行的txt：

SIL i0 lj j a1 i1 lj f j e0 v gj e1 nj i0 j pj e0 t r o1 v z o0 l o0 t o1 j tj e0 lj o1 n o0 k SIL

这是一个线条形式的测试wav文件，它将俄语单词替换为拼音表示形式词典（ru.dic）。

然后，我使用SRILM命令构建模式：

ngram计数-插值-文本测试。txt-lm测试。表示语音的lm公司

接下来，我用命令启动它：

pocketsphinx\bin\Debug\Win32\pocketsphinx\u连续。exe-samprate 16000-allphone testModel\test。表示语音的lm-hmm cmusphinx-ru-5.2-删除\u噪声否-填充测试模型\解码器测试。wav-回溯是

但是当我使用它时，我看到错误的结果与错误的音调。

共有1个答案

陆博易

2023-03-14

但我在哪里能找到语音词典呢？

归档ru。dic内部

https://sourceforge.net/projects/cmusphinx/files/Acoustic和语言模型/俄语/cmusphinx-ru-5.2.tar.gz/download

我怎样才能用整本书中相应的抄本来替换这些单词？

带有Python脚本

或在哪里可以找到完整的语音模型？

你必须自己创造它。

类似资料：

如何结合语言模型构建Tensorflow语音识别

如何将语言模型集成到tensorflow语音识别体系结构中？在Tensorflow中建立字符级语音识别有很多例子（例如。https://github.com/nervanasystems/neon, https://github.com/buriburisuri/speech-to-text-wavenet)，这很有趣，但实际上毫无用处，除非集成了语言模型。我找不到使用语言模型的示例。如何集成
如何创建多语言JavaDocs？

问题内容：有一个普通的Java API的JavaDoc，有英文版和中文版，但似乎每个版本都需要单独的源代码。还有其他更方便的方法吗？问题答案：不，基本上没有办法。想到的唯一变通方法适用于生成的HTML页面：您可以将JavaDocs包围在使用CSS在语言之间切换的块元素中。考虑：随后编辑JavaDocs的CSS，以便用户可以切换语言，例如：
建模语言

Hyperledger Composer包含一个面向对象的建模语言，用于定义业务网络定义的领域模型。 Hyperledger Composer CTO文件由以下元素组成：一个单一的命名空间。文件中的所有资源声明都隐含在这个命名空间中。一组资源定义，包括资产、交易、参与者和事件。从其他命名空间导入资源的可选导入声明。组织和Hyperledger Composer系统命名空间你的组织命名
声音语言

声音语言选择影像的声音语言。
如何为多个目标语言创建解析器

我在XText中定义了我的DSL，它自动生成了Java版本的语言解析器和代码生成框架，这真的很酷。问题是我的DSL被使用多种语言的项目所消耗。你可以想象我们可能至少需要用C#、Java和Ruby来解析DSL。所以问题是：有没有办法在xtext的帮助下为多种语言生成解析器？
Erlang语言创建过程

本文向大家介绍Erlang语言创建过程，包括了Erlang语言创建过程的使用技巧和注意事项，需要的朋友参考一下示例我们通过调用spawn函数来创建一个新的并发进程。该spawn函数将获得Fun该过程将评估的函数作为参数。该spawn函数的返回值是创建的进程标识符(pid)。您还可以spawn/3用来启动一个流程，该流程将从模块执行特定功能：spawn(Module, Function, Ar

如何为CMU Sphinx创建语音语言模型？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档