我想尝试sphinx的最新版本,但不知道如何安装它。 对于第四个版本,它非常简单,我使用了演示,如Hello World,并将库(
我试图用CMU Sphinx在java中进行语音识别,但结果不正确,我也不知道为什么。 我有一个。wav文件我用我的声音录制了一些英语句子。 以下是我的java代码: 我在Android中还有另一个不太好用的代码: 我使用这个网站将wav文件转换为16bit、16khz、mono和little-endian(尝试了它的所有选项)。 知道为什么is不起作用吗。我使用内置字典和宾格模式,我的英语口音也
我不知道为什么,但它只是偶尔查找、转换和转录目录中的所有mp3文件,但从来没有100%的时间。我不知道为什么。我希望我的要求是正确的。我的目标是找到所有m4a文件,然后转换为wav文件,然后找到所有wav文件并转录它们。程序有时会执行此操作,但不是所有时间都执行此操作。 编辑:我犯了一个非常愚蠢的错误,我用相同的名称命名所有输出的文本文件,所以它们会被覆盖。我确保给它们一个唯一的名称,将名称降到毫
我正在考虑为我的母语开发语音识别软件,我正在考虑为此使用CMUSphinx-4。有一个CMU字典文件,其中包含英语单词,这些单词通过原始单词的拆分映射到其音位边界。例如,已放弃=
我已经使用HTK(Hidden Markov Model Tool Kit)来识别用于控制Android应用程序的特定命令,但在这种情况下,我需要将一些语音数据传递给服务器,这可能会耗费更多时间。 为了防止这种延迟,我正在考虑使用pocketsphinx通过Android应用程序在本地识别语音数据,这样我就不需要将音频传递给服务器。 如果这是一个好主意,那么从头开始学习pocketsphinx容易
我正在寻找一种匹配已知数据集的方法,比如说一个MP3或wav文件的列表,每个文件都是一个人说话的样本。在这一点上,我知道ABC文件是关于X个人的。 然后,我想再抽取一个样本,根据当时已知的数据集,进行一些语音匹配,以显示这个语音最有可能是谁。 此外,我不一定在乎这个人说了什么,只要我能找到匹配的,即我不需要任何抄写或其他方式。 我知道CMU狮身人面像不做语音识别,它主要用于语音到文本,但我见过其他
我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我已经研究过Pocketsphinx,但由于我仍然不熟悉它,我想也许更有经验的人可能会知道。是否有可能使用Pocketsphinx来实现这样的语音识别。它应该记录音频,提取其特征,然后将其与所说的任何内容进行匹配,而不是使用声学和语言模型。是否有可能使用Pocketsphinx实现此流程?如果没有,有人能为这样的解决方案指出正确的方向吗?谢
im a<代码>。Net(Asp.Net)开发者和我迫切需要在我的一个网站上使用语音识别 但问题是,无论我在哪里读到这两个平台中的任何一个,我都会发现这一点。Net的替代方案需要在连续听写之前进行培训,我倾向于选择这一个,因为我已经是一个。Net开发人员<我在哪里也找不到这两者之间的比较<我不介意为中的狮身人面像设计一个包装。Net或使用已有的几种方法中的一种,但值得吗 存在比较的链接 或者可能同
我正在做一个在iOS项目中使用谷歌语音应用编程接口的项目。该项目涉及语音输入来识别许多基本上是术语的术语。谷歌语音应用编程接口优雅地无法识别这个术语的语音输入。 在移动iOS应用程序中输入语音时,有没有办法训练google语音API学习这些行话并轻松识别它们?
有没有办法从Google Assistant或Amazon Alexa设备获取实际录制的音频输入以在我自己的API后端中使用? 这个关于Android语音识别API的回答提到,实际上不可能获得音频记录。
现在,我正在开发一种功能,它配备了语音识别和无效记录功能。我将在识别过程发生时收集语音缓冲区数据。与RecognitionListener一样,应该在识别过程中触发onBufferReceived,但显然在识别过程中没有打印日志。在我的调试器模式中,它还显示了应该步进方法onBufferReceived的注意事项。我的目的是在识别过程中收集缓冲区数据,并将缓冲区保存到记录文件中。 主要活动 act
我正在开发一个android应用程序,它将监听语音命令并相应地触发动作。 以下是一些疑问: > 谷歌语音识别离线库是否可用于android应用程序 我们能创建自己的词汇词典吗 应用程序应在脱机模式下工作(无Internet)。
我正在尝试在我的Android应用程序中实现继续语音识别。我已经遵循了这个链接编码。这个继续语音识别在两天前工作。但是现在语音识别工作不好,它将需要更多的时间进行语音监听。如何解决这个问题。请指导我。谢谢 识别编码: 用户开始说话
我正在寻找一个Android语音识别库。我只需要它来理解“是/否”的答案(用不同的语言,如英语、德语、法语)。 有什么建议吗?
你好,我想构建一个应用程序,我的android应用程序可以识别我的语音命令