当前位置：首页 > 专题 >

《抖音》专题

CMU Sphinx 5prealpha（语音识别系统）安装
我想尝试sphinx的最新版本，但不知道如何安装它。对于第四个版本，它非常简单，我使用了演示，如Hello World，并将库（
使用cmu sphinx进行语音识别-无法正常工作
我试图用CMU Sphinx在java中进行语音识别，但结果不正确，我也不知道为什么。我有一个。wav文件我用我的声音录制了一些英语句子。以下是我的java代码：我在Android中还有另一个不太好用的代码：我使用这个网站将wav文件转换为16bit、16khz、mono和little-endian（尝试了它的所有选项）。知道为什么is不起作用吗。我使用内置字典和宾格模式，我的英语口音也
语音识别程序零星工作
我不知道为什么，但它只是偶尔查找、转换和转录目录中的所有mp3文件，但从来没有100%的时间。我不知道为什么。我希望我的要求是正确的。我的目标是找到所有m4a文件，然后转换为wav文件，然后找到所有wav文件并转录它们。程序有时会执行此操作，但不是所有时间都执行此操作。编辑：我犯了一个非常愚蠢的错误，我用相同的名称命名所有输出的文本文件，所以它们会被覆盖。我确保给它们一个唯一的名称，将名称降到毫
语音识别将单词拆分为音素级别
我正在考虑为我的母语开发语音识别软件，我正在考虑为此使用CMUSphinx-4。有一个CMU字典文件，其中包含英语单词，这些单词通过原始单词的拆分映射到其音位边界。例如，已放弃=
Android离线语音识别
我已经使用HTK（Hidden Markov Model Tool Kit）来识别用于控制Android应用程序的特定命令，但在这种情况下，我需要将一些语音数据传递给服务器，这可能会耗费更多时间。为了防止这种延迟，我正在考虑使用pocketsphinx通过Android应用程序在本地识别语音数据，这样我就不需要将音频传递给服务器。如果这是一个好主意，那么从头开始学习pocketsphinx容易
用于语音/说话人识别的CMU Sphinx
我正在寻找一种匹配已知数据集的方法，比如说一个MP3或wav文件的列表，每个文件都是一个人说话的样本。在这一点上，我知道ABC文件是关于X个人的。然后，我想再抽取一个样本，根据当时已知的数据集，进行一些语音匹配，以显示这个语音最有可能是谁。此外，我不一定在乎这个人说了什么，只要我能找到匹配的，即我不需要任何抄写或其他方式。我知道CMU狮身人面像不做语音识别，它主要用于语音到文本，但我见过其他
语音相关语音识别
我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我已经研究过Pocketsphinx，但由于我仍然不熟悉它，我想也许更有经验的人可能会知道。是否有可能使用Pocketsphinx来实现这样的语音识别。它应该记录音频，提取其特征，然后将其与所说的任何内容进行匹配，而不是使用声学和语言模型。是否有可能使用Pocketsphinx实现此流程？如果没有，有人能为这样的解决方案指出正确的方向吗？谢
服务器上的语音识别引擎。狮身人面像VS。网络语音识别
im a<代码>。Net（Asp.Net）开发者和我迫切需要在我的一个网站上使用语音识别但问题是，无论我在哪里读到这两个平台中的任何一个，我都会发现这一点。Net的替代方案需要在连续听写之前进行培训，我倾向于选择这一个，因为我已经是一个。Net开发人员<我在哪里也找不到这两者之间的比较<我不介意为中的狮身人面像设计一个包装。Net或使用已有的几种方法中的一种，但值得吗存在比较的链接或者可能同
谷歌语音APIiOS词汇训练集
我正在做一个在iOS项目中使用谷歌语音应用编程接口的项目。该项目涉及语音输入来识别许多基本上是术语的术语。谷歌语音应用编程接口优雅地无法识别这个术语的语音输入。在移动iOS应用程序中输入语音时，有没有办法训练google语音API学习这些行话并轻松识别它们？
你能从语音识别平台（如亚马逊Alexa或谷歌助手）检索语音记录吗？
有没有办法从Google Assistant或Amazon Alexa设备获取实际录制的音频输入以在我自己的API后端中使用？这个关于Android语音识别API的回答提到，实际上不可能获得音频记录。
在进行语音识别时，不会调用RecognitionListener中接收的onBufferReceived
现在，我正在开发一种功能，它配备了语音识别和无效记录功能。我将在识别过程发生时收集语音缓冲区数据。与RecognitionListener一样，应该在识别过程中触发onBufferReceived，但显然在识别过程中没有打印日志。在我的调试器模式中，它还显示了应该步进方法onBufferReceived的注意事项。我的目的是在识别过程中收集缓冲区数据，并将缓冲区保存到记录文件中。主要活动 act
Android离线谷歌语音识别
我正在开发一个android应用程序，它将监听语音命令并相应地触发动作。以下是一些疑问： > 谷歌语音识别离线库是否可用于android应用程序我们能创建自己的词汇词典吗应用程序应在脱机模式下工作（无Internet）。
如何在我的Android应用程序中添加继续语音识别？
我正在尝试在我的Android应用程序中实现继续语音识别。我已经遵循了这个链接编码。这个继续语音识别在两天前工作。但是现在语音识别工作不好，它将需要更多的时间进行语音监听。如何解决这个问题。请指导我。谢谢识别编码：用户开始说话
Android-语音识别
我正在寻找一个Android语音识别库。我只需要它来理解“是/否”的答案（用不同的语言，如英语、德语、法语）。有什么建议吗？
如何在android中实现语音命令识别？
你好，我想构建一个应用程序，我的android应用程序可以识别我的语音命令

首页

93

94

95

96

97

98

99

100

101

尾页

最新发布

某一面虾皮 NLP 一面美的寒假实习llm面经蚂蚁大模型算法面经，say something I don't know 百度 llm算法一面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - vu3+vite 使用vue-pdf-embed预览pdf，组件渲染空白，页面无报错，是什么原因？java - @Async("asyncTaskExecutor") 没有并发处理问题？python - 如何查看：pypi中想要看是否哪些包最受欢迎的库？前端 - 可以安装在内网使用的安卓模拟器？前端调用API之后更新状态逻辑：是触发store的方法进行拉取更新是吗，还是说直接修改store进行更新？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

objection Fqutils Gitee dcm4che pg_pathman AndroidJUnit4 reek WebJars

文档资料

小米数据处理和分析服务（EMR）使用指南 iOS 核心动画高级技巧蘋果 Swift 官方教學 v2.0 Effective C++ 中文版跟我学 Spring MVC