当前位置: 首页 > 知识库问答 >
问题:

由于背景噪声,语音识别失败

姬宝
2023-03-14

我试图学习和使用语音识别应用程序,搜索了太长时间,找到了许多有用的信息和指南。。

最后我找到并使用了这个项目:这里

它工作得很好,直到我尝试了一些嘈杂的背景样本。。

我试图添加一个自定义语法随着听写,尝试使用自定义语法只,但仍然得到相同的结果(或更糟)...

_speechRecognitionEngine.LoadGrammar(_dictationGrammar);
        _speechRecognitionEngine.LoadGrammar(new Grammar(new GrammarBuilder(new Choices("a", "b", "c",
            "d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u",
            "v","w","x","y","z","please","type","the","letters","you","hear"))) { Name = "NewGrammar" });
        _speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

总是相同的结果:请键入字母你听到它的工作人员...

任何信件总是产生:它的工作人员。

那么,有没有办法降低背景噪音?或者编辑WAV样本?

还有一个新手问题:是否可以使用一些音频样本作为选择?(以字节为单位读取,然后进行比较或其他)。

要测试的音频样本:音频样本

此样本的正确结果应为:请键入您听到的字母H C D V A。

共有1个答案

邹京
2023-03-14

我正在探索一个类似的问题。您可以通过另一个具有噪声消除功能和脚本或命令行模式(如Audity或Sox)的应用程序来过滤有问题的文件。这些可以从C#程序中使用Process类调用。

或者,有一个商业许可。NET库,以实现此目的https://visualstudiogallery.msdn.microsoft.com/53d1f3fc-44d2-4a53-8211-99ca4b70536d.

 类似资料:
  • 我想构建一个android应用程序,它可以识别我的声音,将其转换为文本,并显示我刚才在祝酒词中所说的内容。我可以通过使用一个按钮来完成这项工作,该按钮将为我启动语音识别器。但现在我想让它只在我的声音的基础上工作。 应用程序应触发语音识别器,仅当我开始说话时才开始听我说话,当它感觉到沉默时应停止听我说话。就像会说话的tom应用程序的功能一样。它记录了声音,但我想用语音识别器识别它。像这样的事情: 主

  • 我正在尝试制作一款可以通过语音识别停止的闹钟Android应用程序。为此,我正在使用Google语音识别API(这段代码可以连续进行语音识别)。 它工作得很好,直到我同时演奏音乐。在这种情况下,语音识别的效率会大大降低。 这个问题是合乎逻辑的,因为音乐会增加一些噪音,使识别变得更加困难。但是由于播放的音乐是已知的,我想知道是否有可能告诉谷歌尝试忽略这些额外的噪音。我知道信号处理中存在一些滤波器来做

  • 在飞行模式下,按下按钮,一个声音退出输入屏幕,输入出现的声音请重新输入,上周可以正常使用,谷歌很长时间找不到解决方案,希望帮助离线谷歌语音已经设置好 公共void onclick1(视图v) { } 受保护的void onActivityResult(int requestCode、int resultCode、Intent data){ }

  • 我使用RecognizerIntent并实现RecognitionListener,并实现其所有回调方法来执行语音命令。我试着调整参数EXTRA\u SPEECH\u INPUT\u MINIMUM\u LENGTH\u MILLIS、EXTRA\u SPEECH\u INPUT\u mably\u COMPLETE\u SILENCE\u LENGTH\u MILLIS和EXTRA\u SPEE

  • 由于连接到不同的API,我目前正在开发一个工具,允许我阅读所有的通知。 它工作得很好,但现在我想用一些声音命令来做一些动作。 就像当软件说“一封来自Bob的邮件”时,我想说“阅读”或“存档”。 我的软件是通过一个节点服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。 在NodeJS中,启用语音到文本的最佳方式是什么? 我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我希望在一

  • 语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产