我正在开发一个语音识别器项目,因为它需要从wav文件中找到它的一部分,希望找到无声或检测单词的存在。如果找到了单词,则将其从头到尾复制到一个新的wav中文件,所以它原来的wav文件有10个单词,然后输出是10个文件。问题是与检测静默或单词有关如何在Java中实现此功能的建议。
好吧,wav只是PCM数据。我将从阅读以下内容开始:http : //en.wikipedia.org/wiki/Pulse-
code_modulation
我之前已经做过此事…您开始从PCM数据中提取样本。然后检查每个值是否大于您设置的阈值。例如,假设有16位样本…例如,从0到15000的任何值都是静音,大于15001的任何值都是声音。请记住要处理无符号整数,否则PCM中将带有负数。另外,在使用阈值时,请记住对数与线性。
问题内容: 我有200多个MP3文件,我需要使用静音检测来拆分其中的每个文件。我尝试了Audacity和WavePad,但它们没有批处理过程,将它们一一制作很慢。 场景如下: 分割曲目,而静音2秒或更长时间 然后在这些音轨的开头和结尾添加0.5 s并将其另存为.mp3 BitRate 192立体声 标准化卷以确保所有文件的卷和质量相同 我尝试了FFmpeg,但没有成功。 问题答案: 我发现pydu
问题内容: 我是编程和处理函数的新手,如果一个句子中存在一个单词,该函数将返回true。我尝试了该方法,但是后来我也遇到了这种方法的一个问题: 假设我的句子是 如果我们看一下这个词用的方法,那么它将返回因为存在而应该是正确的输出为不存在的词,但作为一种模式。 我该如何解决此问题?到目前为止,我正在使用的代码是: 注意: 这个词只是一个例子,显示了我目前的方法中的一个问题,并不是我必须一直工作,这个
我正在开发一个学生项目,需要编写一个函数来计算单词中的音节。该函数就像长的CountSyllabl(String word)。 如何使用Java计算单词中的音节?有什么建议吗? 提供的规则是: > < li> 要计算音节数,您应该使用字母a、e、I、o、u、y作为元音。 计算单词中的元音数量。 不要计算双元音(例如,“rain”有2个元音,但只有1个音节) 如果单词中的最后一个字母是“e”,不要把
问题内容: 我正在尝试使用Java播放* .wav文件。我希望它执行以下操作: 按下按钮时,播放一声短促的哔声。 我已经用谷歌搜索了,但是大多数代码都没有用。有人可以给我一个简单的代码片段来播放.wav文件吗? 问题答案: 没有Java反射的解决方案 , ) Java反射会降低性能。跑步:
我需要通过服务向API发送请求(t=textToSpeechService.callAPI(tmp);)这样它就会向我返回一个音频wav文件。我的问题是,我不知道应该使用什么类来代替Clip(public Clip callAPI(Source src)),以便捕获该文件并将其转发到前端,即调用该服务的前端?我的意思是,我不希望像(callAPI函数)那样在后端播放文件,而是希望捕获文件,然后在前
我是新来的,我想要得到一个文本文件的单词列表和单词数。这是我尝试过的代码: 输出:century Cepheus CEQ陶瓷Cerberus谷类小脑错误文件字数:0