当前位置: 首页 > 面试题库 >

Python频率检测

宣煜
2023-03-14
问题内容

好的,我正在尝试做的是一种音频处理软件,可以检测到一个普遍的频率,如果该频率播放了足够长的时间(几毫秒),我知道我得到了肯定的匹配。我知道我将需要使用FFT或类似的方法,但是在这个数学领域中,我很烂,我确实在互联网上进行搜索,但没有找到仅能执行此操作的代码。

尝试接收的目标是使自己成为一种自定义协议,以发送数据通过声音,每秒需要非常低的比特率(5-10bps),但在发送端也非常有限,因此接收软件将需要能够自定义(不能使用实际的硬件/软件调制解调器)我也希望它仅是软件(除声卡外没有其他硬件)

非常感谢您的帮助。


问题答案:

所述aubio库已经包裹SWIG并且因此可以被Python使用。在它们的许多功能中,包括用于音调检测/估计的几种方法,包括YIN算法和一些谐波梳状算法。

但是,如果您想要更简单的方法,我前段时间编写了一些用于音高估算的代码,您可以接受也可以保留它。它不会像使用aubio中的算法那样精确,但是它可能足以满足您的需求。我基本上只是将数据的FFT乘以一个窗口(在本例中为Blackman窗口),对FFT值求平方,找到具有最高值的bin,并使用最大值的对数对峰值进行二次插值和它的两个相邻值来找到基频。我从发现的一些论文中得到了二次插值。

它可以在测试音调上很好地工作,但是不会像上面提到的其他方法那样健壮或准确。可以通过增加块大小来提高精度(或通过减小块大小来降低精度)。块大小应为2的倍数,以充分利用FFT。另外,我只是确定每个块的基本音高,没有重叠。我在写出估计音高的同时使用了PyAudio播放声音。

源代码:

# Read in a WAV and find the freq's
import pyaudio
import wave
import numpy as np

chunk = 2048

# open up a wave
wf = wave.open('test-tones/440hz.wav', 'rb')
swidth = wf.getsampwidth()
RATE = wf.getframerate()
# use a Blackman window
window = np.blackman(chunk)
# open stream
p = pyaudio.PyAudio()
stream = p.open(format =
                p.get_format_from_width(wf.getsampwidth()),
                channels = wf.getnchannels(),
                rate = RATE,
                output = True)

# read some data
data = wf.readframes(chunk)
# play stream and find the frequency of each chunk
while len(data) == chunk*swidth:
    # write data out to the audio stream
    stream.write(data)
    # unpack the data and times by the hamming window
    indata = np.array(wave.struct.unpack("%dh"%(len(data)/swidth),\
                                         data))*window
    # Take the fft and square each value
    fftData=abs(np.fft.rfft(indata))**2
    # find the maximum
    which = fftData[1:].argmax() + 1
    # use quadratic interpolation around the max
    if which != len(fftData)-1:
        y0,y1,y2 = np.log(fftData[which-1:which+2:])
        x1 = (y2 - y0) * .5 / (2 * y1 - y2 - y0)
        # find the frequency and output it
        thefreq = (which+x1)*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    else:
        thefreq = which*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    # read some more data
    data = wf.readframes(chunk)
if data:
    stream.write(data)
stream.close()
p.terminate()


 类似资料:
  • 问题内容: 我正在编写代码来分析语音所唱的单个音频。我需要一种方法来分析音符的频率。当前,我正在使用PyAudio录制音频文件,该文件存储为,然后立即播放。 问题出在while循环上。由于某种原因,该条件永远不会成立。我打印了两个值(len(data)和(chunk * swidth)),它们分别是8192和4096。然后,我尝试在while循环中使用2 * chunk * swidth,这引发了

  • 问题内容: 尽管我在此站点上有许多有关音高检测概念的问题……他们都处理了我不熟悉的神奇 FFT 。我正在尝试构建需要实现音高检测的Android应用程序。我绝对不了解用于执行此操作的算法。 它不能 是 硬可以吗?毕竟,Android市场上大约有80亿个吉他调音器应用程序。 有人可以帮忙吗? 问题答案: 快速傅立叶变换将功能从时域更改为频域。因此,而不是在那里是信号,你是从麦克风获取和是信号的时间指

  • 我使用的是libav 9.6,通过自制安装。 尽管在命令行输出的stdout中显示了采样率,但选项根本不会显示音频文件的采样率信息。 下面是BASH终端输出: 我向libav提交了一张票,但我只是好奇是否有任何其他方法可以从libav探测UTIL中提取采样率。我很感激事先的回答。 PS:在这种情况下,ffmpeg(ffprobe)的上游项目也会遇到同样的问题。

  • 问题内容: 假设我有一个单词列表,并且我想查找每个单词出现在该列表中的次数。 一个明显的方法是: 但是我发现这段代码不是很好,因为该程序在单词列表中运行两次,一次构建集合,第二次计算出现次数。 当然,我可以编写一个函数来遍历列表并进行计数,但是那不是Pythonic。那么,有没有更有效和Pythonic的方法呢? 问题答案: 在类中模块是专为解决这类问题的目的:

  • 问题内容: 我目前正在尝试使用Android实现一些代码,以检测何时通过手机的麦克风播放了多个特定音频频率范围。我已经使用AudioRecord该类设置了该类: 然后读取音频: 执行FFT是我遇到的困难,因为我在这方面的经验很少。我一直在尝试使用此类: Java和Complex类中的FFT一起使用 然后,我发送以下值: 这很容易让我误解了此类的工作原理,但是返回的值到处都是跳跃的,即使在沉默中也不

  • 问题内容: 我对Python pandas的ivot_table还是很陌生,想问一种对一列中的值的频率进行计数的方法,该列也链接到另一列ID。DataFrame如下所示。 对于输出,我想获得如下内容: 到目前为止,我尝试了以下代码: 这段代码给了我两个相同的东西。上面的代码有什么问题?我问这个问题的部分原因是该DataFrame只是一个示例。我正在处理的真实数据有数万个account_number