当前位置: 首页 > 工具软件 > Bark > 使用案例 >

matlab 子波,基于Matlab的Bark子波实现

叶衡虑
2023-12-01

0引言子波的种类较多,根据是否正交,子波可以分为正交子波、半正交子波、双正交子波和非正交子波。通常,在多分辨率框架下构造子波基的主要优点在于它满足正交性,然而这一点对语音来说并不必要,因为听觉感知本身就存在较大冗余。并且,无论是二进子波还是M带子波变换,其频率划分都是一种倍频程关系,这与人耳所固有的对语音的频率感知特性并不完全吻合。Bark子波及其变换是一种针对语音信号的子波变换[1],其基函数满足时间-感知频率(弯折频率,主观频率)上的最佳不确定性(时间-带宽积最小),而分析尺度的伸缩则按“临界带”的概念来变化,这就使得Bark子波具有与听觉十分吻合的分析特性。Matlab是为矩阵理论、线性代数和数值计算研究而设计的一个软件包,它已被学术界的研究者和工程界工程师们广泛采用,并且其功能变得越来越强大和灵活。由于具有非常规范的数据组织形式、广泛的数值计算能力、专业工具箱、现成的功能子程序和优秀的图形界面,它已成为科学研究和技术开发不可多得的一个软件工具。本文应用Matlab为工具来实现Bark子波及其变换,可以使编程变得简单且容易实现。1Bark频率及其表示一个声音的听觉感受受到同时听到的另一个声音影响的现象称为“掩蔽效应”。前者称为被掩蔽音,后者称为掩蔽音。研究纯音对纯音的掩蔽和噪音对纯音的掩蔽两种情形,在纯音对纯音的掩蔽效应实验中得出两点结论:对于中等掩蔽强度来说,纯音最有效的掩蔽出现在被掩蔽纯音的频率附近;低频的纯音可以有效地掩蔽高频的纯音,而高频的纯音对低频纯音的掩蔽作用则很小。在噪音对纯音的掩蔽效应实验中,可以把噪音视为许多纯音组成的宽带音,由前述,掩蔽作用最明显的是被掩蔽音频率附近的一个窄带的掩蔽分量,为此,人们常用“频率群”掩蔽的概念来解释。通常认为,在20Hz~16kHz的范围内,可分为24个频率群,或者说,共有24个Bark。人耳的感知频率如表1所示,频率群的划分相应于基底膜分成许多很小的部分,每一部分对应一个频率群,并且长度相等,对应于同一基底膜部分的那些频率的声音,在大脑中似乎是叠加在一起进行评价的。这就是说,人类听觉系统对于声音频率的感知与实际频率的对应关系,是一种非线性映射关系,此即所谓的Bark阮立志:基于Matlab的Bark子波实现39来变化,这就使得Bark子波具有与听觉系统十分吻合的分析特性。从感知域滤波器组角度导出了Bark子波函数的定义及其变换式,容易验证[5]:(5)由于式(1)是单调函数,因此从Bark域变换回线性频率域并不影响式(5)的成立,也就是说Bark子波满足“容许条件”,换句话说,这就意味着Bark子波是完全重构的。从工程近似的角度,可以简单地验证Bark子波的完全重构。首先,由定义有:,0

 类似资料: