水下目标识别是指从水下目标辐射噪声中提取出水下目标的个性特征从而对目标类型进行辨别的技术。目前,在水下目标识别中常用的特征参数有美尔频率倒谱系数(mel-frequency cepstral coefficients,MFCC)[1, 2]、线性预测倒谱系数(linear prediction cepstral coefficients,LPCC)[3]、感知线性预测(perceptual linear predictive,PLP)[4, 5]等。
近些年来,听觉生理与听觉心理的研究取得了巨大进步,人们对与听觉感知特性有关的特征用于目标识别产生了浓厚兴趣[6, 7, 8]。由于海洋环境的日趋复杂化、采集到的目标信息日趋多样化、声诱饵技术的快速发展,使基于单阵元提取的听觉感知特征很难较好反映目标的类别属性,实现目标准确分类。为解决这一问题,现代声呐采用水听器阵列接收信号,然后结合声呐员听音判型以及先进的信号处理方法实现目标准确分类。在对水听器阵列接收信号进行处理过程中,波束形成是重要的一个环节。在宽带信号处理中,为了使基于阵列输出的目标分类识别效果获得最佳的性能,则要求宽带信号在波束形成后其频谱特性没有发生畸变,这对目标识别来说具有重要意义[9]。对于常规宽带波束形成,波束主瓣会随着频率发生变化,一般只有当目标在波束所指方向时满足要求;当目标在其波束半功率点内的其他方向时,信号波束输出频谱就会发生畸变。而使用宽带恒定束宽波束形成器,则可以保证其工作频带内的频谱不失真。
为了提高水下目标识别的准确率,本文结合稳健的二阶锥规划方法,提出了基于恒定束宽波形保真及干扰抑制的水下目标联合特征识别算法。基于实录水下目标辐射噪声仿真的阵列信号验证了该方法的有效性。
1 阵列输出信号模型与恒定束宽设计 1.1 阵列输出信号模型[9, 10]多个水听器阵元在空间按照一定的几何位置排列,就构成了阵列。它比单个水听器具有更好的空间指向性,故可以更好地确定信号的入射方向,并能提高信号的输出信噪比。
考虑由M个各向同性阵元组成的任意结构三维阵列,接收位于基阵远场点源辐射或者是由目标反射回来的平面波,如图 1所示。
假定阵元m的位置向量为
式中: 是阵元m和原点之间的几何距离。若平面波从-r方向入射到基阵,有
假设坐标原点为参考点,并设该点的接收信号为s(t),则阵元m接收到的信号相对s(t)的时间延迟为
式中:c为声传播速度,故导向矢量可表示为
不失一般性,假设M个各向同性阵元均匀分布在三维坐标系的y轴正半轴上,1号阵元位于坐标系的原点,各阵元间的间距为d,如图 2所示。
对于第m号阵元,有θm=π/2,φm=π/2,rm=(m-1)d。若信号从(φ,θ)方向入射到阵列时,由(3)式得
将(5)式代入(4)式,得到均匀线列阵的导向矢量
1.2 恒定束宽波束设计所谓“恒定束宽”就是当接收宽带信号时,它能在给定频带宽度内的各个频率分量上,都保持具有近似相等的主瓣宽度(下降到3 dB的主瓣波束宽度),即恒定束宽波束形成器使各个频率上的波束在主瓣宽度内相同,故当信号从主瓣宽度内的某一方向入射到阵列时,不同频率的信号分量得到相同的增益,这样就可以获得无畸变的波束输出。恒定束宽波束设计思想的实质就是采用某种方法使不同的频率成分所形成的波束图形状与频率分量无关。
对于线列阵,由于其几何结构简单,特别是当各个阵元均匀分布时,阵列的导向矢量与时域横向滤波器形成对应关系,故Dolph-Chebyshev加权法、乘幂法以及线性组合法等恒定束宽波束设计方法都可以用到线列阵的波束设计中[11]。
考虑一个12元的均匀线列阵,阵元间距为f0=2 000 Hz对应的半波长,假设基阵的工作频带为[fl,fu]=[f0/2,f0],并将该基阵的工作频带均匀地划分成33个子带,利用二阶锥规划约束得到指向0°的恒定束宽波束,如图 3所示。图 3a)是33个子带波束的重叠图,图 3b)是33个子带波束的三维图。从图中可以看出,利用二阶锥规划约束设计的波束主瓣基本上保持恒定,且各个子带波束的旁瓣严格控制在-25 dB以下。
由于声呐阵列接收到的目标辐射噪声常伴随着各种干扰源,故需在干扰方向上设置凹槽,以滤除干扰源。
假设在[30°,36°]范围内存在干扰源,此时就需要在[30°,36°]扇面范围内设置一个凹槽。采用与图 3同样的方法设计主瓣宽度,并保持其他参数不变,将[30°,36°]范围内的期望旁瓣级设为-50 dB,结果如图 4所示。
假设在阵列的30°与-50°上都存在干扰源,故在设计恒定主瓣宽度波形响度的同时,在30°与-50°上的形成深度为-50 dB的凹槽。保持其他参数不变,采用与图 3同样的方法设计波束形成,设计的结果如图 5所示。
从设计的显示结果可以看到,得到各个子带波束的旁瓣都在-25 dB以下,且能在不同形式的干扰方向上形成凹槽,其设计结果满足预期要求。
2 基于恒定束宽波形保真及干扰抑制的提取方法 2.1 Gammatone滤波器的特性文献[12, 13, 14]讨论了Gammatone (GT)函数能有效地模拟人耳的听觉响应,这是由于:1) 4阶GT滤波器的幅度响应较好地模拟了人耳的听觉响应[15];2) 不同中心频率的GT滤波器带宽对应于人耳基底膜上的不同部位;3) 具有简单的冲激响应函数,能够由此推导出GT函数的传递函数,进行GT滤波器的性能分析。
GT滤波器可用一个简单的因果冲激响应函数来描述其特性,具体的时域表达式为
式中:t<0时u(t)=0,t>0时u(t)=1;a为滤波器幅值;n为滤波器阶数,通常n≤4;fc为滤波器的中心频率/Hz;为初始相位,通常设为0;bEERB(fc)(ERB表示equivalent rectangular bandwidth)为阻尼因子,为了让GT滤波器更好地模拟听觉处理效果,这里b取1.019。(7)式中的ERB变换采用Moore和Glasberg的改进形式[16],
2.2 DEMON分析舰船辐射噪声主要由机械噪声、螺旋桨噪声与水动力噪声组成。其中螺旋桨噪声包括螺旋桨空化噪声和叶片转动调制空化噪声引起的噪声,是水下目标调制噪声的主要来源。通过解调这些调制噪声,可获得代表包络的DEMON谱,从而得到如目标轴频、叶频等低频段较强的物理特征,为水下目标的有效分类提供帮助。
2.3 联合特征提取鉴于GT滤波器组能较好地模拟人耳听觉系统中基底膜的滤波特性、DEMON谱分析可获得舰船辐射噪声的低频包络谱以及恒定束宽在宽带信号处理中具有波形保真及干扰抑制的优点,提出了基于恒定束宽波形保真及干扰抑制的联合特征提取方法,具体的提取过程如图 6所示。
从图 6可以看到,GT倒谱系数的提取过程与MFCC提取过程相类似,主要区别在于对接收的阵列信号进行恒定束宽波束形成和将Mel三角滤波器组替换成能更好模拟人耳基底膜特性的GT滤波器组。为了进一步表征水下目标辐射噪声的低频包络特征,本文还在恒定束宽波束形成后进行了DEMON谱分析,最后得到联合特征矢量。
3 数据仿真与识别 3.1 实验数据本文采用的实验数据为:互联网公开发布的水下动物(海豚、海狮和鲸鱼)叫声,其信噪比和采样率分别为15 dB左右和11.025 kHz;实录的舰船辐射噪声(I类、II类和III类),其信噪比和采样率分别为6 dB左右和22.05 kHz。对上述信号通过时延得到阵列信号,并添加适当的高斯白噪声,使它们的信噪比调整为5 dB。实验中使用的分类器为目前普遍使用的BP(back-propagation)神经网络分类器。对阵列仿真信号经波束形成后的输出波形进行特征提取,形成了代表720个样本的720组特征矢量(海豚、海狮、鲸鱼、Ⅰ类、Ⅱ类和Ⅲ类各120组),从720组特征矢量中随机选取180组特征矢量用于分类器训练(海豚、海狮、鲸鱼、Ⅰ类、Ⅱ类和Ⅲ类各30组),其余特征矢量用于识别。
3.2 结果与讨论为了考察GT倒谱系数及联合特征的有效性,使用单阵元-MFCC、GT倒谱系数和联合特征对基于上述实验数据时延得到的阵列信号进行识别分析,并给出了具体的识别率。表 1给出了无干扰条件下单阵元-MFCC和GT倒谱系数对水下动物叫声的识别结果。表 2给出了无干扰条件下单阵元-MFCC、GT倒谱系数和联合特征对实录舰船辐射噪声的识别结果。
由表 1、表 2可以看到,单阵元-MFCC、GT倒谱系数以及联合特征都能有效地识别目标类型。但GT倒谱系数与联合特征明显提升了目标识别的准确率,这是由于信号经恒定束宽波束形成后,提高了信号的输出信噪比。
为了进一步考察所提算法的有效性,在阵列的某个入射方向添加信干比为-5dB的[0,2 000]Hz高斯白噪声干扰源。图 7显示了信号与干扰从不同角度入射到阵列的方位谱。表 3给出了有干扰源下单阵元-MFCC和GT倒谱系数对水下动物叫声的识别结果。表 4给出了有干扰源下单阵元-MFCC、GT倒谱系数和联合特征对实录舰船辐射噪声的识别结果。
由表 3、表 4可以看到,单阵元-MFCC无法识别目标,这是由于干扰信号强于目标信号,导致在提取时易将干扰信号误认为目标信号,从而错判目标类型;而使用本文算法提取的GT倒谱系数、联合特征仍然可以对目标的类型做出判决,但由于干扰信号很强,以致具体识别的准确率不是很高。
为了改善因干扰信号导致目标识别准确率下降的问题,我们使用1.2节中设计带有凹槽的恒定束宽波束形成器来滤除图 7所示入射的干扰源。表 5和表 6给出了使用恒定束宽波束形成器滤除干扰源后对目标的具体识别结果。
比较表 1至表 6的具体识别效果,可知经带有凹槽的恒定束宽波束形成后,本文算法提取的GT倒谱系数、联合特征对目标的识别准确率有了大幅度的提高,达到令人满意的效果。
4 结 论本文设计了恒定束宽波束形成器,结合人耳听觉感知机理,提出了基于恒定束宽波形保真及干扰抑制的水下目标联合特征识别新算法。该算法主要利用恒定束宽波束形成器实现波形保真、干扰滤除、输出信号信噪比的提高以及Gammatone滤波器组较好地模拟了基底膜的滤波特性和频率分解特性。针对时延3类水下动物叫声、3类实录的舰船辐射噪声得到阵列信号的识别结果,表明基于恒定束宽波形保真及干扰抑制的水下目标识别算法提取的GT倒谱系数联合DEMON谱分析特征矢量,不仅能有效地提高目标分类的准确率,且具有较好的稳健性。可以预见,Gammatone滤波器与阵列信号处理方法相结合,将为水下目标辐射噪声特征的有效识别提供新的途径。
[1] | Zhao X and Wang D. Analyzing Noise Robustness of MFCC and GFCC Features in Speaker Identification[C]//Proceedings of ICASSP, 2013:7204-7208 |
[2] | Barua P, Ahmad K, Khan A A S, et al. Neural Network Based Recognition of Speech Using MFCC Features[C]//Proceedings of ICIEV, 2014:1-6 |
[3] | Yucesoy E, Nabiyev V V. Comparison of MFCC, LPCC and PLP Features for the Determination of a Speaker's Gander[C]//Proceedings of Signal Processing and Communications Applications, 2014:321-324 |
[4] | Hermansky H. Perceptual Linear Predictive (PLP) Analysis of Speech[J]. J Acoust Soc Am, 1990, 87(4):321-324 |
Click to display the text | |
[5] | Wu Y, Yang Y, Tian F, et. al. Robust Target Feature Extraction Based on Modified Cochlear Filter Analysis Model[C]//Proceedings of ICSPCC, 2013:1-5 |
[6] | Tucker S, Brown G J. Classification of Transient Sonar Sounds Using Perceptually Motivated Features[J]. IEEE Journal of Oceanic Engineering, 2005, 30(3):588-600 |
Click to display the text | |
[7] | 马元锋, 陈克安, 王娜, 等. 听觉模型输出谱特征在声目标识别中的应用[J]. 声学学报, 2009, 34(2):142-150 Ma Yuanfeng, Chen Kean, Wang Na, et al. Application of Auditory Spectrum-Based Features into Acoustic Target Recognition[J]. Acta Acustica, 2009, 34(2):142-150 (in Chinese) |
Cited By in Cnki (19) | Click to display the text | |
[8] | Valero X, Alias F. Gammatone Cepstral Coefficients:Biologically Inspired Feature for Non-Speech Audio Classification[J]. IEEE Trans on Multimedia, 2012, 14(6):1684-1689 |
Click to display the text | |
[9] | 杨益新. 声呐波束形成与波束域高分辨方位估计技术研究[D]. 西安:西北工业大学, 2002 Yang Yixin. Studies on Beamforming and Beamspace High Resolution Bearing Estimation Techniques in Sonar Systems[D]. Xi'an, Northwestern Polytechnical University, 2002 (in Chinese) |
Cited By in Cnki (64) | |
[10] | Harry L Van Trees. 最优阵列处理技术[M]. 汤俊,译. 北京:清华大学出版社, 2008 Harry L Van Tree. Optimum Array Processing[M]. Tang Jun, Translator, Beijing:Tsinghua University Press, 2008 (in Chinese) |
[11] | 李贵斌, 声呐基阵设计原理[M]. 北京:海洋出版社, 1993 Li Guibin. The Principles of Sonar Array Designing[M]. Beijing:China Ocean Press, 1993 (in Chinese) |
[12] | Valero X, Alias F. Gammatone Cepstral Coefficients:Biologically Inspired Feature for Non-Speech Audio Classification[J]. IEEE Trans on Multimedia, 2012, 14(6):1684-1689 |
Click to display the text | |
[13] | Lyon R F, Katsiamis A G, Drakakis E M. History and Feature of Auditory Filter Models[C]//Proceedings of IEEE ISCAS, 2010:3809-3812 |
[14] | 吴姚振, 杨益新, 田丰,等. 基于Gammatone频率离散小波系数的水下目标鲁棒识别[J]. 西北工业大学学报, 2014, 32(6):906-911 Wu Yaozhen, Yang Yixin, Tian Feng, et al. Robust Underwater Target Recognition Based on Gammatone Frequency Discrete Wavelet Coefficients[J]. Journal of Northwestern Polytechnical University, 2014, 32(6):906-911 (in Chinese) |
Cited By in Cnki (0) | Click to display the text | |
[15] | Yang G, Kwan H K. Adaptive Subband Wiener Filtering for Speech Enhancement Using Critical-Band Gammatone Filterbank[J]. Circuits and Systems, 2005, 1:732-735 |
Click to display the text | |
[16] | Smith J O, Abel J S. Bark and ERB Bilinear Transform[J]. IEEE Tans on Speech and Audio Processing, 1999, 7(6):697-708 |
Click to display the text |