2. 西北工业大学 航海学院, 陕西 西安 710072;
3. 海洋声学信息感知工信部重点实验室(西北工业大学), 陕西 西安 710072
有源噪声控制(active noise control, ANC)是一种利用声波相消性干涉原理, 人为调节次级声源强度实现低频噪声控制的降噪新技术。决定ANC系统降噪量的因素有多种, 其中次级声源布局的影响十分重要[1]。受系统实现代价(运算能力、硬件复杂度等)的限制, ANC系统应用于实际工程中必须优化次级声源布局, 这一问题已成为ANC技术实用化的关键。
目前的次级声源布局优化设计, 需预先知道误差传感器的布局信息, 通过其采样初级声场声压, 测量至备选次级声源之间的声传输阻抗(acoustic transmission impedance, ATI), 再利用各种布局优化方法进行计算。这使得次级声源布局的优化依赖于误差传感器的布局信息, 导致二者相互耦合, 难以取得最优结果。声场可以利用基函数(球谐函数或平面波等)分解, 通过有限阶声场系数近似表示声场中任一点的声压。近年来, 人们将声场分解(sound field decomposition, SFD)应用于ANC, 提出波域有源噪声控制(wave domain ANC, WDANC), 并针对内部域问题探究了相关自适应算法[2]。虽然受控制器运算能力的限制, 暂时无法实现WD控制, 但可以离线利用声场的WD信息, 优化次级声源布局, 而无需具体的误差传感器布局信息。
对于次级声源布局优化方法, 一般将其看作组合优化问题, 即从所有可能的布局中选择使降噪量最大的布局方案。由于这些布局方案种数庞大, 无法穷举搜索, 故常采用遗传算法(genetic algorithm, GA)、模拟退火算法等进行搜索[3]。但是, 算法参数的选取对优化结果影响很大, 且易陷入局部极值解。此外, 还有采用Gram-Schmidt正交化[4]、基于声传递函数矩阵奇异值分解[5]的次级声源布局优化方法等等。这些方法物理意义明确, 但当次级声源个数较多时, 算法不稳定, 矩阵构造困难。
事实上, 一般情况下初级声场在不同方面存在稀疏性[1], 因此可以引入稀疏正则化(sparsity-inducing regularization, SIR)方法, 从大量备选次级声源中选择与初级声压向量最相关的次级声源。在声场重构研究中, 人们已经利用最小绝对收缩和选择算子(least-absolute shrinkage and selection operator, Lasso)[6]和弹性网[7]来减少重构声源个数并计算驱动信号。然而, 不同于重构声源的驱动, ANC中次级声源的发声是通过FxLMS等自适应算法实时调节的, 所以SIR这里只用于选择次级声源布局。
本文提出基于SFD和SIR的次级声源布局优化方法, 以二维自由声场为对象, 定义了布局优化结果的5个评价指标, 比较讨论了不同备选次级声源个数下所提方法优化结果的性能指标, 并与均匀布局和GA优化布局结果进行了对比分析, 证明了所提方法的优势。该方法容易推广到三维封闭空间的驻波声场。
1 波域有源控制代价函数考查二维自由声场, 此处WD特指柱谐函数域。首先利用高阶传声器(higher order microphone, HOM)[8]拾取声场, 经柱谐函数展开, 然后由次级声源强度表示次级声场展开系数, 最后推导WDANC代价函数。
1.1 二维内部声场的拾取考查的ANC模型配置如图 1所示(同文献[2]), Lc个备选次级声源均匀布放在半径RL为2 m的圆周上, M个误差传感器均匀布放在半径RM为1 m的圆周上。初级声源为3个线源(等效二维单极子点声源), 极坐标分别为(2.2, 0°), (2.5, 45°)和(3, 240°)。图 1还给出了200 Hz下初级声场的声压级云图。离线拾取声场信息的HOM为半径R为1 m的开口传声器圆阵。HOM阶数N至少为⌈ekR/2⌉[8], 其中k为波数, ⌈·⌉表示向上取整, 因此计算得阶数N为5。为防空间混叠, HOM上的传声器个数J=2N+1=11[8]。传声器均为全指向性, 灵敏度设为1。备选次级声源位置可以是HOM半径R外的任意位置, 这里为了表述方便, 均匀分布在同心圆周上。
HOM上每个传声器位置 xj=(R, θj)的声压可以利用柱谐函数展开[8]
(1) |
式中,Jn(·)表示第n阶柱贝塞尔函数, αn(k)是相对于坐标系原点O =(0, 0)的声场展开系数。(1)式写成矩阵形式为
(2) |
式中,p 为J×1的拾取声压向量, α为(2N+1)×1的声场展开系数向量, Y是J×(2N+1)的矩阵, 元素[Y]μ, ν=Jn(kR)einθj, 其中μ=j, ν=n+N+1。
(2) 式方程可能病态, 往往需要施加Tikhonov正则化后求解α
(3) |
式中,β>0为正则化参数, (·)H表示共轭转置。
1.2 二维次级声场的波域表示假设第l个备选次级声源的强度为ql(k), 则次级声场展开系数可表示为[9]
(4) |
式中, 上标(s)表示次级声场, γnl(k)=(ρck/4)Hn(2) (krl)e-inθl是第l个备选次级声源的ATI展开系数[9], 其中ρ是空气密度, c为声速, Hn(2) (·)表示第n阶的第二类柱汉克尔函数。写成矩阵形式为
(5) |
式中, αs是(2N+1)×1的次级声场展开系数向量, 下标s表示次级声场, q是Lc×1的备选次级声源强度向量, Γ是(2N+1)×Lc的ATI展开系数矩阵, 元素[Γ]μ, ν=(ρck/4)Hm(2) (krl)e-imθl, 其中μ=m+N+1, ν=l。
由于自由空间声传输特性明确, ATI展开系数矩阵由理论表达式给出, 而在实际中, 同次级通路建模的方法, 以白噪声依次激励备选次级声源, 利用HOM获得该声场的柱谐展开系数即为该备选次级声源的ATI展开系数。
1.3 波域代价函数半径RM圆周内区域的声势能E(k)可以用αr近似表示[10]
(6) |
式中,αr表示残余声场的展开系数, W是(2N+1)×(2N+1)的对角矩阵, 元素为
(7) |
略去(6)式的常系数2π/k2, 定义代价函数
(8) |
式中,‖·‖表示L2范数, αp表示初级声场的展开系数, U为对角矩阵, 元素
对WD代价函数施加SIR, 求解SIR代价函数的稀疏近似解, 通过改变稀疏度调节参数λ, 得到不同个数激励次级声源的位置。
2.1 稀疏正则化代价函数对(8)式的最小二乘项施加SIR, 可以得到SIR代价函数, 一般表达式为
(9) |
式中,λ为稀疏度调节参数, ϕ(q)称为罚函数, 形式多样[11]。若ϕ(q)=‖ q ‖1, 则是最常用的L1范数正则化, (9)式又称为Lasso问题。简单起见, 本文的SIR只讨论L1范数正则化。因此, (8)式的SIR代价函数为
(10) |
优化(10)式可以求得稀疏近似解, 但前提是 q 本身稀疏, 即SIR方法优化次级声源布局有效与否, 取决于q是否稀疏。对于本文考查的自由空间内部声场, 外部噪声源个数通常不多, 来波方向是稀疏的, 可以利用稀疏分布的次级声源获得较好的降噪效果。
2.2 次级声源布局优化SIR问题的求解算法很多, 本文采用最简单的复数坐标下降法得到 q 的稀疏近似解[6], 假设其中包含Lact个非零元素, 则这些非零元素在备选次级声源中对应的位置即为选择的激励次级声源位置, 激励次级声源个数为Lact。
稀疏度调节参数λ直接控制解的稀疏度, λ越大, 解越稀疏。若λ≥‖ ΓH Wαp‖∞, 其中‖·‖∞表示无穷范数, 则q = 0, 即激励次级声源个数为0。一般利用交叉验证选择最优的λ[6], 但本文涉及的问题往往需要直接控制激励次级声源个数, 所以这里选择λ的步骤是:
① 在λ取值区间[0, ‖ ΓH Wαp‖∞])上均匀选取Nλ个点λn(n=1, …, Nλ);
② 计算出每个λn对应的激励次级声源个数Lact和声势能降噪量ΔE(下文定义);
③ 给定需要的激励次级声源个数L, 在Lact=L的一组λn值中, 选择对应ΔE最大的λn作为参数值;
④ 若无Lact=L的λn值, 则在Lact=L+LΔ的一组λn值中, 选择对应ΔE最大的λn作为参数值, 再在选择的激励次级声源位置中除去强度幅值最小的LΔ个次级声源, 其中LΔ从1递增, 直到选出参数值。
得到次级声源布局后, 给定M个误差传感器的布局, 由下式计算最优次级声源强度
(11) |
式中,pp∈ CM×1为误差传感器处的初级声压向量, Z ∈ CM×Lact为激励次级声源位置到误差传感器位置的ATI矩阵。该方法标记为WD-SIR。
3 仿真结果与分析 3.1 评价指标为量化比较不同优化方法的结果, 从降噪量和系统稳定性2个角度定义评价次级声源布局性能的指标。
1) 降噪量指标
① 误差传感器处的降噪量Δ
(12) |
② 利用(6)式定义半径RM圆周内区域的声势能降噪量ΔE
(13) |
2) 系统指标
① ATI矩阵 Z的条件数κ
(14) |
表征了ATI矩阵是否良态。若κ很大, 则Z病态, ANC系统对外界摄动敏感。
② 次级声源控制功率P
(15) |
P过大, 可能会导致控制目标区域外的声级增大, 还会引起扬声器的非线性响应, 长时间工作会损坏器件。
③ 利用相对标准差定义次级声源强度幅值平滑度S
(16) |
式中,σ是强度幅值| q |的标准差,S描述了激励次级声源强度幅值的差异程度, 实际中希望幅值差异小, 即S大, 有利于系统稳定。
3.2 备选次级声源个数Lc的影响实际中, 鉴于ANC系统调试工作量和次级声源物理尺寸的限制, 需要进一步研究可安装空间中备选次级声源网格划分对布局优化及各评价指标的影响。下面比较不同备选次级声源个数Lc下的布局位置, 并针对不同误差传感器个数M, 对比不同Lc下的评价指标。ANC的频率范围一般为500 Hz以下的低频, 假设计算频率为200 Hz。
图 2给出了Lc分别为20, 30, 70和120时, WD-SIR方法选择的激励次级声源位置。图中灰色虚线标记了初级声源的方位。可见, 当激励次级声源个数Lact减小时, 选择的位置与初级声源方位一致, 验证了q具有稀疏性。当Lc增大时, 选择的位置向初级声源所在方位聚集。这是因为当备选次级声源分布密集时, 初级声源方位附近与初级声场展开系数向量αp相关的次级声源增多, 所以L1范数正则化会优先选择这些位置。
图 3给出了M=10时, 对于不同Lc选择的不同Lact下的评价指标。由于次级声源个数一般不超过误差传感器个数, 所以Lact的取值范围是[2, M]。由图 3c)可以看到, Lc增大带来的激励次级声源分布集中会导致ATI矩阵的条件数κ增大, 系统病态, 因为聚集的次级声源之间呈高度相关, 即一个次级声源的作用可以被附近其他次级声源替代。相应地, 次级声源控制功率P随Lc增大而增大,强度幅值平滑度S随Lc增大而减小, 如图 5d)~5e)所示。虽然这里未给出, 但当M取其他值时也有类似规律。此外, 降噪量性能与Lc无明显关系, 但例外是当M=Lact时, Lc越小, 降噪量Δ越大。综上, 备选次级声源个数Lc较小时, WD-SIR的性能较好, 对应的激励次级声源布局是初级声源方位附近以及较均匀分散的其他位置。
3.3 与均匀布局和遗传算法优化布局的比较现有ANC系统一般直接均匀布局次级声源, 或者利用GA搜索出最优布局。本节将所提方法与均匀布局(标记为UNI)及GA优化搜索方法进行比较研究。GA利用Sheffield大学的GA工具箱实现, 参数设定参考文献[5]。WD-SIR方法和GA方法的流程对比如图 4所示。可见, WD方法无需预先确定误差传感器的布局, 对于特定的初级声场只给出一种最优次级声源布局。
图 5给出了备选次级声源个数Lc=20, 误差传感器个数M=10时, 3种方法(UNI、GA、WD-SIR)的评价指标。可以看出, 均匀布局方法的降噪效果明显劣于2种优化方法。WD-SIR方法在κ, P和S这些系统指标上优于GA。GA的降噪量Δ最大, 但对于声势能降噪量ΔE, GA和WD-SIR方法相差不大。虽然这里未给出, 但当M取其他值时也有类似规律。当Lc增大时, WD-SIR方法性能下降, GA方法无论降噪量指标还是系统指标都最优。当然, 实际中备选次级声源网格不会过于密集。
4 结论本文提出基于SFD, 在WD利用SIR方法优化次级声源布局。针对二维自由空间, 研究了备选次级声源个数对优化性能的影响, 并与均匀布局方法和GA方法作了对比。主要结论如下:
1) WD方法预先利用HOM获得待控制区域的声场展开系数, 在WD能够有效地优化次级声源布局, 不涉及具体的误差传感器布局信息。
2) 备选次级声源个数Lc对WD-SIR方法的优化性能影响很大。Lc越小, 性能越好。主要原因是备选次级声源密集时, 相邻次级声源之间的相关性增强, 导致SIR方法在变量选择时失效, 因此需要选择合适的备选次级声源网格。
3) GA方法的降噪效果最好, 特别是在误差传感器位置。当Lc较小时, WD-SIR方法能获得相近的降噪效果, 且系统指标明显优于GA方法, 更有利于ANC系统的稳定。
[1] |
陈克安. 有源噪声控制[M]. 2版. 北京: 国防工业出版社, 2014.
CHEN Kean. Active Noise Control[M]. 2nd ed. Beijing: National Defense Indeustny Press, 2014. (in Chinese) |
[2] | ZHANG J, ABHAYAPALA T D, ZHANG W, et al. Active Noise Control over Space:a Wave Domain Approach[J]. IEEE Trans on Audio, Speech, and Language Processing, 2018, 26(4): 774-786. DOI:10.1109/TASLP.2018.2795756 |
[3] | BAEK K, ELLIOTT S. Natural Algorithms for Choosing Source Locations in Active Control Systems[J]. Journal of Sound and Vibration, 1995, 186(2): 245-267. DOI:10.1006/jsvi.1995.0447 |
[4] | ASANO F, SUZUKI Y, SWANSON D. Optimization of Control Source Configuration in Active Control Systems Using Gram-Schmidt Orthogonalization[J]. IEEE Trans on Speech and Audio Processing, 1999, 7(2): 213-220. DOI:10.1109/89.748126 |
[5] | KHALILIAN H, BAJIĈ I, VAUGHAN R. Towards Optimal Loudspeaker Placement for Sound Field Reproduction[C]//Proc IEEE International Conference on Acoustics, Speech and Signal Processing, 2013: 321-325 |
[6] | LILIS G, ANGELOSANTE D, GIANNAKIS G. Sound Field Reproduction Using the Lasso[J]. IEEE Trans on Audio, Speech, and Language Processing, 2010, 18(8): 1902-1912. DOI:10.1109/TASL.2010.2040523 |
[7] | GAUTHIER P A, LECOMTE P, BERRY A. Source Sparsity Control of Sound Field Reproduction Using the Elastic-Net and the Lasso Minimizers[J]. Journal of the Acoustical Society of America, 2017, 141(4): 2315-2326. DOI:10.1121/1.4979260 |
[8] | SAMARASINGHE P N, ABHAYAPALA T D, POLETTI, M. Wavefield Analysis over Large Areas Using Distributed Higher Order Microphones[J]. IEEE Trans on Audio, Speech, and Language Processing, 2014, 22(3): 647-658. DOI:10.1109/TASLP.2014.2300341 |
[9] | ZHANG W, ABHAYAPALA T D, BETLEHEM T, et al. Analysis and Control of Multi-Zone Sound Field Reproduction Using Modal-Domain Approach[J]. Journal of the Acoustical Society of America, 2016, 140(3): 2134-2144. DOI:10.1121/1.4963084 |
[10] | BETLEHEM T, ABHAYAPALA T D. Theory and Design of Sound Field Reproduction in Reverberant Rooms[J]. Journal of the Acoustical Society of America, 2005, 117(1): 2100-2111. |
[11] | BACH F, JENATTON R, MAIRAL J, et al. Optimization with Sparsity-Inducing Penalties[J]. Foundations and Trends in Machine Learning, 2012, 4(1): 1-106. |
2. School of Marine Science and Technology, Northwestern Polytechnical University, Xi'an 710072, China;
3. Key Laboratory of Ocean Acoustics and Sensing(Northwestern Polytechnical University), Ministry of Industry and Information Technology, Xi'an 710072, China