基于声场分解和稀疏正则化的二维空间次级声源布局优化

Download PDF 打印本文

引用本文

陈克安, 胥健, 王磊, 周兵. 基于声场分解和稀疏正则化的二维空间次级声源布局优化[J]. 西北工业大学学报, 2019, 37(4): 697-703.

CHEN Kean, XU Jian, WANG Lei, ZHOU Bing. Optimization of Secondary Sources Configuration in Two-Dimensional Space Based on Sound Field Decomposition and Sparsity-Inducing Regularization[J]. Journal of Northwestern Polytechnical University, 2019, 37(4): 697-703.

基于声场分解和稀疏正则化的二维空间次级声源布局优化

陈克安^1,2,3, 胥健^2,3, 王磊^2,3, 周兵¹

1. 中国电力科学研究院有限公司电网环境保护国家重点实验室, 湖北武汉 430074;
2. 西北工业大学航海学院, 陕西西安 710072;
3. 海洋声学信息感知工信部重点实验室(西北工业大学), 陕西西安 710072

收稿日期: 2018-09-03

基金项目: 电网环境保护国家重点实验室开放基金和中央财政专项基金（MJ-2015-F-044）资助

作者简介: 陈克安(1965-), 西北工业大学教授, 主要从事噪声控制研究。

摘要: 在有源噪声控制系统电声器件布局设计中，目前的优化方法需要预先确定误差传感器的布局，这样大大增加了后续次级声源布局优化的工作量。利用高阶传声器拾取声场信息，在波域构造有源控制代价函数，从而解除了对误差传感器布局信息的需求。在此基础上，根据初级声场的稀疏特性，引入稀疏正则化方法，通过求解欠定方程的稀疏近似解，实现了次级声源布局（个数和空间位置）优化。讨论了备选次级声源个数对优化结果的影响，并与均匀布局和遗传算法优化布局结果进行了比较。结果表明，所提方法在不依赖于误差传感器布局信息的情况下可以有效地优化次级声源布局，降噪效果与遗传算法布局结果相近，其他系统评价指标明显更优，有利于有源系统的稳定运行。

关键词: 有源噪声控制次级声源布局声场分解稀疏正则化

有源噪声控制(active noise control, ANC)是一种利用声波相消性干涉原理, 人为调节次级声源强度实现低频噪声控制的降噪新技术。决定ANC系统降噪量的因素有多种, 其中次级声源布局的影响十分重要^[1]。受系统实现代价(运算能力、硬件复杂度等)的限制, ANC系统应用于实际工程中必须优化次级声源布局, 这一问题已成为ANC技术实用化的关键。

目前的次级声源布局优化设计, 需预先知道误差传感器的布局信息, 通过其采样初级声场声压, 测量至备选次级声源之间的声传输阻抗(acoustic transmission impedance, ATI), 再利用各种布局优化方法进行计算。这使得次级声源布局的优化依赖于误差传感器的布局信息, 导致二者相互耦合, 难以取得最优结果。声场可以利用基函数(球谐函数或平面波等)分解, 通过有限阶声场系数近似表示声场中任一点的声压。近年来, 人们将声场分解(sound field decomposition, SFD)应用于ANC, 提出波域有源噪声控制(wave domain ANC, WDANC), 并针对内部域问题探究了相关自适应算法^[2]。虽然受控制器运算能力的限制, 暂时无法实现WD控制, 但可以离线利用声场的WD信息, 优化次级声源布局, 而无需具体的误差传感器布局信息。

对于次级声源布局优化方法, 一般将其看作组合优化问题, 即从所有可能的布局中选择使降噪量最大的布局方案。由于这些布局方案种数庞大, 无法穷举搜索, 故常采用遗传算法(genetic algorithm, GA)、模拟退火算法等进行搜索^[3]。但是, 算法参数的选取对优化结果影响很大, 且易陷入局部极值解。此外, 还有采用Gram-Schmidt正交化^[4]、基于声传递函数矩阵奇异值分解^[5]的次级声源布局优化方法等等。这些方法物理意义明确, 但当次级声源个数较多时, 算法不稳定, 矩阵构造困难。

事实上, 一般情况下初级声场在不同方面存在稀疏性^[1], 因此可以引入稀疏正则化(sparsity-inducing regularization, SIR)方法, 从大量备选次级声源中选择与初级声压向量最相关的次级声源。在声场重构研究中, 人们已经利用最小绝对收缩和选择算子(least-absolute shrinkage and selection operator, Lasso)^[6]和弹性网^[7]来减少重构声源个数并计算驱动信号。然而, 不同于重构声源的驱动, ANC中次级声源的发声是通过FxLMS等自适应算法实时调节的, 所以SIR这里只用于选择次级声源布局。

本文提出基于SFD和SIR的次级声源布局优化方法, 以二维自由声场为对象, 定义了布局优化结果的5个评价指标, 比较讨论了不同备选次级声源个数下所提方法优化结果的性能指标, 并与均匀布局和GA优化布局结果进行了对比分析, 证明了所提方法的优势。该方法容易推广到三维封闭空间的驻波声场。

1 波域有源控制代价函数

考查二维自由声场, 此处WD特指柱谐函数域。首先利用高阶传声器(higher order microphone, HOM)^[8]拾取声场, 经柱谐函数展开, 然后由次级声源强度表示次级声场展开系数, 最后推导WDANC代价函数。

1.1 二维内部声场的拾取

考查的ANC模型配置如图 1所示(同文献[2]), L_c个备选次级声源均匀布放在半径R_L为2 m的圆周上, M个误差传感器均匀布放在半径R_M为1 m的圆周上。初级声源为3个线源(等效二维单极子点声源), 极坐标分别为(2.2, 0°), (2.5, 45°)和(3, 240°)。图 1还给出了200 Hz下初级声场的声压级云图。离线拾取声场信息的HOM为半径R为1 m的开口传声器圆阵。HOM阶数N至少为⌈ekR/2⌉^[8], 其中k为波数, ⌈·⌉表示向上取整, 因此计算得阶数N为5。为防空间混叠, HOM上的传声器个数J=2N+1=11^[8]。传声器均为全指向性, 灵敏度设为1。备选次级声源位置可以是HOM半径R外的任意位置, 这里为了表述方便, 均匀分布在同心圆周上。

图 1 二维自由空间ANC模型配置以及3个线源产生的200 Hz初级声场 △：初级声源；□：备选次级声源；○：误差传感器；×：HOM上的传声器

图选项

HOM上每个传声器位置 x_j=(R, θ_j)的声压可以利用柱谐函数展开^[8]

(1)

式中，J_n(·)表示第n阶柱贝塞尔函数, α_n(k)是相对于坐标系原点O =(0, 0)的声场展开系数。(1)式写成矩阵形式为

(2)

式中，p 为J×1的拾取声压向量, α为(2N+1)×1的声场展开系数向量, Y是J×(2N+1)的矩阵, 元素[Y]_{μ, ν}=J_n(kR)e^inθ_j, 其中μ=j, ν=n+N+1。

(2) 式方程可能病态, 往往需要施加Tikhonov正则化后求解α

(3)

式中，β>0为正则化参数, (·)^H表示共轭转置。

1.2 二维次级声场的波域表示

假设第l个备选次级声源的强度为q_l(k), 则次级声场展开系数可表示为^[9]

(4)

式中, 上标(s)表示次级声场, γ_nl(k)=(ρck/4)H_n⁽²⁾ (kr_l)e^-inθ_l是第l个备选次级声源的ATI展开系数^[9], 其中ρ是空气密度, c为声速, H_n⁽²⁾ (·)表示第n阶的第二类柱汉克尔函数。写成矩阵形式为

(5)

式中, α_s是(2N+1)×1的次级声场展开系数向量, 下标s表示次级声场, q是L_c×1的备选次级声源强度向量, Γ是(2N+1)×L_c的ATI展开系数矩阵, 元素[Γ]_{μ, ν}=(ρck/4)H_m⁽²⁾ (kr_l)e^-imθ_l, 其中μ=m+N+1, ν=l。

由于自由空间声传输特性明确, ATI展开系数矩阵由理论表达式给出, 而在实际中, 同次级通路建模的方法, 以白噪声依次激励备选次级声源, 利用HOM获得该声场的柱谐展开系数即为该备选次级声源的ATI展开系数。

1.3 波域代价函数

半径R_M圆周内区域的声势能E(k)可以用α_r近似表示^[10]

(6)

式中，α_r表示残余声场的展开系数, W是(2N+1)×(2N+1)的对角矩阵, 元素为

(7)

略去(6)式的常系数2π/k², 定义代价函数

(8)

式中，‖·‖表示L₂范数, α_p表示初级声场的展开系数, U为对角矩阵, 元素, 满足U^HU = W。

2 基于稀疏正则化的次级声源布局优化

对WD代价函数施加SIR, 求解SIR代价函数的稀疏近似解, 通过改变稀疏度调节参数λ, 得到不同个数激励次级声源的位置。

2.1 稀疏正则化代价函数

对(8)式的最小二乘项施加SIR, 可以得到SIR代价函数, 一般表达式为

(9)

式中，λ为稀疏度调节参数, ϕ(q)称为罚函数, 形式多样^[11]。若ϕ(q)=‖ q ‖₁, 则是最常用的L₁范数正则化, (9)式又称为Lasso问题。简单起见, 本文的SIR只讨论L₁范数正则化。因此, (8)式的SIR代价函数为

(10)

优化(10)式可以求得稀疏近似解, 但前提是 q 本身稀疏, 即SIR方法优化次级声源布局有效与否, 取决于q是否稀疏。对于本文考查的自由空间内部声场, 外部噪声源个数通常不多, 来波方向是稀疏的, 可以利用稀疏分布的次级声源获得较好的降噪效果。

2.2 次级声源布局优化

SIR问题的求解算法很多, 本文采用最简单的复数坐标下降法得到 q 的稀疏近似解^[6], 假设其中包含L_act个非零元素, 则这些非零元素在备选次级声源中对应的位置即为选择的激励次级声源位置, 激励次级声源个数为L_act。

稀疏度调节参数λ直接控制解的稀疏度, λ越大, 解越稀疏。若λ≥‖ Γ^H Wα_p‖_∞, 其中‖·‖_∞表示无穷范数, 则q = 0, 即激励次级声源个数为0。一般利用交叉验证选择最优的λ^[6], 但本文涉及的问题往往需要直接控制激励次级声源个数, 所以这里选择λ的步骤是：

① 在λ取值区间[0, ‖ Γ^H Wα_p‖_∞])上均匀选取N_λ个点λ_n(n=1, …, N_λ);

② 计算出每个λ_n对应的激励次级声源个数L_act和声势能降噪量Δ_E(下文定义);

③ 给定需要的激励次级声源个数L, 在L_act=L的一组λ_n值中, 选择对应Δ_E最大的λ_n作为参数值;

④ 若无L_act=L的λ_n值, 则在L_act=L+L_Δ的一组λ_n值中, 选择对应Δ_E最大的λ_n作为参数值, 再在选择的激励次级声源位置中除去强度幅值最小的L_Δ个次级声源, 其中L_Δ从1递增, 直到选出参数值。

得到次级声源布局后, 给定M个误差传感器的布局, 由下式计算最优次级声源强度

(11)

式中，p_p∈ C^M×1为误差传感器处的初级声压向量, Z ∈ C^M×L_act为激励次级声源位置到误差传感器位置的ATI矩阵。该方法标记为WD-SIR。

3 仿真结果与分析 3.1 评价指标

为量化比较不同优化方法的结果, 从降噪量和系统稳定性2个角度定义评价次级声源布局性能的指标。

1) 降噪量指标

① 误差传感器处的降噪量Δ

(12)

② 利用(6)式定义半径R_M圆周内区域的声势能降噪量Δ_E

(13)

2) 系统指标

① ATI矩阵 Z的条件数κ

(14)

表征了ATI矩阵是否良态。若κ很大, 则Z病态, ANC系统对外界摄动敏感。

② 次级声源控制功率P

(15)

P过大, 可能会导致控制目标区域外的声级增大, 还会引起扬声器的非线性响应, 长时间工作会损坏器件。

③ 利用相对标准差定义次级声源强度幅值平滑度S

(16)

式中，σ是强度幅值| q |的标准差，S描述了激励次级声源强度幅值的差异程度, 实际中希望幅值差异小, 即S大, 有利于系统稳定。

3.2 备选次级声源个数L_c的影响

实际中, 鉴于ANC系统调试工作量和次级声源物理尺寸的限制, 需要进一步研究可安装空间中备选次级声源网格划分对布局优化及各评价指标的影响。下面比较不同备选次级声源个数L_c下的布局位置, 并针对不同误差传感器个数M, 对比不同L_c下的评价指标。ANC的频率范围一般为500 Hz以下的低频, 假设计算频率为200 Hz。

图 2给出了L_c分别为20, 30, 70和120时, WD-SIR方法选择的激励次级声源位置。图中灰色虚线标记了初级声源的方位。可见, 当激励次级声源个数L_act减小时, 选择的位置与初级声源方位一致, 验证了q具有稀疏性。当L_c增大时, 选择的位置向初级声源所在方位聚集。这是因为当备选次级声源分布密集时, 初级声源方位附近与初级声场展开系数向量α_p相关的次级声源增多, 所以L₁范数正则化会优先选择这些位置。

图 2 不同备选次级声源个数L_c下的优化布局位置

图选项

图 3给出了M=10时, 对于不同L_c选择的不同L_act下的评价指标。由于次级声源个数一般不超过误差传感器个数, 所以L_act的取值范围是[2, M]。由图 3c)可以看到, L_c增大带来的激励次级声源分布集中会导致ATI矩阵的条件数κ增大, 系统病态, 因为聚集的次级声源之间呈高度相关, 即一个次级声源的作用可以被附近其他次级声源替代。相应地, 次级声源控制功率P随L_c增大而增大，强度幅值平滑度S随L_c增大而减小, 如图 5d)~5e)所示。虽然这里未给出, 但当M取其他值时也有类似规律。此外, 降噪量性能与L_c无明显关系, 但例外是当M=L_act时, L_c越小, 降噪量Δ越大。综上, 备选次级声源个数L_c较小时, WD-SIR的性能较好, 对应的激励次级声源布局是初级声源方位附近以及较均匀分散的其他位置。

图 3 不同备选次级声源个数L_c下的评价指标(误差传感器个数M=10)

图选项

3.3 与均匀布局和遗传算法优化布局的比较

现有ANC系统一般直接均匀布局次级声源, 或者利用GA搜索出最优布局。本节将所提方法与均匀布局(标记为UNI)及GA优化搜索方法进行比较研究。GA利用Sheffield大学的GA工具箱实现, 参数设定参考文献[5]。WD-SIR方法和GA方法的流程对比如图 4所示。可见, WD方法无需预先确定误差传感器的布局, 对于特定的初级声场只给出一种最优次级声源布局。

图 4 次级声源布局优化流程

图选项

图 5给出了备选次级声源个数L_c=20, 误差传感器个数M=10时, 3种方法(UNI、GA、WD-SIR)的评价指标。可以看出, 均匀布局方法的降噪效果明显劣于2种优化方法。WD-SIR方法在κ, P和S这些系统指标上优于GA。GA的降噪量Δ最大, 但对于声势能降噪量Δ_E, GA和WD-SIR方法相差不大。虽然这里未给出, 但当M取其他值时也有类似规律。当L_c增大时, WD-SIR方法性能下降, GA方法无论降噪量指标还是系统指标都最优。当然, 实际中备选次级声源网格不会过于密集。

图 5 不同布局方法下的评价指标(备选次级声源个数L_c=20、误差传感器个数M=10)

图选项

4 结论

本文提出基于SFD, 在WD利用SIR方法优化次级声源布局。针对二维自由空间, 研究了备选次级声源个数对优化性能的影响, 并与均匀布局方法和GA方法作了对比。主要结论如下:

1) WD方法预先利用HOM获得待控制区域的声场展开系数, 在WD能够有效地优化次级声源布局, 不涉及具体的误差传感器布局信息。

2) 备选次级声源个数L_c对WD-SIR方法的优化性能影响很大。L_c越小, 性能越好。主要原因是备选次级声源密集时, 相邻次级声源之间的相关性增强, 导致SIR方法在变量选择时失效, 因此需要选择合适的备选次级声源网格。

3) GA方法的降噪效果最好, 特别是在误差传感器位置。当L_c较小时, WD-SIR方法能获得相近的降噪效果, 且系统指标明显优于GA方法, 更有利于ANC系统的稳定。

参考文献

[1]	陈克安. 有源噪声控制[M]. 2版. 北京: 国防工业出版社, 2014. CHEN Kean. Active Noise Control[M]. 2nd ed. Beijing: National Defense Indeustny Press, 2014. (in Chinese)
[2]	ZHANG J, ABHAYAPALA T D, ZHANG W, et al. Active Noise Control over Space:a Wave Domain Approach[J]. IEEE Trans on Audio, Speech, and Language Processing, 2018, 26(4): 774-786. DOI:10.1109/TASLP.2018.2795756
[3]	BAEK K, ELLIOTT S. Natural Algorithms for Choosing Source Locations in Active Control Systems[J]. Journal of Sound and Vibration, 1995, 186(2): 245-267. DOI:10.1006/jsvi.1995.0447
[4]	ASANO F, SUZUKI Y, SWANSON D. Optimization of Control Source Configuration in Active Control Systems Using Gram-Schmidt Orthogonalization[J]. IEEE Trans on Speech and Audio Processing, 1999, 7(2): 213-220. DOI:10.1109/89.748126
[5]	KHALILIAN H, BAJIĈ I, VAUGHAN R. Towards Optimal Loudspeaker Placement for Sound Field Reproduction[C]//Proc IEEE International Conference on Acoustics, Speech and Signal Processing, 2013: 321-325
[6]	LILIS G, ANGELOSANTE D, GIANNAKIS G. Sound Field Reproduction Using the Lasso[J]. IEEE Trans on Audio, Speech, and Language Processing, 2010, 18(8): 1902-1912. DOI:10.1109/TASL.2010.2040523
[7]	GAUTHIER P A, LECOMTE P, BERRY A. Source Sparsity Control of Sound Field Reproduction Using the Elastic-Net and the Lasso Minimizers[J]. Journal of the Acoustical Society of America, 2017, 141(4): 2315-2326. DOI:10.1121/1.4979260
[8]	SAMARASINGHE P N, ABHAYAPALA T D, POLETTI, M. Wavefield Analysis over Large Areas Using Distributed Higher Order Microphones[J]. IEEE Trans on Audio, Speech, and Language Processing, 2014, 22(3): 647-658. DOI:10.1109/TASLP.2014.2300341
[9]	ZHANG W, ABHAYAPALA T D, BETLEHEM T, et al. Analysis and Control of Multi-Zone Sound Field Reproduction Using Modal-Domain Approach[J]. Journal of the Acoustical Society of America, 2016, 140(3): 2134-2144. DOI:10.1121/1.4963084
[10]	BETLEHEM T, ABHAYAPALA T D. Theory and Design of Sound Field Reproduction in Reverberant Rooms[J]. Journal of the Acoustical Society of America, 2005, 117(1): 2100-2111.
[11]	BACH F, JENATTON R, MAIRAL J, et al. Optimization with Sparsity-Inducing Penalties[J]. Foundations and Trends in Machine Learning, 2012, 4(1): 1-106.

Optimization of Secondary Sources Configuration in Two-Dimensional Space Based on Sound Field Decomposition and Sparsity-Inducing Regularization

CHEN Kean^1,2,3, XU Jian^2,3, WANG Lei^2,3, ZHOU Bing¹

1. State Key Laboratory of Power Grid Environmental Protection, China Electric Power Research Institute, Wuhan 430074, China;
2. School of Marine Science and Technology, Northwestern Polytechnical University, Xi'an 710072, China;
3. Key Laboratory of Ocean Acoustics and Sensing(Northwestern Polytechnical University), Ministry of Industry and Information Technology, Xi'an 710072, China

Abstract: During the design of transducers configuration for an active noise control system, current optimization methods need to predetermine the error sensors configuration, which significantly increases the workload of later optimization of the secondary sources configuration. In this study, a new method free from specific error sensors configuration information is presented that higher order microphones are used to capture the sound field so as to formulate the cost function in wave domain. In addition, according to sparsity characteristics of the primary sound field, sparsity-inducing regularization is introduced to optimize the secondary sources configuration, including the number and positions, by calculating a sparse approximate solution to underdetermined equations. Effects of the number of candidate secondary sources are discussed, and the comparison with the uniform configuration and the optimized configuration using the genetic algorithm is performed. Results show that the proposed method can optimize the secondary sources configuration effectively independent of the error sensors configuration information. The noise reduction of the proposed method is close to that by the genetic algorithm, while other evaluation metrics for the system are much better, which would benefit the stability of active noise control system.

Keywords: active noise control secondary sources configuration optimization sound field decomposition

sparsity-inducing regularization algorithms

西北工业大学主办。

文章信息

陈克安, 胥健, 王磊, 周兵

CHEN Kean, XU Jian, WANG Lei, ZHOU Bing

基于声场分解和稀疏正则化的二维空间次级声源布局优化

Optimization of Secondary Sources Configuration in Two-Dimensional Space Based on Sound Field Decomposition and Sparsity-Inducing Regularization

西北工业大学学报, 2019, 37(4): 697-703.

Journal of Northwestern Polytechnical University, 2019, 37(4): 697-703.

文章历史

收稿日期: 2018-09-03

文章信息

文章历史

相关文章

工作空间