2. 西北工业大学 机电学院, 陕西 西安 710072;
3. 西安交通大学 人工智能与机器人研究所, 陕西 西安 710049
图像分割技术是计算机视觉、模式识别和人工智能邻域一项基本而又关键的技术[1-2]。由于不可避免地受外界因素、成像设备自身等原因的影响, 获取的图像通常会有某种灰度不均匀现象, 严重影响了图像的分割效率与分割准确性。近年来, 活动轮廓模型已逐渐成为灰度不均匀图像分割的流行方法, 该类模型是利用能量最小化, 去引导演化曲线使其停止在真实的目标边界上。活动轮廓模型可分为基于边界信息的模型[3-5]和基于区域信息的模型[6-9]2类。
基于边界信息的活动轮廓模型, 是利用图像边界信息控制轮廓曲线的演化, 该类模型对强边界、低噪声图像具有很好的分割效果。基于区域信息的活动轮廓模型, 主要利用区域统计信息控制轮廓曲线演化, 该类模型对弱边界、灰度不均匀图像具有较好的分割效果。例如, Wang等提出了LGDF模型[7], 该模型利用高斯分布提取局部灰度信息, 不但提高了模型的分割效率, 而且还增强了模型分割灰度不均匀图像的能力。由于模型采用固定尺度控制能量泛函, 因此在一定程度上影响了模型对灰度不均匀图像的分割准确度和对噪声及初始轮廓的鲁棒性。
本文在充分分析LGDF模型的基础上, 针对模型对灰度不均匀图像分割准确度低以及对噪声和初始轮廓鲁棒性低等问题, 提出了一种基于信息熵的自适应尺度活动轮廓模型。该模型有以下创新点:
1) 利用最大后验概率和贝叶斯准则, 构建了一种改进的能量泛函, 提高了模型对图像灰度信息提取能力, 进而增强了模型对灰度不均匀图像的分割准确度。
2) 利用信息熵构造了自适应尺度算子, 使模型能根据轮廓曲线的演化, 自适应调整模型尺度, 提高了模型对初始轮廓和噪声的鲁棒性。
最后, 通过对灰度不均匀图像的分割实验以及本文模型与LGDF模型的对比实验, 充分验证了本文模型对初始轮廓位置和噪声具有较好的鲁棒性, 且在分割速度和准确性上有较大的优势。
1 背景 1.1 LGDF模型文献[7]通过假设局部灰度服从高斯分布, 提出了局部高斯分布拟合 (local gaussian distribution fitting, LGDF) 模型。模型假设图像域Ω被边界线分成若干互不相交的N个模块, 即Ω=∪i=1NΩi, Ωi∩Ωj=Ø, ∀i≠j。对于每个属于图像邻域Ω的点x的半径为ρ的小邻域可表示为Ωx={y: |x-y|≤ρ}, 则点x的小邻域将会被图像邻域内的N个模块划分为Φi=Ωx∩Ωi。根据最大后验概率 (MAP) 以及贝叶斯分类准则, 其能量泛函可定义为
![]() |
(1) |
式中:ω(x-y) 为控制点x邻域半径的固定尺度算子, pi, x(I(y)) 为灰度分布, 用均值为μi(x), 方差为σi(x) 的高斯分布表示, 即
![]() |
(2) |
LGDF模型通过将最大后验概率引入能量泛函, 提高了模型对灰度不均匀图像的提取能力, 但是, 由于采用固定尺度算子ω(x-y) 控制邻域半径, 使模型对同一图像采用不同初始轮廓和噪声, 具有不同的分割结果。
1.2 信息熵信息熵[10]是用来度量信息不确定性的一个概念。Shannon将Boltzmann公式广义化, 提出了信息熵, 对于一个有n个结果:X=Xi, 且Xi发生的概率为Pi的实验, 则Shannon信息熵可写为
![]() |
(3) |
Shannon定理:对于图像的一个局部窗口, 当且仅当局部窗口内的所有灰度值均相等时, 窗口的熵值最大。
2 模型的提出 2.1 数据项LGDF模型采用灰度均值μi(x) 表示点x邻域内的灰度值。而对于灰度不均匀图像, 用灰度均值表示邻域内的灰度, 并不能准确地捕捉到局部灰度信息。为此, 本文采用偏移场来估计、模拟点x邻域内的灰度值, 即
![]() |
(4) |
式中, I(y) 是原图像灰度; b用来模拟图像不均匀性的偏移场; n是噪声拟合项, 可用零均值高斯噪声表示, (y) 是经过偏移场拟合后的灰度不均匀图像。根据最大后验概率和贝叶斯分布可得
![]() |
(5) |
式中, κρ是自适应尺度算子; pi, x(I(y)) 是灰度不均匀图像的高斯分布
![]() |
(6) |
式中, Ii(y) 是灰度图像邻域中, 点x的小邻域Ωx被N个模块划分后的各个小模块内的原图像灰度值。
2.2 自适应尺度算子首先, 本文将Shannon信息熵推广到图像邻域, 提出了一种新型图像信息熵, 对于每个属于图像邻域Ω的点x, 其半径为ρ的小邻域Ωx的图像信息熵为
![]() |
(7) |
式中, Py, Ωx是点x的半径为ρ的小邻域Ωx中图像的灰度分布, 定义为
![]() |
(8) |
其次, 利用所提出的图像信息熵, 构造自适应尺度算子。由1.2部分的Shannon定理可知, 小邻域Ωx内的灰度越均匀, 图像信息熵越大; 灰度不均匀程度越严重, 图像信息熵越小。根据此规律, 本文以上述图像信息熵作为基础, 构建了如下自适应尺度算子
![]() |
(9) |
式中, ρ=mean (Hf)。随着图像不均匀程度增加, 点x的半径ρ越来越小, 此时模型须对灰度不均匀之处进行详细提取, 以提高模型的准确度; 反之, 若图像灰度比较均匀, 则点x的半径ρ会较大, 此时模型会迅速完成灰度的提取, 提高模型的分割效率。
2.3 正则项正则项由能量惩罚项和长度调整项组成。为了保证数值计算的稳定性, 在曲线演化过程中, 需要定期将水平集函数重新初始化为符号函数。这一过程不但增大了计算的复杂度, 而且降低了分割效率。为此, 本文提出了一种改进的能量惩罚项, 可提高模型的分割效率。长度项则可确保演化曲线的光滑性, 从而可避免出现在最后结果中小的、孤立邻域。正则项为
![]() |
(10) |
式中, μ、ν为非负常数, EP、EL分别是能量惩罚项和长度调整项。其具体定义为
![]() |
(11) |
式中, ∇表示哈密顿算子,
![]() |
(12) |
为进一步保证进化曲线的光滑性, 需要在能量函数中加入长度调整项, 其能量泛函为
![]() |
(13) |
水平集方法通过将低维的曲线演化转化成高维空间的曲面演化, 使模型能够处理拓扑结构复杂多变的活动轮廓。对于图像Ω, 在仅考虑目标和背景两相图像时, 引入Heaviside函数H(x) 后, 本文模型总的能量泛函为
![]() |
(14) |
式中,
![]() |
(15) |
![]() |
(16) |
其次, 通过变分法原理和梯度下降流, 可求得Ii、b、σ2的迭代公式为
![]() |
(17) |
![]() |
(18) |
![]() |
(19) |
最后由Euler-Lagrange方程和梯度下降流方法可得曲线演化方程为
![]() |
(20) |
式中,
![]() |
(21) |
通过对自然图像与人工合成图像的分割实验, 验证本文模型对初始轮廓位置和形状的鲁棒性及对噪音的抑制能力。并通过与LBF模型和LGDF模型进行对比实验, 进一步验证其对灰度不均匀图像的分割效率和分割准确性。本文实验环境为MatlabR2010b, CPU为Intel (R) Core (TM) i-3处理器, 主频为2.1GHz, 内存为2GB, Windows7操作系统。
本文模型算法实现的具体步骤为:
算法步骤:
步骤1:读取图像并初始化演化曲线
步骤2:初始化参数。
步骤3:如果|length(φi+1)-length(φi)|>η, 则进行下列循环:
a根据公式 (7)~(9) 计算自适应尺度算子;
b根据公式 (17)~(19) 计算迭代公式;
c根据公式 (20) 更新演化曲线。
步骤4:结束循环。
步骤5:输出最终结果φ=φi+1。
实验1 对初始轮廓位置和形状鲁棒性的验证。
初始轮廓的位置和形状分别如图 1a)~1d) 所示, 图 1e) 是它们的最终分割结果。可以看出, 初始轮廓的形状和位置并没有影响模型对图像的分割结果。由此可知我们的算法对灰度不均匀图像初始轮廓的位置和形状具有较强的鲁棒性。
![]() |
图 1 对初始轮廓位置和形状的鲁棒性验证 |
实验2 对噪声抑制能力的验证。
本实验将以高斯和胡椒噪声为例, 验证模型对噪声的抑制能力。图 2a) 为未被噪声污染的经30次迭代后的分割图像; 图 2b)、2c)是被方差分别为0.01和0.1的高斯噪声污染过的图像, 并且是分别经过40次和100次的迭代后的分割结果; 图 2d)、2e)是被方差分别为0.001和0.01的胡椒噪声污染过的图像, 并且是分别经过40次和60次的迭代后的分割结果。由最终的分割结果可以看出, 本文模型在对受强噪声污染的灰度不均匀图像进行分割时, 能够对强噪声具有很好的抑制能力。
![]() |
图 2 对噪声抑制能力的验证 |
实验3 对分割灰度不均匀图像速度和准确度的验证。
为充分说明本文模型在分割准确度和分割效率上的优势, 本实验将本文模型与LGDF模型进行对比。
1) 分割效率的验证
实验将以通用指标CPU时间和迭代次数作为衡量分割效率的客观指标。图 3第1行为4幅原始灰度不均匀图像, 第2、3行分别是LGDF模型和本文模型对4幅图的分割结果。为更加直观、具体说明收敛速度, 分别记录2组模型分割时的CPU时间和迭代次数, 如表 1所示。可以看出, 本文模型利用较少的CPU时间和迭代次数就能取得令人满意的分割结果。这主要是因为本文提出的自适应尺度算子能自适应地控制能量泛函的邻域范围, 极大促进了曲线的收敛速度。
![]() |
图 3 对分割灰度不均匀图像的准确度和效率的验证 |
2) 分割准确度的验证
由于本文提出的数据项能较准确地提取局部灰度信息, 所以本文模型在分割准确性方面要优于其他模型。为更加客观说明分割准确度, 将以Jaccard相似度[11]作为具体衡量指标。Jaccard定义为
![]() |
(30) |
式中:S1是模型的分割结果, S2是真实的分割结果。JS值越高表示分割准确性越高。2组模型分割图 3的JS值如表 2所示。
由表 2可知, 本文模型对灰度不均匀图像具有较高的分割准确度。
5 结论本文提出了一种基于信息熵的自适应尺度活动轮廓图像分割模型。利用最大后验概率和贝叶斯分布提出的新型数据项提高了模型对灰度不均匀图像的分割能力, 进而提高了分割准确度; 利用偏移场纠正后的图像构建的自适应尺度算子, 不但提高了模型对初始轮廓位置和噪声的鲁棒性, 而且提高了模型的分割效率。最后通过对灰度不均匀图像的分割实验及与其他经典模型的对比实验结果表明, 本文所提模型不但对初始轮廓位置和噪声具有较高的鲁棒性, 而且具有较高的分割效率和分割精度。
[1] | Zhang Y J. A Survey on Evaluation Methods for Image Segmentation[J]. Pattern Recognition, 1996, 29(8): 1335–1346. DOI:10.1016/0031-3203(95)00169-7 |
[2] | Li Z, Tang K, Cheng Y, et al. Transition Region-Based Single-Object Image Segmentation[J]. AEU-International Journal of Electronics and Communications, 2014, 68(12): 1214–1223. DOI:10.1016/j.aeue.2014.06.010 |
[3] | Caselles V, Kimmel R, Sapiro G. Geodesic Active Contours[J]. International Journal of Computer Vision, 1997, 22(1): 61–79. DOI:10.1023/A:1007979827043 |
[4] | Li C, Xu C, Gui C, et al. Level Set Evolution Without Re-Initialization:a New Variational Formulation[C]//2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2005:430-436 |
[5] | Gao X, Wang B, Tao D, et al. A Relay Level Set Method for Automatic Image Segmentation[J]. IEEE Trans on Systems, Man, and Cybernetics, Part B (Cybernetics), 2011, 41(2): 518–525. DOI:10.1109/TSMCB.2010.2065800 |
[6] | Chan T F, Vese L A. Active Contours Without Edges[J]. IEEE Trans on Image Processing, 2001, 10(2): 266–277. DOI:10.1109/83.902291 |
[7] | Wang L, He L, Mishra A, et al. Active Contours Driven by Local Gaussian Distribution Fitting Energy[J]. Signal Processing, 2009, 89(12): 2435–2447. DOI:10.1016/j.sigpro.2009.03.014 |
[8] | Wang X F, Huang D S, Xu H. An Efficient Local Chan-Vese Model for Image Segmentation[J]. Pattern Recognition, 2010, 43(3): 603–618. DOI:10.1016/j.patcog.2009.08.002 |
[9] | Li C, Huang R, Ding Z, et al. A Level Set Method for Image Segmentation in the Presence of Intensity Inhomogeneities with Application to MRI[J]. IEEE Trans on Image Processing, 2011, 20(7): 2007–2016. DOI:10.1109/TIP.2011.2146190 |
[10] | Shannon C E. A Mathematical Theory of Communication[J]. The Bell System Technical Journal, 1948, 27: 379–423. DOI:10.1002/bltj.1948.27.issue-3 |
[11] | Zhou S, Wang J, Zhang S, et al. Active Contour Model Based on Local and Global Intensity Information for Medical Image Segmentation[J]. Neurocomputing, 2016, 186: 107–118. DOI:10.1016/j.neucom.2015.12.073 |
2. School of Mechanical Engineering, Northwestern Polytechnical University, Xi'an 710072, China;
3. Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University, Xi'an 710049, China