由于其全天时全天候的工作能力,合成孔径雷达(synthetic aperture radar,SAR)已经成为军事、民用中不可或缺的对地侦测手段,在国防、环境和灾害侦察监视等领域起着十分重要的作用。且随着SAR图像分辨率的提高,机动目标等成像尺寸、形状、边缘变化等细节信息得到丰富的表达。但由于相干成像原理,SAR成像时伴随的斑点噪声、自然杂波和人造杂波降低了SAR图像中兴趣目标的分辨能力。因而,如何有效检测目标一直是SAR图像解译工作的一个重点和难点[1, 2]。
目前常见的SAR目标检测方法中,基于统计的检测方法如基于灰度信息的双参数恒虚警率(constant false alarm rate,CFAR)算法[3]等多用于背景比较简单的SAR图像中,如海洋背景的SAR图像中舰船检测等[4]。在复杂背景下的SAR目标检测多使用基于视觉的多特征联合方法,常用的目标特征有亮度、边缘、形状、尺寸、纹理、局部、全局等。如基于视觉注意模型的SAR目标检测和基于目标形态特征的SAR目标检测方法等[5]。在复杂场景下,基于视觉特征的检测方法与基于统计的SAR目标检测方法相比具有较明显的优势。SAR图像中的机动目标的特征主要包含面积、纹理、形状等信息,其中纹理、形状主要由具有一定分布规律的不同强度边缘构成,而面积信息则是强度较大的边缘所围成的封闭区域,所以SAR目标的边缘信息可以作为目标检测的一种有效特征。然而人眼观察到现实世界是复杂的,Marr[6]从神经生理学和心理物理学出发,指出人眼对图像进行视觉前期处理中有多个尺度的算子对图像作卷积,通过多个尺度变化结果的组合提高定位精度,减少噪声干扰。同理,SAR图像目标特征的分析主要依赖于目标不同尺度的边缘信息,即多尺度的统一,只在单一尺度下进行特征分析和提取,势必会丢失目标的部分信息。
根据视觉特征原理,本文在图像多尺度下提取目标性能较优SIFT(scale invariant feature transform,SIFT)特征,兼顾目标全局和细节信息,得到区分目标与非目标的特征向量,并加以分类。同时,SAR图像中存在相同尺度和不同尺度的自相似性冗余结构,对目标多尺度特征进行去冗余也是一项重要工作。
1 多尺度SIFT特征SAR图像在成像时,受干涉影响,斑点噪声较多,尤其单一尺度的SAR图像特征提取受噪声影响较大,同时对于较小机动目标,单一尺度下其目标且边界变化、目标定位等描述并不理想。根据人眼视觉处理方式采用多尺度方式提取目标边缘信息,小尺度可以较好体现SAR图像精细的纹理,且边缘信息完整;大尺度倾向体现于图像轮廓,具有可信的边缘特征。且近年的研究表明SAR图像中的斑点噪声主要存在于原始图像,在多尺度的第2层中的影响可以忽略[8]。所以对SAR图像进行多尺度特征提取,充分利用不同尺度下的SAR图像间的相依关系,既能抑制SAR图像相干斑噪声,又能保证纹理变化及定位的精度。本文多尺度特征提取包括对同一窗口图像切片的多尺度拓延和同一尺度下多种子点组数的特征描述。一般情况下,多尺度特征维度较高,且存在尺度间的自相似性结构冗余,包括相同尺度的冗余和不同尺度的冗余,所以需要对多尺度特征向量进行去冗余、降维处理。具体过程如图 1所示。
1.1 多尺度SIFT特征提取多尺度的实现主要有2种途径:将多尺寸窗口进行空间邻域压缩为同一尺寸后进行描述和对同一尺寸窗口进行多尺度多分辨率拓延。由于机动目标在SAR图像中与背景是独立存在的,背景信息并不能为目标的检测提供有意义的区分信息,所以本文选取对同一尺寸图像切片,通过高斯尺度空间,在保持图像分辨率不变的情况下,对图像进行连续变尺度滤波实现SAR图像多尺度延拓,同时可以保证层与层之间像素点之间具有一定的统计关系。具体如下:
其中,多尺度图像的第1层为原始SAR图像,第 p层图像Ip以图像Y与高斯核Bp的卷积表示,Bp为标准差为(p=2,…,P)的高斯核,P 为高斯尺度的总层数。得到不同尺度空间下的图像,在尺度从小到大的变化过程中,不会产生新的结构。通过高斯滤波得到的尺度空间表示了图像在不同尺度下的低频信号,而代表边缘以及角点等特征的高频信号丢失。
对于多尺度中各尺度的图像特征描述采用关键点描述方式,目前关键点的特征描述算子有SIFT算子、Moravec算子、Harris算子、Schmid算子等。通过对比分析各种点特征描述子的性能得出,SIFT算子是一个较优的选择,可以准确描述目标边界纹理变化[9]。SIFT特征描述是对种子点的梯度方向和幅值的描述,在计算SIFT描述子时,对整个区域高斯加权,同时采用双线性插值的方法,对每个目标区域的种子点均匀采样。在计算梯度方向直方图时,每个像素点的梯度以一定的权重划分到邻近的种子点上,梯度方向和梯度幅值分别以箭头方向和箭头长度表示,以每个种子点为中心对邻近像素计算8个方向的梯度直方图,并将其进行累加得到该种子点的描述。
对潜在目标进行多尺度几何变换的同时,在进行SIFT特征描述的过程中,可以通过多组种子点的SIFT描述,对不同尺度下的图像进行区分,可以充分体现不同尺度图像的不同特点。SIFT特征描述中,种子点的个数决定特征描述的精确性和稳健性,即种子点数目越多,对目标特征的描述越准确。本文采用4*4和8*8的2组种子点对目标图像SIFT特征进行描述。首先对每组种子点分别计算,获得2组不同的特征描述;对第2组8*8的种子点描述进行划分,分为2*2的4个子区域,保证每个子区域的维度和第1组种子点特征描述维度是一致的。这样,目标被描述为N*5的特征矩阵,其中N为第1组种子点的特征维数。通过多组种子点的选取和划分得到的特征描述在稳健性和精确性上都得到保证,同时第2组种子点的区域划分,相当于对原目标图像进行区分解后局部区域进行SIFT特征提取,使得目标特征中即包括全局信息又有对局部信息的描述。
目标SIFT特征被描述为维数为D的特征空间X,X=[x1,…,xl×p,…,xM]T∈RM×D,其中M=L×P;l=1…L;p=1…P。P和L 分别代表目标的多尺度层数和种子点区域组数。
1.2 特征降维依照文中方法得到的多尺度SIFT特征维度较高,且存在相同尺度的冗余和不同尺度的自相似性冗余结构,不利于计算和检测。对于1组4*4种子点,目标的SIFT特征描述为128维。 邻近种子点由于在计算梯度方向直方图时,包含由相同像素点贡献的不同权重的梯度,相关性比较大;并且在大尺度下,邻近边界的种子点边界零分量较多。所以如图 1中所示的初始SIFT特征,纵向种子点描述符之间存在较大冗余,具有明显的稀疏性。对多尺度特征通过简单而高效的K-means方法进行聚类,在聚类时使用 L2范数用作距离测度,得到K个聚类中心V=[v1,…,vk]T,用U=[u1,…,uM]T表示每个样本的特征系数。则目标多尺度SIFT特征X=[x1,…,xl×p,…,xM]T∈RM×D可以描述为:
为了方便求解将其转化为求解的过程:
该过程实质上是通过压缩掉零分量,量化非零分量,减少种子点间像素梯度描述的冗余,得到压缩后的稀疏分解系数。具体为:通过目标样本和非目标样本的SIFT多尺度特征训练得到字典V,在稀疏编码过程中,潜在目标切片的多尺度特征X通过固定的字典V计算得到新的特征表示方式,记为U=[u1,…,uM]T∈RM×Dn,其中Dn为16个种子点描述的新维度。相对于其他降维方式,稀疏模型对目标特征去冗余具有特征降质小的优势,实现降维的同时,保留相对完好特征的信息。
通过稀疏编码对多尺度SIFT特征进行纵向降维后,横向不同尺度之间的描述冗余也不可忽视。通过稀疏模型对图像特征U,(n-1)*5+1~(p-1)*5+5列为尺度p 上的特征向量,而第1列为4*4种子点描述所得,后4列为8*8种子点描述所得。在尺度从小到大的变化过程中,不会产生新的结构,并且代表边缘以及角点等特征的细节信息丢失。着重描述图像细节特征的8*8种子点特征描述随着尺度的变大,冗余也会快速增大,可以提取这些种子点描述的统计信息代替原有种子点描述。由于第1层为原始SAR图像切片,保留细节最为完整,所以对尺度间降冗余时,保留第1层所有特征,第p(p>1)层特征的第1列相对其他4列能比较完整描述图像切片的整体轮廓,作为每一层的代表保留下来,其他列则可以进行统计:
由于图像尺寸相同,不同尺度所包含信息含量不同,在特征描述中,所占比例不同也应该有所区别,可以根据(4)式选择不同的统计方式代替原有特征描述,实现横向降维的目的。
2 检测过程本文目标检测过程如图 2所示,首先对图像进行兴趣区域检测,确定SAR图像中潜在目标位置,获取潜在目标图像;通过SIFT特征描述、降维获得潜在目标的多尺度特征;通过鉴别器对代表潜在目标特征的尺度特征进行鉴别,将其分为兴趣目标和非兴趣目标,并进行标记。目标鉴别所使用的鉴别器是通过对目标样本和非目标样本的多尺度SIFT特征进行训练得到。
2.1 潜在目标获取兴趣区域检测是在原图中检测出包含兴趣目标的局部区域,每个局部区域代表每一个潜在目标,是特征鉴别的前提。由于目标具有金属特性构成角反射器,在SAR图像中具有较高的幅度值,有特定范围且独立分布,与道路、草地、树林等反射强度较弱的背景区域有较明显的灰度对比度,而与一些人造建筑杂波、斑点噪声等在亮度方面存在很大相似性。由于第1步旨在检测出潜在目标点,对于大幅SAR图像使用进行高亮像素查找可以通过全局CFAR算法实现,该方法在基于灰度的目标检测中简单、快速、有效,本文使用全局 CFAR算法的结果为潜在目标位置点。
全局CFAR原理为:由于目标像素在整幅图像中所占比例很小,对于杂波统计分布的影响可以忽略不计,在双参数CFAR检测的基础上,将背景杂波区扩展至整幅图像,进而求取全局阈值 Tg,然后将所有像素l与Tg进行比较,即可得到潜在目标矩阵,记为V ,则
式中,M、N 是SAR图像的尺寸。SAR图像中获得的潜在目标矩阵,是由单个独立像素或连续多个像素构成的独立局部区域组成。全局CFAR检测结果作为目标鉴别器的输入仍存在一定冗余,其中包括斑点噪声和其他非目标区域,可以进一步优化:首先去除明显和目标尺寸有出入局部区域,将其剩余的具有一定面积的局部区域作为潜在目标。但索引矩阵无需记录潜在目标的每个像素点,选取其中一个点代表一个潜在目标的位置即可,对代表潜在目标的局部区域进行求取质心运算,最终得到一个优化过的质心索引矩阵。以质心为中心截取特定大小的兴趣区域作为潜在目标。 2.2 SVM分类检测潜在目标多尺度特征提取是对通过全局CFAR算法获取的潜在目标按索引矩阵索引顺序对其进行多尺度变化,进行SIFT描述,构成多尺度特征组群。构造该特征组群的目的是对潜在目标进行目标与非目标鉴别,所以鉴别器的选择也尤为重要,在鉴别效率、高维度和多输入数据处理能力上都要满足一定要求。SVM是一种有效、简单的分类方法,它是建立在统计学习理论上的机器学习技术,使用结构风险最小化代替经验风险最小化原则,尤其在样本数量有限的情况下,SVM表现出较好的泛化性能[10]。同时在把非线性问题转化为线性问题的时候利用了核函数的思想,从而降低了输入空间的维数和算法复杂度,在处理高维情况下的分类问题上具有明显的优势。对区域检测的结果进行多尺度SIFT描述构造特征向量,旨在鉴别出机动目标和非机动目标两类,本质上也属于小样本、非线性模式识别问题。本文采用线性SVM对获取的潜在目标多尺度特征进行分类,取得了较好的效果。
3 实验与分析本文实验数据采用1组公开的瑞典国防研究机构的机载CARABAS-ⅡSAR系统获取的VHF-band SAR图像。该图像场景是位于瑞典北部的军事靶场,包括TGB11、TGB30和TGB40共25辆装甲车。图 3所示为其中1幅分辨率1 m,尺寸为3 000*2 000的SAR图像。从图中可以看出,除25个目标外,原SAR图像还包括较多高亮非目标区域,并且有些在面积和形状上都与目标较为接近,并且斑点噪声特别突出。
3.1 参数选取检测过程中,对潜在目标图像的多尺度SIFT特征进行提取时,尺度因子的选取和多尺度层数的确定影响最终的检测结果。本文通过对多尺度变化时尺度间的退化关系以及大尺度下图像对SIFT特征可分离性的影响对参数选择进行确定,以获取较优效果。
3.1.1 尺度因子多尺度构造过程中,尺度因子过小,尺度间图像差异较小,需要多层尺度图像才能进行目标的完整性描述;尺度因子过大,相邻尺度图像间的差异较大,会丢失相应尺度下的目标信息。本文引入多尺度的目的是随着高斯尺度空间尺度的增加,目标的轮廓信息要明确,细节信息丢失,即切片图像随着尺度的增加呈现出退化现象。用第 k级图像的灰度均值、方差、直方图信息熵量化描述fk与第1级相对量化描述f1的比值,作为图像退化率,记为D:
退化率大于1时,尺度空间图像的变化不符合本文要求,选取使得退化率小于1的尺度因子,但是层与层之间不能退化快过,以免丢失相应的目标信息。根据图 4,本文选取尺度因子为0.8,既能满足图像退化得出明确的边缘信息,又不至于退化过快,使得有用层数过小,丢失中间信息。
3.1.2 层数选择高斯核 Bp=2pσ中σ确定为0.8后,对尺度层数P 进行选择,如图 5所示,虽然大尺度可以提现目标的确定性边缘信息,但随着高斯多尺度的逐级分解,切片图像的退化会加剧,尺度过大时,目标与非目标的可分离性降低。如果尺度空间层数控制不合适,对过大尺度图像提取SIFT特征反而会降低分类器的分类性能,增加特征维度,不利于目标检测。
本文定义 Sxy为目标类X和非目标类Y的分离性测度值,记为:
式中,dxy表示类X和类Y的聚类中心的类间方差,D(x) 为聚类中心的类内方差。提取特征时采取的尺度空间总层数和目标与非目标类的分离性测度关系如图 6所示。Sxy值越大,2类特征的可分离性越强,可以看出当层数大于4层时,随着层数的增加目标与非目标的可分离性并没有增强,反而加大了特征维度,本文采取尺度层数P=4 进行多尺度特征提取。
3.2 测试结果采用本文方法与基于灰度值检测的全局-双参CFAR方法、单一尺度SIFT方法和多尺度SIFT-PCA方法[11]对比结果如表 1所示。对比方法具体为:全局-双参CFAR检测,首先对原SAR图像进行全局CFAR检测,提取潜在目标质心,根据质心索引对相应位置检测点进行双参CFAR局部检测;单一尺度SIFT方法,提取潜在目标原图的SIFT特征后对其进行稀疏编码,降维后再按本文方法进行鉴别;多尺度SIFT-PCA法,根据本文多尺度SIFT方法进行特征提取,采用PCA降维保留特征主要成分,再进行SVM分类。
算法 | 检测目标数 | 实际数 | 虚警数 | 漏检数 | 检测精度/% |
全局-改进双参CFAR | 33 | 25 | 8 | 0 | 75.8 |
单尺度SIFT | 29 | 24 | 5 | 1 | 80 |
多尺度SIFT-PCA | 27 | 25 | 2 | 0 | 92.6 |
本文方法 | 26 | 25 | 1 | 0 | 96.2 |
注:检查精度=实际数/(检查目标数+漏检数)。 | |||||
在特征描述方式上,采用经典双参CFAR算法进行检测只考虑SAR图像中目标的灰度信息,适用于背景相对简单的场景。本文SAR图像背景较为复杂,采用CFAR方法只能找到包括目标在内的高亮区域,虽然通过高亮区域面积可以对过大或过小的杂波进行剔除,但是在非目标面积与目标面积较为接近时无法进行区分。单尺度SIFT特征提取方法在检查中丢失了一些视觉信息,会造成图像信息的不完整,只在原图上进行SIFT特征提取漏检情况比较严重。根据视觉原理,采用本文多尺度高斯空间和多组种子点组合的方式实现多尺度SIFT特征的提取,既包括潜在目标轮廓特征又可以很好地对边缘细节进行描述,相对于单一的灰度特征和单一尺度下SIFT特征在复杂背景下进行检测鉴别具有较好的效果。
在降维方式上,对图像进行SIFT特征描述后采用PCA方法降维,将其输出固定到一定维数,保留SIFT特征中的主要成分,但丢失了一些细节信息,目标与非目标的细节差异性无法体现出来。而目标与非目标主要差异体现在边界纹理变化等细节信息上,采用稀疏模型对目标特征去冗余具有特征降质小的优势,实现降维的同时,可以保留相对完好特征的信息。同时对大尺度的SIFT特征进行统计降维,可以根据目标大尺度图像的特点,进行降维,灵活并且可以更好地满足多尺度图像间的关系。
4 结 论现实世界是多尺度的统一,图像处理如果只在单一尺度下进行势必会造成信息丢失。本文方法根据视觉原理,通过高斯多尺度空间和多组种子点获得潜在目标的多尺度SIFT特征,并通过稀疏编码和统计方法对其进行纵向和横向降维。同时在尺度因子和多尺度层数的选择上,通过公式量化对比的方式选择出目标特征描述的最优参数。通过对包含装甲车的SAR图像进行试验,结果表明本文方法与其他测试方法相比具有明显优势,同时本文方法可以运用到坦克、舰船等多种类型的兴趣目标检测中。
[1] | 李开明, 张群, 罗迎. 地面车辆目标识别研究综述[J]. 电子学报, 2014, 42(3):538-546 Li Kaiming, Zhang Qun, Luo Ying. Review of Ground Vehicles Recognition[J]. Acta Electronica Sinica, 2014, 42(3):538-546 (in Chinese) |
Cited By in Cnki (1) | Click to display the text | |
[2] | 王彦情, 马雷, 田原. 光学遥感图像舰船目标检测与识别综述[J]. 自动化学报, 2011, 37(9):1029-1039 Wang Yanqing, Ma Lei, Tian Yuan. State-of-the-Art of Ship Detection and Recognition in Optical Remotely Sensed Imagery[J]. Acta Automatica Sinica, 2011, 37(9):1029-1039 (in Chinese) |
Cited By in Cnki (27) | Click to display the text | |
[3] | 赵明波, 何峻, 付强. SAR图像CFAR检测的快速算法综述[J]. 自动化学报, 2012, 38(12):1885-1895 Zhao Mingbo, He Jun, Fu Qiang. Survey on Fast CFAR Detection Algorithms for SAR Image Targets[J]. Acta Automatica Sinica, 2012, 38(12):1885-1895 (in Chinese) |
Cited By in Cnki (4) | Click to display the text | |
[4] | 林旭, 洪峻, 孙显, 等. 一种基于自适应背景杂波模型的宽幅SAR图像CFAR舰船检测算法[J]. 遥感技术与应用, 2014, 29(1):75-81 Lin Xu, Hong Jun, Sun Xian, et al. New CFAR Ship Detection Algorithm Based on Adaptive Background Clutter Model in Wide Swatch SAR Images[J]. Remote Sensing Technology and Application, 2014, 29(1):75-81 (in Chinese) |
Cited By in Cnki (0) | Click to display the text | |
[5] | Shuo L, Caoe Z. SAR Image Target Detection in Complex Environments Based on Improved Visual Attention Algorithm[J]. Eurasip Journal on Wireless Communications and Networking, 2014, 2014(1):2-8 |
Click to display the text | |
[6] | Marr D. A Compututational Investigation into the Human Representation and Processing of Visual Information[M]. Cambridge, USA, MIT Press, 1998 |
[7] | Suri S, Schwind P, Uhl J, et al. Modifications in the SIFT Operator for Effective SAR Image Matching[J]. Image Data Fusion, 2010, 1(3):243-256 |
Click to display the text | |
[8] | Wang S, You H, Fu K. BFSIFT:A Novel Method to Find Feature Matches for SAR Image Registration[J]. IEEE Trans on Geosci Remote Sense, 2012, 9(4):649-653 |
Click to display the text | |
[9] | Yang J, Yu K, Gong Y, et al. Linear Spatial Pyramid Matching Using Aparse Coding for Image Classification[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2009 |
Click to display the text | |
[10] | Liu S, Hu S, Xiao Y, et al. SAR Image Edge Detection Using Sparse Representation and LS-SVM[J]. Journal of Information & Computational Science, 2014, 11(11):3941-3947 |
Click to display the text | |
[11] | Zhao J, Guo H, Wu J. Attribute Reduction for SIFT Local Descriptors Using PCA and CAIM[C]//Proceedings of 2014 7th International Congress on Image and Signal Processing, 2015:269-274 |
Click to display the text |