合成孔径雷达(Synthetic Aperture Rader,SAR)是一种成像分辨率较高的雷达,其具有全天候、全天时、分辨率高以及穿透力强等特点,成为目前对地观测的重要手段[1]。然而,随着SAR图像成像技术的不断发展和成熟,SAR目标识别技术的研究成为国内外研究的热点。
SAR图像的有效特征提取和分类器的选择是SAR目标识别中的重要组成部分。目前,模式识别领域已相继提出了许多有效的特征提取方法和分类识别方法。如主成分分析法(Principal Component Analysis,PCA)[2]、Gabor滤波器方法[3]、局部二值模式法(Local Binary Patterns,LBP)[4]、支持向量机(Support Vector Machine,SVM)分类器[5]以及模板匹配识别[6]等。Gabor滤波器具有良好的多尺度特性和多方向特性,其对于目标图像,可提取不同尺度和方向上的有效细节特征,其在人脸识别领域[3]和高光谱图像分类领域[7]均有效提取了目标图像的显著特征,并获得了良好的识别效果。PCA是模式识别领域中一种比较经典的特征提取算法,对于2维图像,首先将2维数据按列转换成1维数据,再将其投影到新的坐标空间,因此,PCA算法因未考虑图像的有效空间信息而对识别效果有所影响。然而,LBP方法虽然算法简单,但由于其对图像的空间信息加以利用,因此获得了较好的识别效果[4]。
本文提出了一种基于Gabor滤波器和Three-Patch Local Binary Patterns(TPLBP)纹理特征的合成孔径雷达图像目标识别算法。一般而言,SAR目标识别在特征提取之前,需要进行图像预处理,进行噪声滤除和方位矫正等,而在本文中,首先,采用Gabor滤波器提取SAR目标图像在不同方向上的全局特征,由于Gabor滤波器对于图像的边缘敏感及其具有良好的方向特性,不仅有助于提取SAR目标和背景处的边缘信息,而且在不进行方位矫正的条件下通过提取不同方位的方向信息进行目标识别;然后,采用TPLBP算法对不同方向上Gabor滤波之后的图像进行局部纹理特征再提取,TPLBP算法相比于LBP算法,具有更强的纹理特征描述能力;最后,通过极限学习机(Extreme Learning Machine,ELM)分类器进行目标识别。实验结果表明该算法具有良好的识别效果。
2 Gabor滤波器和TPLBP特征提取 2.1 Gabor滤波器Gabor滤波器的频率和方向表达同人类视觉系统类似,其对于图像的边缘敏感,能够提供良好的方向选择特性,易于提取SAR目标与背景处的边缘信息及不同方位目标的方向信息。2维Gabor滤波器[3]是一个正弦平面波调制的高斯核函数。在2维坐标(x,y)系统中,Gabor滤波器包含1个实部和1个虚部,其定义如下:
g(x,y,λ,θ,Ψ,σ,γ)=exp(x′2+γ2y′22σ2)⋅exp(i(2πx′λ+ψ)) | (1) |
x′=xcosθ+ysinθ | (2) |
y′=−xsinθ+ycosθ | (3) |
其中λ表示正弦平面波的波长,它的值以像素为单位;θ表示Gabor核函数的方向,取值范围是0°~360°;Ψ是相位偏移,本文中设定该值为0和π/2; σ是高斯包络的标准差;γ表示空间纵横比,一般默认值为0.5; σ参数的值由λ和Gabor滤波器的半响应空间频率带宽bw来决定,其关系定义如下:
σ=λπ√ln222bw+12bw−1 | (4) |
LBP[8]是一种基于像素点的图像局部二值纹理特征描述器,其具有光照鲁棒性以及旋转不变性。本文中采用Three-Patch LBP[9]算法来描述图像的纹理特征,该算法是在LBP算法的基础上提出的一种基于模块化的图像空间特征信息描述器,它克服了LBP算法无法进行大范围邻域内的纹理特征描述的缺陷。由于SAR目标图像本身的特殊性,很难对特征点进行非常精确的定位,因此本文选用对特征点选择不是很敏感的TPLBP算法对SAR目标进行特征再提取。
首先,对于图像中的每个像素点,以该像素点为中心得到一个w×w大小的模块Cp,并且以该模块为中心,在距离半径为r的范围内,生成S个同等大小的模块(如图 1所示),每个模块的中心像素点均通过LBP算法生成相应的LBP码值。从S个模块中取得两个模块的中心像素点LBP码值与中心模块的中心像素点LBP码值进行相似度计算(如通过两中心像素点LBP码值差值的l2范数来计算相似度),α参数表示所取的两个模块在以r为半径的圆周范围内所间隔的模块数量。然后,对两模块与中心模块的中心像素点相似度进行差值计算,从而得到一组二进制串,将其加权计算得到相应的TPLBP码值,其定义如下[9]:
![]() | 图 1 Three-Patch LBP编码示意图(S=8,w=3,α=2) Fig. 1 The Three-Patch LBP code(S=8,w=3,α=2) |
TPLBPr,s,w,α(p)=s∑if(d(Ci−Cp)−d(Ci+αmodS,Cp)2i) | (5) |
其中,Ci和Ci+α mod S是r半径圆周内的两模块中心像素点的LBP码值,Cp是中心模块的中心像素点的LBP码值,函数d(·,·)表示计算两模块中心像素点的相似度,本文中相似度采用欧氏距离的计算方法,函数f的定义如下:
f(x)={1,x≥τ0,x<τ. | (6) |
其中,本文中设定t = 0.01。根据式(5)计算得到图像中每个像素点的TPLBP码值。然后,将整幅图像分割成非重叠同等大小的矩形窗(B×B),并计算每个矩形窗中各TPLBP码值的频率值,即TPLBP码值的统计直方图。最后,将每个矩形窗的直方图向量串联形成整幅图像的TPLBP特征向量。
3 ELM分类器ELM[10]是只包含1个隐含层和1个输出层的神经网络。其最显著的特点是,它的隐含层参数不需要进行调试,而是随机设定的,具有较强的泛化能力。假设ELM的隐含层包含L个节点,则其输出函数如下:
fL(x)=L∑i=1bih(wi,bi,x)=h(x)b=y | (7) |
其中,x∈Rd,y∈Rc,b表示隐含层的L个节点与输出层之间的权重,h(x)表示L个节点与输入x之间的关系,它是一个非线性的激励函数(如sigmoid函数),实际上,它的作用是将d维数据映射到L维数据空间中,wi表示隐含层第i个节点与输入层的连接权重,bi表示隐含层第i个节点的偏差。式(7)可以简化为:
Hb=Y | (8) |
对于给定任意n个样本,则有
Y=[y1;⋯;yn]∈Rn×c,b=[β1;⋯;βn]∈RL×c | (9) |
H可以写成如下形式:
H=[h(x1)⋮h(xn)]=(h(w1,x1,b1)…h(wL,x1,bL)⋮⋱⋮h(w1,xn,b1)⋯h(wL,xn,bL)) | (10) |
为了提高该神经网络的泛化能力,ELM在最小化训练误差的同时,将输出权重的范数也进行最小化,其表达式如下:
Minimize:‖Hb−Y‖2,‖b‖2 | (11) |
可以求取其解为:
b=H++Y | (12) |
其中,H+是H矩阵Moore-Penrose广义逆,并且H+ = HT(HHT)-1。
为了更好地提高算法稳定性和泛化能力,式(12)被重新定义成如下形式[10]:
b=HT(IC+HHT)−1Y | (13) |
其中,C是一个回归系数。
文献[11]在ELM的基础上,又提出了一种基于核函数的ELM算法。该算法是用核函数来隐藏ELM原有的激励函数H,从而更好地提高了算法的泛化能力。对于某一样本xi,其输出函数表达式如下:
fL(xi)=[K(xi,x1)⋮K(xi,xn)]T(IC+K)−1Y | (14) |
本文中采用了核函数的ELM算法进行SAR图像的目标识别,并选择径向基核函数(RBF)作为核函数。
4 基于Gabor滤波器和TPLBP特征提取的SAR图像目标识别过程本文提出的基于Gabor滤波器和TPLBP特征提取的SAR图像目标识别过程由两个部分组成,其流程如图 2所示。
![]() | 图 2 基于Gabor滤波器和TPLBP特征提取的SAR图像目标识别方法流程图 Fig. 2 The process of the SAR target recognition method based on Gabor filter and TPLBP feature extraction |
(1) 特征提取:首先,对SAR图像在不同方向上进行Gabor滤波,提取SAR图像在不同方向上的纹理特征,如图 3所示。其中,图 3(a)是17°俯仰角下BMP2-9563中的一张原目标图像,图 3(b)-图 3(i)分别为8个不同方向上[0,π/8,π/4,3p/8,π/2,5π/8,3π/4,7π/8]Gabor滤波之后的图像,不难看出,由于Gabor滤波器对于边缘敏感,Gabor滤波之后的图像中,SAR目标与背景之间灰度值差异显著(目标和背景灰度分离),使SAR目标在图像中更加清晰,并且在不同方向上的Gabor滤波图像具有很强的方向性。然后,将Gabor滤波之后的每张图像分成互不重叠同等大小的矩形块,对每个矩形块进行TPLBP编码,并统计TPLBP码值的直方图,将直方图串接形成每张SAR图像的纹理特征描述。由于TPLBP算法是在LBP算法的基础上描述了领域模块LBP之间的相互关系,因此其具有更强的纹理特征描述能力,能够更好地描述SAR目标图像的局部纹理特征。
![]() | 图 3 Gabor滤波之后的图像(以17°俯仰角的SAR图像为例,Gabor滤波器取8个方向) Fig. 3 The Gabor filtered images (take 17° angle for example,Gabor filter is set with eight directions) |
(2)分类过程:采用ELM分类器对所提取的有效目标特征进行分类并输出识别结果。
5 实验结果及分析 5.1 实验数据与设置为了验证本文算法的有效性,本文所使用的数据[12]是MSTAR公开数据集,该数据的分辨率为0.3 m×0.3 m,图像大小为128×128像素。本文所用数据集包含俯仰角为17°和15°的坦克、战车、装甲车等3大类、7种型号目标,具体如下:BMP2(包含SN_9563,SN_9566和SN_C21),BTR70(包含SN_C71),T72(包含SN_132,SN_812和SN_S7),每类目标的方位覆盖范围均为0°~360°。
本文选择17°俯仰角的目标图像作为训练样本,选择15°俯仰角的目标图像作为测试样本。为了更好地验证算法的有效性,本文设置两种实验场景:3类目标识别和7种不同编号识别,其训练样本和测试样本的样本数量设置如表 1,表 2所示。
![]() | 表 1 实验场景Ⅰ的训练样本和测试样本设置 Tab. 1 The training samples and test samples configuration of experiment Ⅰ |
![]() | 表 2 实验场景Ⅱ的训练样本和测试样本设置 Tab. 2 The training samples and test samples configuration of experiment Ⅱ |
实验场景Ⅰ:3类目标识别
在该实验场景中,训练样本只包含每一类目标的某一种编号,测试样本包含每一类目标的所有编号,因此,该场景设置主要验证本文算法对不同编号的同一类目标的识别效果。
实验场景Ⅱ:7种不同编号识别
在该实验场景中,训练样本和测试样本均包含每一类目标的所有编号,因此,该场景设置主要验证本文算法对不同编号目标的识别效果。
5.2 不同算法参数对识别效果的影响本节选择实验场景Ⅰ,研究Gabor滤波器和TPLBP特征提取算法的不同参数对识别效果的影响,具体如下:
首先对SAR图像在各个方向上进行Gabor滤波,然后对不同方向上Gabor滤波之后的图像进行TPLBP局部纹理特征提取。在Gabor滤波过程中,本实验研究了Gabor滤波器的半响应空间频率带宽bw和Gabor核函数方向θ对识别效果的影响。实验中,分别设定两组Gabor滤波器参数:(1)bw = 4,θ取6个方向[0,π/6,π/3,π/2,2π/3,5π/6]; (2)bw= 5,θ取8个方向[0,π/8,π/4,3π/8,π/2,5π/8,3π/4,7π/8]。
其次,在TPLBP算法提取局部纹理特征方面,本实验研究了距离半径r和矩形窗口大小(B×B)对识别效果的影响。实验中,分别设定r取值为[4, 6, 8, 10, 12, 14, 16],B取值为[20, 40, 60, 80],另外,固定S取值为8,w取值为3,α取值为1。实验中的分类过程均采用核函数的ELM算法。实验结果如表 3所示。
![]() | 表 3 Gabor滤波器bw = 4,θ取6个方向情况下的识别准确率(%) Tab. 3 The recognition accuracy with bw= 4,θ in six directions (%) |
由表 3和表 4可以看出,Gabor滤波器和TPLBP局部特征提取达到识别效果最优时(约为94.80%)的参数设置是:Gabor滤波器的bw= 4,θ取6个方向[0,π/6,π/3,π/2,2π/3,5π/6]; TPLBP局部特征提取时,r = 12,B = 20。
![]() | 表 4 Gabor滤波器bw= 5,θ取8个方向情况下的识别准确率(%) Tab. 4 The recognition accuracy with bw= 5,θ in eight dirctions (%) |
本节选择实验场景Ⅰ和实验场景Ⅱ,研究不同大小的训练样本对识别效果的影响。Gabor滤波器和TPLBP局部特征提取的参数均选择上一节的最优参数:bw= 4,θ取6个方向[0,π/6,π/3,π/2,2π/3,5π/6],r = 12,B = 20,训练样本大小m取[80, 100, 120, 140, 160, 180, 200, 220]。本实验中所用的训练样本均从训练样本库中随机选取,因此,为了减小随机操作对识别效果的影响,每组不同大小的训练样本随机选取10次,最后将10次识别效果进行平均作为最终的识别效果。实验结果如表 4所示。
由表 5和表 6可以看出,随着训练样本数量的增加,SAR图像目标识别效果趋于更优。其中,BTR70目标的识别效果最为显著,可以达到100%,因为该类目标仅存在一种编号(BTR70-C71),不受其他同类目标不同编号的影响。此外,当训练样本量较小时,该算法对于实验场景Ⅰ的识别效果优于实验场景Ⅱ的识别效果,而当训练样本量较大时,该算法对于实验场景Ⅱ的识别效果优于实验场景Ⅰ的识别效果。因此,当训练样本量较小时,本文算法更利于对某类的目标进行识别,而当训练样本量较大时,本文算法更利于对不同编号的目标进行识别。
![]() | 表 5 在实验场景Ⅰ下,不同大小的训练样本的识别准确率(%) Tab. 5 The recognition accuracy of different training samples in Experiment set Ⅰ (%) |
![]() | 表 6 在实验场景Ⅱ下,不同大小的训练样本的识别准确率(%) Tab. 6 The recognition accuracy of different training samples in Experiment set Ⅱ (%) |
为了验证本文算法的识别效果,分别进行以下两组对比实验。
(1) 与其他特征提取算法对比
作为对比,本实验将所提出的算法与其他特征提取算法进行对比。该实验选择实验场景Ⅰ,特征提取算法均选择各自的最优参数,目标识别过程均采用核函数的ELM算法。对比实验结果如图 4所示。
![]() | 图 4 本文算法与其他特征提取算法的目标识别效果对比 Fig. 4 The comparison of the method and other feature extraction method in recognition perfomance |
由图 4可以看出,本文所提出的特征提取算法的目标识别准确率明显高于其他特征提取算法。Gabor滤波器提取的是SAR图像的全局特征,而LBP算法和TPLBP算法提取的是SAR图像的局部纹理特征,因此,在全局特征的基础上提取局部纹理特征可以获得更加鲁棒的SAR图像特征,从而,Gabor+LBP算法的识别效果优于简单的LBP局部纹理特征算法的识别效果。此外,本文算法的识别准确率明显高于一般的线性特征提取(PCA)算法。
(2) 与其他分类算法对比
作为对比,本实验将所提出的算法与其他分类算法进行对比。SRC是一种基于稀疏表达的分类方法,SVM是目前应用较广的一种经典分类方法,这两种方法均在实验场景Ⅰ的情况下进行实验,为了体现本文特征提取算法对SAR目标识别的有利影响,均不对SAR目标图像进行去噪等预处理过程。在分类过程之前,均采用Gabor滤波、TPLBP特征提取方法。文献[13]首先利用傅里叶描述子表示目标轮廓和阴影轮廓,然后用基于最大相关法进行模板匹配,最后用基于串接的融合器进行融合识别。以上其他分类算法与本文算法的目标识别效果对比如表 7所示。
![]() | 表 7 本文算法与其他分类算法的识别效果对比 Tab. 7 The recognition performance of the method and other classification method |
由表 7可以看出,本文算法的识别准确率明显优于只提取目标轮廓特征的模板匹配分类算法和应用较广的SVM算法。虽然,本文算法的识别准确率与SRC算法相差不大,但其算法运行效率远远优于SRC算法。
6 结论本文提出了一种基于Gabor滤波器和TPLBP特征提取的SAR图像目标识别算法。利用Gabor滤波器提取SAR图像的全局特征,在此基础上,利用TPLBP算法提取SAR图像的局部纹理特征,最后利用核函数的ELM分类器进行目标识别。本文算法针对基于MSTAR数据库中的3类SAR目标图像进行了实验分析,实验结果表明,本文所提出的算法对于SAR目标的识别效果优于其他一些特征提取算法(PCA,Gabor+LBP,LBP)和其他一些分类算法(SRC、模板匹配、SVM)。此外,当训练样本量较小时,本文算法针对某类目标的识别效果更优,而当训练样本量较大时,本文算法针对不同编号的目标识别效果更优。
[1] | 丁军, 刘宏伟, 王英华. 基于非负稀疏表示的SAR图像目标识别方法[J]. 电子与信息学报, 2014, 36(9): 2194-2200. Ding Jun, Liu Hong-wei, and Wang Ying-hua. SAR image target recognition based on non-negative sparse representation[J]. Journal of Electronics & Information Technology, 2014, 36(9): 2194-2200.( ![]() |
[2] | 梁胜杰, 张志华, 崔立林, 等. 基于主成分分析与核独立成分分析的降维方法[J]. 系统工程与电子技术, 2011, 33(9): 2144-2148. Liang Sheng-jie, Zhang Zhi-hua, Cui Li-lin, et al. A reduced dimension method based on PCA and KICA[J]. Systems Engineering and Electronics, 2011, 33(9): 2144-2148.( ![]() |
[3] | 周家锐, 纪震, 沈琳琳, 等. 基于Gabor小波与Memetic算法的人脸识别方法[J]. 电子学报, 2012, 40(4): 642-646. Zhou Jia-rui, Ji Zhen, Shen Lin-lin, et al. Face recognition using Gabor wavelets and Memetic algorithm[J]. Acta Electronica Sinica, 2012, 40(4): 642-646.( ![]() |
[4] | 高涛, 何明一, 戴玉超, 等. 多级LBP直方图序列特征的人脸识别[J]. 中国图象图形学报, 2009, 14(2): 202-207. Gao Tao, He Ming-yi, Dai Yu-chao, et al. Face recognition using multi-level histogram sequence local binary pattern[J]. Journal of Image and Graphics, 2009, 14(2): 202-207.( ![]() |
[5] | Patel V, Nasraba N, and Chellappa R. Sparsity-motivated automatic target recognition[J]. Applied Optics, 2011, 50(10): 1425-1433.(![]() |
[6] | Novak L M, Owirka G J, and Brower W S. Performance of 10-and 20-target MSE classification[J]. IEEE Transactions on Aerospace and Electronic Systems, 2000, 36(4): 1279-1289.(![]() |
[7] | Li W and Du Q. Gabor-Filtering based nearest regularized subspace for hyperspectral image classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(4): 1012-1022.(![]() |
[8] | Ojala T, Pietikainen M, and Maenpaa T. Multiresolution gray-scale and rotation invariant texture classification with local binary pattern[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.(![]() |
[9] | Lior W, Tal H, and Yaniv T. Descriptor based methods in the wild[C]. Real-Life Images Workshop at the European Conference on Computer Vision (ECCV), Marseille, France, 2008: 1-14.(![]() |
[10] | 张文博, 姬红兵. 融合极限学习机[J]. 电子与信息学报, 2013, 35(11): 2728-2732. Zhang Wen-bo and Ji Hong-bing. Fusion of extreme learning machines[J]. Journal of Electronics & Information Technology, 2013, 35(11): 2728-2732.(![]() |
[11] | Zhou Y, Peng J, and Chen C. Extreme learning machine with composite kernels for hyperspectral image classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6): 2351-2360.(![]() |
[12] | Moving and Stationary Target Acquisition and Recognition (MSTAR) Public Dataset[OL]. https://www.sdms.afrl.af.mil/datasets/mstar/.(![]() |
[13] | 尹奎英, 金林, 李成, 等. 融合目标轮廓和阴影轮廓的SAR 图像目标识别[J]. 空军工程大学学报(自然科学版), 2011, 12(1): 24-28. Yin Kui-ying, Jin Lin, Li Cheng, et al. An SAR ATR based on fusion of target contour and shadow contour[J]. Journal of Air Force Engineer University (Natural Science Edition), 2011, 12(1): 24-28.( ![]() |