An Unsupervised PolSAR Image Classification Algorithm Based on Tensor Product Graph Diffusion
-
摘要: 针对相似度表达的困难性以及极化SAR图像中固有的相干斑噪声问题,该文提出了一种基于张量积(TPG)扩散的非监督极化SAR图像地物分类算法。张量积扩散一般用于光学图像的分割或检索,目前研究表明,其已可用于极化SAR(PolSAR)图像地物分类。基于张量积扩散可以稳健地度量数据点之间的测地线距离,因此能够更好地挖掘数据点之间内在的相似度信息。首先,将极化SAR图像进行分割,生成许多超像素;其次,基于超像素提取7种特征并生成一个特征向量,进而利用高斯核构建相似度矩阵;再次,基于已构建的相似度矩阵,利用张量积扩散沿着数据点的内在流形结构进行相似度的传播,实现全局的相似性度量,从而获得一个具有更强判别能力的相似度矩阵;最后,基于此相似度矩阵进行谱聚类以得到地物分类结果。该文在仿真和实测极化SAR图像上均进行了大量实验,并与4种经典算法进行对比,结果表明该方法可以有效地结合空间邻域相似度信息并取得更高的分类精度。Abstract: To overcome the difficulty of similarity expression and the effects of speckle noise in unsupervised classification of Polarimetric Synthetic Aperture Radar (PolSAR) images, a novel unsupervised PolSAR image terrain classification algorithm based on Tensor Product Graph (TPG) diffusion has been developed herein. Generally, TPG diffusion is usually utilized for optical image segmentation or image retrieval. In the present study, it can be used for PolSAR image terrain classification. TPG diffusion can robustly estimate geodesic distances ; therefore, it can be used for mining the intrinsic affinity between data points. First, the PolSAR image is over-segmented into many superpixels. Second, seven features are extracted based on the segmented superpixels to form a feature vector and construct a similarity matrix by using the Gaussian kernel. Third, TPG diffusion is performed on this similarity matrix to obtain another similarity matrix with stronger discriminability by propagating affinity information along the mainfold structure of data to achieve the global affinity measure. Finally, spectral clustering based on the diffused similarity matrix is adopted to perform terrain classification. Extensive experiments conducted on both simulated and real-world PolSAR images demonstrate that our approach can effectively combine neighborhood information and achieve higher classification accuracy, compared to four other competitive state-of-the-art methods.
-
Key words:
- PolSAR image /
- Unsupervised classification /
- Tensor Product Graph (TPG) /
- Diffusion /
- Superpixel /
- Spectral clustering
-
1. 引言
极化合成孔径雷达(Synthetic Aperture Radar, SAR)是用来测量目标散射信号极化特征的成像雷达,它具有全天候、全天时的工作能力,能够提高目标检测、辨别和分类精度,具有可获得多通道极化图像的优越性,因此,极化SAR图像包含更丰富的地物散射信息,对极化SAR图像进行解译可获取有关地物的大量信息。极化SAR图像地物分类是极化SAR图像解译中非常重要的一个任务。
通常,根据是否需要人工标注样本数据,极化SAR图像分类算法可分为两类:监督分类算法与非监督分类算法。一般来说,监督分类算法可以达到更高的分类精度[1–4],但是人工标注样本数据需要消耗大量的时间与人力且自动化程度很低,不具备普适性。与监督分类算法相比,非监督分类算法[5–8]不仅自动化程度高,并且不需要人工标注大量样本数据,而且随着非监督分类算法研究的不断深入,分类精度也在不断地提高。因此,非监督分类算法在极化SAR图像地物分类领域愈加重要。
根据处理单元的不同,极化SAR图像非监督分类算法也可以分为两类:基于像素的非监督分类算法与基于区域/对象的非监督分类算法。基于像素的非监督分类算法[5–8]可以较为完整地保留地物的边缘与细节,但仍然会在一定程度上受到极化SAR图像中固有相干斑噪声的影响,从而导致地物分类精度不高;而基于区域/对象的非监督分类算法[9,10]可以有效地结合区域信息,从而能够较好地降低相干斑噪声对分类结果的影响,并且可以提高后续处理的计算效率,提高地物分类精度。因此,本文开展基于超像素的非监督极化SAR图像分类方法的研究。
在多种非监督分类方法中,谱聚类因其能够在任意形状的地物特征空间上取得较好的结果且能收敛到全局最优值而得到了较多应用[11]。目前,研究人员也已经提出了很多用于极化SAR图像的改进谱聚类算法。Yang等人[12]基于谱聚类提出了利用模糊C均值聚类的隶属度构建模糊相似度矩阵的算法;Hu等人[13]针对极化SAR图像利用7种不同的相似度度量构建相似度矩阵,之后再采用谱聚类以评价分类效果;考虑到在实测数据中数据点间关系不仅仅是成对度量的,Li等人[14]提出了超图谱聚类算法。但这些算法只关注到了相似度矩阵构建时的核函数选择或者距离度量问题,忽视了数据流形结构上的内在相似度关系。
在传统的极化SAR图像非监督分类系统中大多采用的距离度量不能有效考虑到数据集(图像)的全局特征信息,故由此构建的相似度矩阵就不具备足够的判别力。但是,对给定的相似性度量在图上进行扩散并学习周边信息,可以得到一个全局的相似性度量;同时在此基础上,采用在张量积图(Tensor Product Graph, TPG)上扩散[15]的相似度学习方法,能够使扩散过程根据数据内在关系在张量积图上传播全局相似性,进行上下文信息的学习并构建分类能力更强的相似度矩阵。
针对一般的距离度量无法获取数据内在的高阶相似度信息,从而无法构建更具判别力的相似度矩阵的问题,本文提出一个基于张量积扩散的非监督极化SAR图像地物分类框架。首先,采用一种快速超像素分割算法(Pol-IER算法)[16]对极化SAR图像进行过分割,从而利用区域信息克服极化SAR图像中固有的相干斑噪声的影响;其次,基于超像素提取7个具有代表性的特征:SPAN特征[17]、散射功率熵特征[5]、同极化比特征[5]、异极化率特征[18]以及HSI(Hue, Saturation and Intensity)[19]颜色特征,将这7个特征组合形成一个特征向量,并基于高斯核函数构建相似度矩阵;然后,对此相似度矩阵进行张量积扩散,得到判别能力与分类能力更强的相似度矩阵;最后,基于此扩散后的相似度矩阵进行谱聚类,获得最终的地物分类结果。本文的主要贡献如下:(1)将张量积扩散引入到非监督极化SAR图像地物分类方法研究中;(2)将本文算法与其它4种性能较优的算法进行了大量的对比分析实验,本文算法能够获得更高的分类精度,从而验证了本文算法的优越性。
2. 算法描述
本文算法分为4个步骤,主要包括:(1)超像素分割;(2)特征提取与相似度矩阵构建;(3)相似度矩阵张量积扩散;(4)谱聚类。本文算法的框架流程如图1所示。
2.1 超像素分割
本文直接采用先前提出的Pol-IER算法[16]来完成极化SAR图像的超像素分割。Pol-IER算法是一种用于极化SAR图像的超像素快速分割算法,主要包括4个步骤:(1)初始化;(2)不稳定点局部k均值聚类;(3)更新超像素模型和不稳定点集;(4)分割后处理。Pol-IER算法不仅可以生成具有较高边缘贴合度的超像素,并且拥有较高的计算效率。关于极化SAR图像的超像素快速分割算法的详细过程请参阅文献[16],在此不再赘述。
2.2 特征提取与相似度矩阵构建
极化特征能够客观地表征极化SAR图像中的微观结构,是极化SAR图像分类系统的基本要素。后续的处理步骤以及分类性能的优劣均取决于特征的提取。一般来说,所选极化特征的判别能力直接决定了极化SAR图像分类系统的分类性能。
为了构建判别能力更强的相似度矩阵,获得更好的分类结果,则需要从极化SAR图像中提取出具有较强判别能力的1个或者多个特征。通常,极化特征可分为两类:(1)原始极化矩阵(如散射矩阵、协方差矩阵等)以及对它们的简单数学变换;(2)经典的极化分解特征(如Freeman极化分解特征[20]、Cloude–Pottier’s极化分解特征[21]等)以及对它们的简单数学变换。本文算法中采用的原始极化矩阵为协方差矩阵,采用的极化分解特征为Freeman极化分解特征以及相应的数学变换形式。本文从极化SAR图像中共提取出了7种具有较强判别能力的极化特征形成一个特征矢量以构建相似度矩阵,主要包括:SPAN特征、散射功率熵特征、同极化比特征、异极化率特征以及HSI颜色特征[5,17,18]。
在利用Pol-IER算法对极化SAR图像进行超像素过分割后,可以获得大量的超像素。为了更好地对每个超像素进行特征表示,采用如下步骤:(1)提取极化SAR图像中每个像素点处的7个特征,并组合形成一个特征向量来表示该像素点;(2)计算处于同一个超像素内的所有像素点的平均特征向量作为表示该超像素的特征向量。因此,极化SAR图像中的每一个超像素都可以用一个特征向量来表征。为了方便后续的数据处理,本文采取了min-max标准化对提取的特征数据进行了归一化处理。
在超像素分割的基础上,一幅极化SAR图像可以采用一个带权的无向图模型
$G = \left( {V,E} \right)$ 来描述。其中,节点$V = \left. {\left\{ {{v_1},{v_2}, ·\!·\!· ,{v_M}} \right.} \right\}$ 代表超像素集合,边$({v_i},{v_j}) \in E$ 连接节点${v_i}$ 和${v_j}$ 。每条边有一个相应的非负权重${w_{ij}}\left( {i,j = 1,2, ·\!·\!· ,M} \right)$ ,表示相邻节点${v_i}$ 和${v_j}$ 的相似程度,$M$ 表示极化SAR图像过分割后所得到的超像素数目。受文献[22]启发,本文算法采用高斯核构建相似度矩阵${\text{W}}$ 。相似度矩阵${\text{W}}$ 中的每一个矩阵元素${\text{w}_{ij}}$ 的计算如式(1)所示wij=exp{−d2ijμεij},1≤i≤M,1≤j≤M (1) 其中,
${d_{ij}}$ 表示超像素${v_i}$ 和超像素${v_j}$ 之间的欧氏距离,$\mu $ 是一个超参数,$\varepsilon _{ij}$ 是用来消除缩放问题的尺度参数,定义为εij=mean(d(i,Ni))+mean(d(j,Nj))+dij3,1≤i≤M,1≤j≤M (2) 其中,
$d\left( {i,{N_i}} \right)$ 表示超像素${v_i}$ 与其k最近邻(k-Nearest Neighbors, k-NN)超像素${N_i}$ 之间的欧氏距离,${\rm{mean}}\left( {d\left( {i,{N_i}} \right)} \right)$ 是指平均欧式距离,${\rm{mean}}\left( {d\left( {j,{N_j}} \right)} \right)$ 的定义与${\rm{mean}}\left( {d\left( {i,{N_i}} \right)} \right)$ 相同。2.3 张量积扩散
在传统非监督极化SAR图像分类系统中,相似度矩阵通常由数据点(像素或者超像素)间的成对相似性来决定,忽略了极化SAR图像的全局特征信息。因此,之后的研究工作提出了在图结构上将相似度度量向周围扩散的方法,考虑每一个数据点与它邻域内的点的关系,从而实现相似度的学习[15,22]。本文在张量积图上传播和扩散相似度信息,相较于原图,张量积图考虑了更高阶的上下文关系,可以更好地揭示数据的内在流形结构,以构建出具有更强判别能力和分类能力的相似度矩阵,从而提高地物分类的精度。
对于谱聚类算法,输入的相似度矩阵的判别能力直接影响着分类结果。张量积扩散能在张量积图上基于数据内在结构关系传播全局相似性。具体来说,本文以2.2节获取的相似度矩阵
${\text{W}}$ 作为张量积扩散过程的输入,利用张量积扩散获取扩散后的相似度矩阵来作为2.4节谱聚类算法的输入,以提高极化SAR图像地物分类结果的精度。下面首先介绍简单基于原图的扩散过程,然后再介绍基于张量积的扩散。
2.3.1 基于原图的扩散
众所周知,基于图论的扩散过程能够揭示数据点间的内在几何关系。基于图的扩散最简单的理解即图相似度矩阵的乘积
${{\text{W}}^t}$ ($t$ 为迭代次数),但是,这一经典扩散过程受到迭代次数$t$ 的制约。若相似度矩阵${\text{W}}$ 的行和均小于1,则基于${\text{W}}$ 的经典扩散过程最终会收敛为0矩阵,因此,迭代次数的设定显得至关重要。为了降低迭代次数$t$ 对扩散过程的影响,可以采用对相似度矩阵${\text{W}}$ 进行加权的扩散形式,如式(3)所示[15]W(t)=t∑i=0Wi (3) 其中,为了避免扩散过程收敛为0 矩阵,必须确保
${\text{W}}$ 为非负矩阵,并且满足${\displaystyle\sum\nolimits_{j = 1}^M {\text{w}} _{ij}} < 1$ ($M$ 为超像素个数),即行和均小于1;对任意的$i$ ,若有${\displaystyle\sum\nolimits_{j = 1}^M }$ ${\text{w}} _{ij} \ge 1 $ ,则式(3)无法收敛。根据矩阵原理,满足上述条件的矩阵${{\text{w}}_{ij}}$ 可由随机矩阵变换生成。满足条件后,式(3)可收敛为limt→∞W(t)=(I1−W)−1 (4) 其中,
${{\text{I}}_1}$ 是与${\text{W}}$ 同维的单位矩阵。2.3.2 基于张量积的扩散
张量积图采用
$\mathbb{G} = G \otimes G$ 来表示,其定义为$\mathbb{G} = \left( {V \times V,\mathbb{W}} \right)$ 。张量积图$\mathbb{G}$ 中的每个节点包含$G$ 中的一对节点,其相似度矩阵定义为$\mathbb{W}={\text{W}}\otimes {\text{W}}$ ,其中,$ \otimes $ 表示Kronecker积[23]。特别地,对于$\alpha ,\beta ,i,j = 1,2, ·\!·\!· ,M$ ,有W(α,β,i,j)=W(α,β)⋅W(i,j)=wαβ⋅wij (5) 因此,若
${\text{W}}\in {{\mathbb{R}}^{M\times M}}$ ,则$\mathbb{W}={\text{W}}\otimes {\text{W}}\in $ ${\mathbb{R}^{MM\times MM}} $ 。其简易示例如图2所示:图2中未展示自连接(环),但是
$\mathbb{G}$ 中的每一个节点都应有一个自环。基于张量积图的扩散过程类似于式(3),如式(6)所示W(t)=t∑i=0Wi (6) 由于张量积图
$\mathbb{G}$ 中的每个节点包括原图$G$ 中的1对节点,相较于原图$G$ ,其包含了更多的高阶信息。因此,基于张量积的扩散能够获取更多揭示数据内在关系的信息。与式(4)所示的收敛相似,式(6)表示的扩散过程也可按照式(7)收敛limt→∞W(t)=limt→∞t∑i=0Wi=(I2−W)−1 (7) 其中,
${{\text{I}}_2}$ 为与$\mathbb{W}$ 同维的单位矩阵。但是,正如前面所述,为了避免扩散过程收敛为0矩阵,必须确保$\mathbb{W}$ 的行和均小于1。在式(6)表示的扩散过程中,由于张量积图
$\mathbb{G}$ 对应的相似度矩阵$\mathbb{W}={\text{W}}\otimes {\text{W}}\in {\mathbb{R}^{MM\times MM}}$ ,其维度非常高,扩散和收敛过程的计算效率非常低,而且扩散后得到的相似度矩阵$\mathbb{W}$ 与原图$G$ 对应的相似度矩阵${\text{W}}$ 的维度也不一致。因此,本文希望能在原图$G$ 上利用张量积进行相似性信息的学习,即扩散后的相似度矩阵${{\text{W}}^*}$ 维数为$M \times M$ ,同时包含了学习后的相似性信息[15]W∗=vec−1((I2−W)−1vec(I1)) (8) 其中,
${\rm{vec}} $ 为一个算子,其作用是把一个矩阵的每一列通过堆叠的方式将矩阵转换为一个列向量;${{\rm{vec}} ^{ - 1}}$ 为将一个列向量转换为一个矩阵的逆算子。然而,对于较大的图
$G$ ,由于计算量和存储空间的高要求,利用式(8)进行张量积图扩散是非常困难的。对于在原图$G$ 上的扩散过程,其计算量和存储空间的要求分别为$O\left( {{M^3}} \right)$ 和$O\left( {{M^2}} \right)$ ($M$ 为矩阵元素个数);但是,对于基于张量积图的扩散,其计算量和存储空间的要求则分别高达$O\left( {{M^6}} \right)$ 和$O\left( {{M^4}} \right)$ 。因此,为了提高张量积图的扩散效率,本文采用了一种基于原图的新的迭代算法,其定义为(其证明过程详见文献[15])Q(1)=WQ(t+1)=WQ(t)WT+I1} (9) 重复迭代直至
$\text{Q}$ 收敛,则有limt→∞Q(t)=Q∗=W∗=vec−1((I2−W)−1vec(I1)) (10) 上述算法在原图上的扩散过程等价于在张量积图上的扩散过程,但节约了大量的计算时间与存储空间。由于其等价于在原图
$G$ 上的扩散,因此其对存储空间的要求仍为$O\left( {{M^2}} \right)$ ,对计算量的要求主要取决于矩阵相乘。如果采用Coppersmith-Winograd算法[15]进行矩阵相乘,则其计算量可降至$O\left( {{M^{2.4}}} \right)$ ;如果张量积扩散的迭代次数$t = T\;$ ,则其总的计算量为$O\left( {T \cdot {M^{2.4}}} \right)$ 。通常,当迭代次数为20时,扩散后的相似度矩阵的分类能力可以达到相对稳定的水平,因此,在本文的实验中设置迭代次数$t = 20$ 。2.4 谱聚类
近几年来,谱聚类算法[11]由于其能够在任意形状的(地物)特征空间上取得较好的聚类结果,且具有较完善的数学框架而受到越来越多的关注。本文算法将张量积图扩散后生成的相似度矩阵作为谱聚类算法的输入,从而获得最终的分类结果。谱聚类算法的详细过程请参阅文献[11]。
3. 实验结果与分析
为了评估本文算法的性能,将本文算法与其它多种算法基于一幅仿真图像和一幅实测极化SAR图像进行了对比分析实验。本文采用的仿真极化SAR图像由逆变换法[24]生成,其大小为200×200像素,相应的Pauli-RGB图像和真值图分别如图3(a)和图3(b)所示。实测极化SAR图像为ESAR拍摄的L波段极化SAR图像,拍摄地区位于Oberpfaffenhofen测试区,图像大小为700×1000像素,其Pauli-RGB图像如图4(a)所示。通过参阅文献[25,26]以及该实测极化SAR图像获取地区不同时期的光学遥感图像(其中心位置坐标为11°16
$' $ 30. 84$ ''$ E, 48°05$ '$ 20. 82$ ''$ N),如图4(b)所示,绘制该实测极化SAR图像的真值图如图4(c)所示。该实测极化SAR图像中主要包含3类地物:林地(Woodland)、开放区1(Open area 1)和开放区2(Open area 2)。本文实验部分的组织如下。首先,将在3.1节验证本文算法中张量积扩散的有效性;然后,有关本文算法的参数分析将会在3.2节进行讨论;最后,为验证本文分类算法的有效性,分别基于仿真和实测极化SAR图像进行了5种算法的对比分析实验,包括:基于散射功率熵和同极化比的非监督分类算法[5](Unsupervised Classification based on Scattering power entropy and Copolarized ratio, UCSC)、非监督K均值Wishart分类算法[6](Unsupervised K-means Wishart Classification algorithm, UKWC)、基于测地线距离的Wishart分类算法[7] (unsupervised Wishart Classification algorithm based on Geodesic Distance, GDWC)、基于极化分解的Wishart分类算法[8](unsupervised Wishart Classification using Polarimetric decomposition, CPWC)以及本文算法(Proposed Method, PM)。
为保证对比实验的公平性,所有实验中的类别数目均根据先验知识预先人为给定,且均基于超像素进行分类实验,4种对比算法的实验参数则根据相应论文的最优参数进行设定。本文基于仿真和极化SAR图像对5种算法进行了大量的对比实验,并对实验结果进行了详细的分析,共采取5种常用的度量来评估分类性能,主要包括:混淆矩阵(Confusion Matrix, CM),其每一列代表了预测类别,每一行代表了数据的真实归属类别;用户精度(User Accuracy, UA),表示在分类为第
$i$ 类的所有像素中,其实测类型也是第$i$ 类的像素所占的比例;制图精度(Producer Accuracy, PA),表示在所有实测类型为第$i$ 类的像素中,被正确分类也是第$i$ 类的像素所占的比例;总体精度(Overall Accuracy, OA),表示在所有样本中被正确分类的像素比例;Kappa系数(Kappa coefficient, K),综合了UA和PA用来评价分类图像的精度。3.1 有效性分析
为了验证基于原相似度矩阵进行张量积扩散对揭示极化SAR数据内在关系的有效性,将本文算法与直接基于原相似度矩阵进行谱聚类所获取的分类结果进行对比,本文称其为OM (Original Method)。为了降低相干斑噪声的影响,本文对仿真和极化SAR数据均采取了IDAN滤波处理[27],IDAN滤波处理的滑窗大小设置为30。
基于OM和PM两种方法的仿真极化SAR图像分类结果如图5所示。在利用Pol-IER算法时,超像素分割初始网格数S=12,构建相似度矩阵时参数设置均为
$k = 12,\mu = {\rm{0}}{\rm{.24}}$ 。从图5中的分类结果可以明显看出,张量积扩散学习到的全局相似性发挥了充分的作用,PM算法获得了更优的结果。表1和表2分别展示了OM与PM两种算法基于仿真数据的5种评价度量结果,表2中的粗体字表示比表1中的数值增加的相应类别精度。从表1和表2中的数据可以直观地看出,OM方法出现了误分情况,将类别1错分为类别4,但经过张量积扩散,类别1的UA与类别4的PA值分别提高了0.2339和0.1812。这个结果清楚地表明,张量积扩散可以更好地优化上下文信息并获取到更具判别能力的相似度矩阵。表 1 OM方法基于仿真数据的5种评价度量结果Table 1. The five evaluation criteria of the OM method for the simulated PolSAR image类别 类别1 类别2 类别3 类别4 UA 类别1 7822 26 19 2758 0.7362 类别2 3 9751 9 237 0.9751 类别3 12 47 9228 88 0.9843 类别4 14 96 11 9879 0.9879 PA 0.9963 0.9830 0.9958 0.7622 OA: 91.70%, K: 0.8894 表 2 PM方法基于仿真数据的5种评价度量结果Table 2. The five evaluation criteria of the PM method for the simulated PolSAR image类别 类别1 类别2 类别3 类别4 UA 类别1 10308 26 19 272 0.9701 类别2 3 9751 9 237 0.9751 类别3 16 47 9228 84 0.9843 类别4 15 96 11 9878 0.9878 PA 0.9967 0.9830 0.9958 0.9434 OA: 97.91%, K: 0.9722 考虑到实测图像的复杂性以及实验参数设置的合理性,在对实测极化SAR图像进行实验时,超像素分割的初始网格数S=15,构建相似度矩阵时分别将两种方法的参数设置为可得到最佳分类效果时的参数。对于OM方法,参数设置为
$k = 15 $ ,$ \mu = 0.50$ ;对于PM方法,参数设置为$k = 15{\rm{, }}\ \mu = 0.10$ 。实验结果如图6所示。总体来说,PM仍然优于OM,并且可以清楚地从图6中观察到PM方法对于开放区(开放区1和开放区2)的判别能力比OM方法要强。表3展示了OM方法与PM方法两种算法的OA与Kappa系数。显然,PM方法拥有更高的OA值与K值,这个结果再一次表明了张量积扩散能够有效地学习相似性信息并且提高地物分类精度。表 3 两种算法基于实测极化SAR图像的整体精度和Kappa系数Table 3. The OAs and Ks of two methods for the real-world PolSAR image算法 精度 K OA (%) OM算法 0.6193 78.51 PM算法 0.8097 89.36 3.2 参数分析
在本文所提的算法中,S, k与
$\mu $ 3个参数直接决定了分类结果的好坏,并且这3个参数的不同组合也对分类结果有着重要的影响。首先,S是极化SAR图像超像素中的初始分割网格数,决定了超像素分割的精度以及后续的数据处理量。
对于不同尺寸的极化SAR图像,应选择合适的网格大小;其次,在计算相似度时,需要构建尺度参数来消除缩放问题,因此,需要计算超像素
${v_i}$ 与其k-NN超像素${N_i}$ 之间的欧氏距离;再次,$\mu $ 是一个超参数,用于构建相似度矩阵(详细信息请参考2.2节)。此外,这3个参数之间也互相有所影响。因此,本文将对这3个参数对分类结果的影响进行深入分析。本文主要基于实测极化SAR图像对这3个参数进行分析。超像素分割属于分类的预处理环节,只有得到一个良好的超像素分割结果,才有可能获得精度较高的分类结果。因此,本文首先就S的取值进行了实验分析,并采用3种常用评价度量进行评估,包括:边缘回调率(Boundary Recall, BR)[16]、欠分割误差(Under-Segmentation Error, USE)[16]、可达分割准确率(Achievable Segmentation Accuracy, ASA)[16]。实验结果如图7所示。从图7中的超像素分割实验结果可明显看出,针对本文给定的极化SAR图像数据,当S取值为13和15时,均可以得到较好的超像素分割结果。因此,为了便于分析比较,本文共选择了2个有代表性的S值、5个典型的k值以及5个典型的
$\mu $ 值形成参数组合,开展实验并分析实验结果。图8展示了在不同参数组合下的OA值。虽然初始分割网格数S的值越小越接近逐像素处理,但是对比图8中的数据可以明显看出S=15时的分类精度高于S=13时的分类精度。因此,对于不同尺寸的极化SAR图像,要合理地选择超像素分割网格数。当S=15时,总体精度OA值平均可以增加4.58%;然而,当网格数S较小时则会产生有干扰性的冗余数据,并且不能有效地减缓极化SAR图像中固有相干斑噪声的影响,从而降低分类精度。
观察图8(a)和图8(b)可发现,随着k值的增大,分类精度大体呈增加趋势。当k值较小时,邻域信息没有得到充分利用,不能较好地构建适应当前极化SAR图像的相似度矩阵,从而得到较低的分类精度。当S=15, k=14时比k=12时OA值最多可提高12.84%,至少也可提高0.48%。但是无论S取何值,都可在k=15时得到最佳的分类结果。而随着k值的进一步增大,则会造成过度缩放的情况,反而会降低相似度矩阵的判别能力,从而影响最终的分类精度。
$\mu $ 是构建相似度矩阵时的一个超参数,如式(1)所示,位于指数函数的指数部分。因此,从指数函数特性来分析,其微小的变化即会引起函数值的突变。从某种程度上来讲,真实图像更为复杂,而本文采用的实测极化SAR图像存在较为严重的同物异谱以及异物同谱现象,加之极化SAR图像固有的相干斑噪声问题,因此,随着参数的变化,分类结果会有一定的波动。但从整体上来看,无论S和k取何值,当$\mu = 0.10$ 时,都可以得到一个更高的总体精度值。3.3 5种算法的对比实验
3.3.1 基于仿真极化SAR图像的对比实验
本文选择的5种算法的对比实验结果如图9所示,表4所示为此5种算法的PA值、Kappa系数以及OA值。
表 4 5种算法基于仿真极化SAR图像的3种评价度量结果Table 4. The three evaluation criteria of five methods for the simulated PolSAR image算法 精度 类别1 类别2 类别3 类别4 K OA (%) UCSC 0.9400 0.9857 0.9919 0.9504 0.9541 96.56 UKWC 0.5012 0.0000 0.9919 0.9459 0.6194 71.62 GDWC 0.5071 0.2242 0.9958 0.9808 0.6470 73.68 CPWC 0.5007 1.0000 0.9312 0.1633 0.6118 71.05 PM 0.9967 0.9830 0.9958 0.9434 0.9722 97.91 从表5中的数据可以直观地看出,UKWC与CPWC两种算法的分类精度最低,其OA值分别为71.62%和71.05%;从图9(b)和图9(d)中可明显看出UKWC对类别2误分严重,CPWC算法基本丧失对类别4的判别能力,这可能是由于其没有采用较多的具有良好判别能力的特征。而GDWC算法略高于上述2种算法,这是因为GDWC算法的原理是寻找两个数据点(超像素)间最短距离以构建相似度矩阵。因此,从图9(c)中可看出,其分类结果轮廓清晰,边缘贴合;但是,由于GDWC算法没有结合有效的极化SAR图像特征进行分类,因此仍然存在着较为严重的误分现象。图9(a)展示的UCSC算法的分类性能较好,但仍有部分超像素被误分。而对于本文算法,由于采用了多种典型的极化SAR图像特征,同时通过张量积扩散得以充分利用上下文高阶信息,从而得到更具判别能力的相似度矩阵,因此,本文算法的极化SAR图像分类精度最高,分类结果也最优。
表 5 5种算法基于实测极化SAR图像的3种评价度量结果Table 5. The three evaluation criteria of five methods for the real-world PolSAR image算法 精度 林地 开放区1 开放区2 K OA (%) UCSC 0.9638 0.5477 0.0004 0.5940 77.09 UKWC 0.9657 0.8154 0.5011 0.6666 79.81 GDWC 0.9514 0.6030 0.7830 0.6645 80.74 CPWC 0.9984 0.4307 0.0014 0.4407 65.73 PM 0.9707 0.7461 0.9226 0.8097 89.36 3.3.2 基于实测极化SAR图像的对比实验
5种算法的实验结果如图10所示,表5所示为此5种算法的PA值、Kappa系数以及OA值。
从图10(d)中可以看出图中存在很多孤立的小区域,这说明CPWC算法的分类结果受极化SAR图像中固有的相干斑噪声影响严重,如区域A所示;同时CPWC算法所选择特征较为单一且不能有效地寻找数据点(超像素)间的测地线距离,使得其在区域B中无法分类出开放区2。而UCSC算法将大量的开放区2误分为开放区1,如图10(a)中区域B所示,这说明没有较多的极化SAR特征的确会对地物的判别能力造成一定影响。图10(b)中部分地物边缘和同质区域呈现破裂不完整的现象,这可能由于UKWC算法没有充分地利用邻域相似性信息,其相应的Kappa系数为0.6666。GDWC算法的OA值可达80.74%,均高于上述3种算法,这再一次印证了寻找数据点(超像素)之间最短距离的重要性。然而,观察图10(c)中的区域A,仍然有较多的噪声,这主要也是因为其没有结合多种有效的极化SAR特征进行分类所导致的现象。综上所述,本文算法不但结合了多种典型的极化SAR特征,并且利用张量积图寻找数据流形结构上的测地线距离,可以充分学习数据的高阶相似信息,因此,其既能较为准确地区分出不同的地物,又能有效地降低相干斑噪声对分类结果的影响,这对于非监督极化SAR图像的地物分类是非常重要的。
4. 结束语
本文针对利用原始的相似度矩阵进行极化SAR图像分类,导致无法获取数据内在高阶信息的问题,提出了一种基于张量积扩散的非监督极化SAR图像地物分类算法。首先,为了在提高计算效率的同时降低相干斑噪声对分类结果的影响,对极化SAR图像进行超像素分割;然后,采用常用于图像检索的张量积扩散,将基于超像素提取的7种特征构建的原始相似度矩阵进行上下文相似性信息的学习,生成判别能力和分类能力较强的相似度矩阵;最后,通过谱聚类获取分类结果。本文算法采用混淆矩阵、总体精度和Kappa系数等5个度量参数对分类结果进行全方位的评估。首先基于一幅仿真图像和一幅实测极化SAR图像,对张量积扩散的有效性进行了验证;同时,将本文算法和其它4种较优的极化SAR图像非监督分类算法进行了对比实验,验证了本文算法分类性能的优越性;并且基于实测图像对实验参数进行了分析。大量的实验结果表明,张量积扩散可以有效地度量数据流形结构上的测地线距离,充分利用数据内在的高阶信息,并获得更优的分类结果和更高的分类精度。然而,需要指出的是,如何合理地选择不同数量、不同类型的特征形成一个高维特征向量以生成判别能力和分类能力更强的扩散后的相似度矩阵,是本文未来需要进一步深入研究的问题。
-
表 1 OM方法基于仿真数据的5种评价度量结果
Table 1. The five evaluation criteria of the OM method for the simulated PolSAR image
类别 类别1 类别2 类别3 类别4 UA 类别1 7822 26 19 2758 0.7362 类别2 3 9751 9 237 0.9751 类别3 12 47 9228 88 0.9843 类别4 14 96 11 9879 0.9879 PA 0.9963 0.9830 0.9958 0.7622 OA: 91.70%, K: 0.8894 表 2 PM方法基于仿真数据的5种评价度量结果
Table 2. The five evaluation criteria of the PM method for the simulated PolSAR image
类别 类别1 类别2 类别3 类别4 UA 类别1 10308 26 19 272 0.9701 类别2 3 9751 9 237 0.9751 类别3 16 47 9228 84 0.9843 类别4 15 96 11 9878 0.9878 PA 0.9967 0.9830 0.9958 0.9434 OA: 97.91%, K: 0.9722 表 3 两种算法基于实测极化SAR图像的整体精度和Kappa系数
Table 3. The OAs and Ks of two methods for the real-world PolSAR image
算法 精度 K OA (%) OM算法 0.6193 78.51 PM算法 0.8097 89.36 表 4 5种算法基于仿真极化SAR图像的3种评价度量结果
Table 4. The three evaluation criteria of five methods for the simulated PolSAR image
算法 精度 类别1 类别2 类别3 类别4 K OA (%) UCSC 0.9400 0.9857 0.9919 0.9504 0.9541 96.56 UKWC 0.5012 0.0000 0.9919 0.9459 0.6194 71.62 GDWC 0.5071 0.2242 0.9958 0.9808 0.6470 73.68 CPWC 0.5007 1.0000 0.9312 0.1633 0.6118 71.05 PM 0.9967 0.9830 0.9958 0.9434 0.9722 97.91 表 5 5种算法基于实测极化SAR图像的3种评价度量结果
Table 5. The three evaluation criteria of five methods for the real-world PolSAR image
算法 精度 林地 开放区1 开放区2 K OA (%) UCSC 0.9638 0.5477 0.0004 0.5940 77.09 UKWC 0.9657 0.8154 0.5011 0.6666 79.81 GDWC 0.9514 0.6030 0.7830 0.6645 80.74 CPWC 0.9984 0.4307 0.0014 0.4407 65.73 PM 0.9707 0.7461 0.9226 0.8097 89.36 -
[1] SHI Lei, ZHANG Lefei, ZHAO Lingli, et al. Adaptive Laplacian Eigenmap-based dimension reduction for ocean target discrimination[J]. IEEE Geoscience and Remote Sensing Letters, 2016, 13(7): 902–906. doi: 10.1109/LGRS.2016.2553046 [2] 杨文, 钟能, 严天恒, 等. 基于黎曼流形的极化SAR图像分类[J]. 雷达学报, 2017, 6(5): 433–441. doi: 10.12000/JR17031YANG Wen, ZHONG Neng, YAN Tianheng, et al. Classification of polarimetric SAR images based on the Riemannian manifold[J]. Journal of Radars, 2017, 6(5): 433–441. doi: 10.12000/JR17031 [3] LIU Wensong, YANG Jie, LI Pingxiang, et al. A novel object-based supervised classification method with active learning and random forest for PolSAR imagery[J]. Remote Sensing, 2018, 10(7): 1092. doi: 10.3390/rs10071092 [4] SHI Lei, ZHANG Lefei, ZHAO Lingli, et al. The potential of linear discriminative Laplacian Eigenmaps dimensionality reduction in polarimetric SAR classification for agricultural areas[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 86: 124–135. doi: 10.1016/j.isprsjprs.2013.09.013 [5] WANG Shuang, LIU Kun, PEI Jingjing, et al. Unsupervised classification of fully polarimetric SAR images based on scattering power entropy and copolarized ratio[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(3): 622–626. doi: 10.1109/LGRS.2012.2216249 [6] LEE J S, GRUNES M R, POTTIER E, et al. Unsupervised terrain classification preserving polarimetric scattering characteristics[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(4): 722–731. doi: 10.1109/TGRS.2003.819883 [7] RATHA D, BHATTACHARYA A, and FRERY A C. Unsupervised classification of polsar data using a scattering similarity measure derived from a geodesic distance[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(1): 151–155. doi: 10.1109/LGRS.2017.2778749 [8] LEE J S, GRUNES M R, AINSWORTH T L, et al. Unsupervised classification using polarimetric decomposition and the complex Wishart classifier[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 2249–2258. doi: 10.1109/36.789621 [9] 钟能, 杨文, 杨祥立, 等. 基于混合Wishart模型的极化SAR图像非监督分类[J]. 雷达学报, 2017, 6(5): 533–540. doi: 10.12000/JR16133ZHONG Neng, YANG Wen, YANG Xiangli, et al. Unsupervised classification for polarimetric synthetic aperture radar images based on Wishart mixture models[J]. Journal of Radars, 2017, 6(5): 533–540. doi: 10.12000/JR16133 [10] WU Yonghui, JI Kefeng, YU Wenxian, et al. Region-based classification of polarimetric SAR images using Wishart MRF[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(4): 668–672. doi: 10.1109/LGRS.2008.2002263 [11] VON LUXBURG U. A tutorial on spectral clustering[J]. Statistics and Computing, 2007, 17(4): 395–416. doi: 10.1007/s11222-007-9033-z [12] YANG Yifang, WANG Yuping, XUE Xingsi, et al. A novel spectral clustering method with superpixels for image segmentation[J]. Optik, 2016, 127(1): 161–167. doi: 10.1016/j.ijleo.2015.10.053 [13] HU Jingliang, WANG Yuanyuan, GHAMISI P, et al. Evaluation of polsar similarity measures with spectral clustering[C]. Proceedings of 2017 IEEE International Geoscience and Remote Sensing Symposium, Fort Worth, USA, 2017: 3254–3257. [14] LI Yonggang, ZHANG Shichao, CHENG Debo, et al. Spectral clustering based on hypergraph and self-re-presentation[J]. Multimedia Tools and Applications, 2017, 76(16): 17559–17576. doi: 10.1007/s11042-016-4131-6 [15] YANG Xingwei, PRASAD L, and JAN LATECKI L. Affinity learning with diffusion on tensor product graph[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(1): 28–38. doi: 10.1109/TPAMI.2012.60 [16] ZHANG Yue, ZOU Huanxin, LUO Tiancheng, et al. A fast superpixel segmentation algorithm for PolSAR images based on edge refinement and revised Wishart distance[J]. Sensors, 2016, 16(10): 1687. doi: 10.3390/s16101687 [17] CAO Fang, HONG Wen, WU Yirong, et al. An unsupervised segmentation with an adaptive number of clusters using the SPAN/H/α/A space and the complex Wishart clustering for fully polarimetric SAR data analysis[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(11): 3454–3467. doi: 10.1109/TGRS.2007.907601 [18] ZHOU Xiaofeng, WANG Shuang, HUA Wenqiang, et al. Unsupervised classification of PolSAR data based on a novel polarization feature[C]. Proceedings of 2017 IEEE International Geoscience and Remote Sensing Symposium, Fort Worth, USA, 2017: 4594–4599. [19] 张月, 邹焕新, 邵宁远, 等. 基于相似度网络融合的极化SAR图像地物分类[J]. 系统工程与电子技术, 2018, 40(2): 295–302. doi: 10.3969/j.issn.1001-506X.2018.02.09ZHANG Yue, ZOU Huanxin, SHAO Ningyuan, et al. Terrain classification of polarimetric SAR images based on consensus similarity network fusion[J]. Systems Engineering and Electronics, 2018, 40(2): 295–302. doi: 10.3969/j.issn.1001-506X.2018.02.09 [20] FREEMAN A and DURDEN S L. A three-component scattering model for polarimetric SAR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 1998, 36(3): 963–973. doi: 10.1109/36.673687 [21] CLOUDE S R and POTTIER E. A review of target decomposition theorems in radar polarimetry[J]. IEEE Transactions on Geoscience and Remote Sensing, 1996, 34(2): 498–518. doi: 10.1109/36.485127 [22] YANG Xingwei, SZYLD D B, and JAN LATECKI L. Diffusion on a tensor product graph for semi-supervised learning and interactive image segmentation[J]. Advances in Imaging and Electron Physics, 2011, 169: 147–172. doi: 10.1016/B978-0-12-385981-5.00004-5 [23] VAN LOAN C F. The ubiquitous Kronecker product[J]. Journal of Computational and Applied Mathematics, 2000, 123(1/2): 85–100. [24] QIN Xianxiang, ZOU Huanxin, ZHOU Shilin, et al. Simulation of spatially correlated PolSAR images using inverse transform method[J]. Journal of Applied Remote Sensing, 2015, 9(1): 095082. doi: 10.1117/1.JRS.9.095082 [25] HOU Biao, WU Qian, WEN Zaidao, et al. Robust semisupervised classification for PolSAR image with noisy labels[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(11): 6440–6455. doi: 10.1109/TGRS.2017.2728186 [26] SONG Wanying, LI Ming, ZHANG Peng, et al. Unsupervised PolSAR image classification and segmentation using Dirichlet process mixture model and Markov random fields with similarity measure[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(8): 3556–3568. doi: 10.1109/JSTARS.2017.2684301 [27] VASILE G, TROUVÉ E, LEE J S, et al. Intensity-driven adaptive-neighborhood technique for polarimetric and interferometric SAR parameters estimation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(6): 1609–1621. doi: 10.1109/TGRS.2005.864142 期刊类型引用(2)
1. 邹焕新,李美霖,曹旭,李润林,秦先祥. 一种基于测地线距离的极化SAR图像快速超像素分割算法. 雷达学报. 2021(01): 20-34 . 本站查看
2. 秦先祥,余旺盛,王鹏,陈天平,邹焕新. 基于复值卷积神经网络样本精选的极化SAR图像弱监督分类方法. 雷达学报. 2020(03): 525-538 . 本站查看
其他类型引用(0)
-