Robust Classification of PolSAR Images Based on Pinball loss Support Vector Machine
-
摘要: 考虑到极化合成孔径雷达(PolSAR)图像标注信息量低以及相干斑噪声难以消除的问题,该文从鲁棒统计学习的角度提出了一种基于Pin-SVM的极化SAR图像鲁棒分类方法,根据极化SAR图像的散射特性和地物的纹理特性,通过求解两类样本之间的最大分位数距离来确定分类超平面,在无需迭代的前提下得到更加鲁棒的分类结果。相比传统的基于最大间隔的极化SAR图像分类算法,该文所提算法一方面在对极化SAR图像提取到的特征中包含的噪声具有更好的鲁棒性,另一方面对于训练样本的抽样范围不敏感,即重采样具有更好的鲁棒性。利用EMISAR的Foulum地区极化SAR数据进行了算法验证,多种情况的对比实验的结果验证了该算法的有效性。Abstract: Given the problems that the amount of supervised information in the Polarimetric Synthetic Aperture Radar (PolSAR) image is low and the speckle noise is difficult to eliminate, in this study, a robust classification algorithm for PolSAR image based on Pinball loss Support Vector Machine (Pin-SVM) is proposed from the perspective of robust statistical learning. On the basis of the scattering characteristics of PolSAR images and the texture characteristics of surface features, the proposed algorithm determines the optimal decision hyperplane by solving the maximum quantile distance between the samples of two classes, which can provide more robust results without iteration. Compared with the traditional PolSAR image classification algorithms that solve the maximum margin, on one hand, the proposed algorithm is robust to the noise contained in the features extracted from PolSAR images. On the other hand, the proposed algorithm is insensitive to the sampling range of training samples, which means that it has better robustness to resampling. The experimental results of EMISAR-Foulum PolSAR data prove the validity of the proposed algorithm through comparative tests in a variety of situations.
-
1. 引言
合成孔径雷达是非常成熟的一种主动模式微波遥感技术,不依赖于太阳光源,不受云、雾、雨、雪等自然气候影响,具备全天候、全天时的对地观测能力。极化SAR通过发射两个相互正交的电磁波,结合电磁波的极化信息以及合成孔径雷达(Synthetic Aperture Radar, SAR)的优良特性从而更加有效地对地面进行观测,在地物与土地利用[1]、海洋表面遥感、绿色植物覆盖[2]等方面发挥了重要作用。图像分类一直是极化SAR图像解译中的重要部分。对于极化SAR图像而言,限制分类精度的主要因素在于噪声。尽管对极化SAR图像的滤波方法有很多[3,4],但都无法完全去除噪声的影响,并且在进行极化SAR图像监督分类时,训练样本的标定范围随机性很强,存在重采样问题。
随着机器学习的发展,大量半监督[5]、无监督[6–8]和全监督[9–11]的分类方法被应用于极化SAR图像分类。相比全监督的方法,无监督的图像分类方法省略了人为标注的过程,但由于其分类精度无法令人满意,因此应用水平较低。目前基于深度表示学习的方法展现了更好的数据拟合能力[12],但训练神经网络所需的海量监督信息是极化SAR图像分类任务中所不具备的。在大量机器学习经典算法中,支持向量机[13]方法因其在小样本情况下表现出很好的学习能力和泛化能力,在极化SAR图像分类中的应用最为广泛[14,15]。但是,原始的C-SVM(Support Vector Machine)通过求解两类之间的最大间隔来确定分类超平面,其分类效果很容易受到噪声和样本采样区域的影响[16],因此鲁棒SVM一直以来被广泛的研究[17,18],但多数研究是以大幅提高算法复杂度为代价得到的鲁棒算法[19,20]。Huang等人[21]提出的基于Pinball损失函数支持向量机Pinball loss Support Vector Machine (Pin-SVM),通过求解最大分位数距离,在较小的复杂度下提高分类器的稳定性和鲁棒性。
本文从契合实际应用环境的角度,提出一种基于Pin-SVM的极化SAR图像分类方法。算法利用融合后的极化SAR图像的散射和纹理特征,使用网格搜索与交叉验证结合的方式[22]寻找最优超参数组合,求解最大分位数距离以确定SVM的分类超平面,以较低的算法复杂度实现对特征噪声和重采样具有较好鲁棒性的极化SAR图像分类。
2. 基于Pinball损失函数的支持向量机
2.1 Pin-SVM的基本原理
对于
l 个训练样本的集合{xi,yi},i=1,2,···,l ,其中,xi∈Rn 表示样本i 的特征,yi 表示样本i 被标记的类别,对于预测函数f(x) ,通常用损失函数L(xi,yi,f(xi)) 来描述预测值与真实值之间的差异。传统的C-SVM的基本思想是通过优化Hinge损失函数的经验风险以及模型的结构风险,寻找一个最优的分类超平面f(x)=wTx+b=0,w∈Rn, b∈R ,使两类之间的间隔最大,SVM的目标函数为min (1) 其中,
{L_{{\rm{Hinge}}}}\left( {x,y,f\left( x \right)} \right) = \max \left\{ {1 - yf\left( x \right),0} \right\} ,超参数C\, 用于平衡经验风险与结构风险。Huang等人[21]根据分位数距离求解分类间隔,基于Pinball损失函数使分位数距离最大化。Pinball损失函数通过对正确分类的样本附加一定的惩罚以提高对特征噪声及重采样的不敏感性,Pinball损失函数的表达式为
{L_\tau }\left( {x,y,f\left( x \right)} \right) = \left\{ \begin{aligned} {\rm{}}& {1 - yf\left( x \right),}\\ {\rm{}}& \quad {1 - yf\left( x \right) \ge 0}\\ {\rm{}}& { - \tau \left( {1 - yf\left( x \right)} \right),}\\ {\rm{}}& \quad {1 - yf\left( x \right) < 0} \end{aligned} \right. (2) 其中,
\tau \in [0,1] 表示对正确分类样本的惩罚参数,用来控制两类之间的分位数距离。图1(a)和图1(b)分别给出了C-SVM和Pin-SVM算法不同损失函数的性能对比,从图1中可以看出:在分类间隔yf\left( x \right) < 1 的部分,Hinge损失与Pinball损失是一致的;在分类间隔yf\left( x \right) \ge 1 的部分,Hinge损失函数的值恒为零;而Pinball损失函数的值为- \tau \left( {1 - yf(x)} \right) ,这意味着对Pin-SVM来说,即使分类正确也会有一定的损失。将式(2)带入到式(1)中可得Pin-SVM的基本形式
\mathop {\min }\limits_{{{w}},b} \frac{1}{2}{\left\| {{w}} \right\|^2} + C\sum\limits_{i = 1}^l {{L_\tau }\left[ {1 - {y_i}\left( {{{{w}}^{\rm{T}}} \cdot {x_i} + b} \right)} \right]} (3) 对于非线性分类问题,根据Mercer定理[23],可以用映射函数
\phi \left( {{x}} \right) 将原始数据集合映射到高维特征空间,则式(3)可以转化为\mathop {\min }\limits_{{{w}},b} \frac{1}{2}{\left\| {{w}} \right\|^2} + C\sum\limits_{i = 1}^l {{L_\tau }\left[ {1 - {y_i}\left( {{{{w}}^{\rm{T}}} \cdot \phi \left( {{x_i}} \right) + b} \right)} \right]} (4) 通过引入松弛因子
\xi ,得到一个不等式约束条件下的凸二次优化问题\left. \begin{aligned} {\rm{}}& {\mathop {\min }\limits_{{{w}},b,\xi } }\quad {\frac{1}{2}{{\left\| {{w}} \right\|}^2} + C\sum\limits_{i = 1}^l {{\xi _i}} } \\ {\rm{}}& {{\rm{s}}{\rm{.t}}{\rm{.}}}\ {{y_i}\left( {{{{w}}^{\rm{T}}}\phi \left( {{x_i}} \right) + b} \right) \ge 1 - {\xi _{i,}}}\quad{ i = 1,2, ·\!·\!· ,l} \\ {\rm{}}& {\quad \;\;\,{y_i}\left( {{{{w}}^{\rm{T}}}\phi \left( {{x_i}} \right) + b} \right) \le 1 + \frac{1}{\tau }{\xi _{i,}}}\ {i = 1,2, ·\!·\!· ,l} \end{aligned} \!\right\}\quad\ \ (5) 与C-SVM相比,Pin-SVM通过引入惩罚参数
\tau ,根据两类样本的最大分位数距离来确定分类超平面,降低了对分类决策面附近的噪声样本的敏感性,提高了重采样的稳定性,从而在保证较小的算法复杂度的同时,提高分类精度以及分类器的稳定性。2.2 Pin-SVM鲁棒性分析
Pin-SVM与C-SVM都属于贝叶斯分类器,二者误分类率的上界相同,Pin-SVM的优势在于其对训练样本中包含的特征噪声不敏感。不失一般性地,考虑训练集为线性可分的情况,根据式(2)可得Pinball损失函数的次梯度
{\rm{sgn} _\tau }\left( {x,y,f\left( x \right)} \right) ,{\rm{sgn} _\tau }\left( {x,y,f\left( x \right)} \right) = \left\{ \begin{aligned} {\rm{}} & {1,}{\quad\quad\quad \, 1 - yf\left( x \right) > 0} \\ {\rm{}} & {\left[ { - \tau ,1} \right],}\quad {1 - yf\left( x \right) = 0} \\ {\rm{}}& { - \tau ,}\quad\quad\ \ \, { 1 - yf\left( x \right) < 0} \end{aligned} \right. (6) 从而可以得到Pin-SVM的另一种表达形式
{{0}} \in \frac{{{w}}}{C} - \sum\limits_{i = 1}^l {{{\rm{sgn} }_\tau }\left( {{x_i},{y_i},f\left( {{x_i}} \right)} \right){y_i}{x_i}} (7) 其中,左侧的0表示当
1 - yf(x) = 0 时的特征向量。根据式(6)可以将整个训练集划分为以下3部分\left. \begin{gathered} {{S}_{\rm{ + }}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) > 0} \right\} \\ {{S}_{\rm{ - }}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) < 0} \right\} \\ {{S}_{\rm{0}}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) = 0} \right\} \\ \end{gathered} \right\} (8) 根据这3个被标记的集合,可以将式(7)转化为
\frac{{{w}}}{C} - \sum\limits_{i \in {{{S}}_{\rm{ + }}}} {{y_i}{x_i}} - \sum\limits_{i \in {{{S}}_{\rm{0}}}} {{\rho _i}{y_i}{x_i}} + \tau \sum\limits_{i \in {{{S}}_{\rm{ - }}}} {{y_i}{x_i}} = 0 (9) 其中,
{\rho _i} \in \left[ { - \tau ,1} \right] 。集合
{S_ + } 与{S_0} 中包含的训练样本个数少,即支持向量区域稀疏程度高是C-SVM对特征噪声以及重采样敏感的根本原因,特征噪声或重采样可能会直接地改变支持向量,进而对C-SVM的决策造成极大影响。从式(9)中可以看出,参数\tau 可以控制{S_ + } ,{S_0} 和{S_ - } 3个集合中训练样本的数量。对比图2(a)和图2(b)发现,随着超参数\tau 的增大,{S_ + } 与{S_0} 中样本数随之增大,Pin-SVM的支持向量的个数增多。这意味着Pin-SVM可以通过对超参数\tau 的调整,寻找到一个相当稠密的支持向量区域,如图2(b)所示,数量较多的支持向量降低了噪声或重采样对决策造成剧烈影响的可能性。3. 基于Pin-SVM的极化SAR图像分类
3.1 PolSAR图像特征提取
通过对极化SAR图像的极化特性与纹理特性进行分析,本文利用极化协方差矩阵多成分目标分解[24], H-A-
\bar \alpha 分解[25]以及灰度共生矩阵[26]方法分别提取常用的12种极化特征和纹理特征,并构成极化SAR图像分类的原始特征集\begin{align} \overrightarrow {{d}} =& \left[ {{P_{\rm{s}}},{P_{\rm{d}}},{P_{\rm{v}}},H,A,\bar \alpha ,{\rm{ENY,ENT,CON,}}}\right. \\ {\rm{}} & \left.\rm IDM,COR,SAV\right] \end{align} (10) 其中,
{P_{\rm{s}}} ,{P_{\rm{d}}} 和{P_{\rm{v}}} 为奇次散射功率、偶次散射功率和体散射功率,H ,A 和\bar \alpha 分别表示基于极化相干矩阵的特征值分解得到的极化散射熵、极化各向异性度和平均散射角,其余的6种特征表示的是基于灰度共生矩阵提取的纹理特征:能量{\rm{ENY}} 、熵{\rm{ENT}} 、对比度{\rm{CON}} 、反差矩{\rm{IDM}} 、相关度{\rm{COR}} 及和平均{\rm{SAV}} 。3.2 特征融合
在对特征向量进行训练之前,首先需要对特征向量中的每一种特征进行加权优化处理,以提高多种特征融合表达的效果。然而,如果采用人工分配的方法进行加权,工作量很大,而且很难保证分类结果的可信度,因此,本文采用归一化巴氏距离对特征向量进行加权处理。巴氏距离[27]描述的是某一特征对两类地物的可区分度,如果巴氏距离较大,则该特征可以很好的区分这两类地物,如果巴氏距离较小,则这两类地物在该特征中很难区分。巴氏距离
\left( {{\rm{BD}}} \right) 的表达式为{\rm{BD }}= \frac{1}{4}\frac{{{{\left( {{\mu _1} - {\mu _2}} \right)}^2}}}{{\sigma _1^2 + \sigma _2^2}} + \frac{1}{2}\lg \left( {\frac{{\sigma _1^2 + \sigma _2^2}}{{2{\sigma _1}{\sigma _2}}}} \right) (11) 其中,
{\mu _1} 和{\mu _2} 分别表示对于同一种特征两类地物训练样本的均值,{\sigma _1} 和{\sigma _2} 分别表示同一种特征两类地物训练样本的方差,通过对巴氏距离归一化处理可以得到每一种特征的权重,{p_i} = \frac{{{\rm{B}}{{\rm{D}}_i}}}{{\displaystyle\sum {{\rm{B}}{{\rm{D}}_i}} }} (12) 其中,
{p_i} 表示特征向量中的第i 个特征对于区分这两类地物的权重,巴氏距离越大,权重越大。3.3 Pin-SVM超参数选择
非参数模型的建模机理导致了超参数对支持向量机的泛化能力有很大影响。本文采用的核函数方法为高斯核函数,主要考虑对线性不可分的样本集合引入的误差惩罚参数
C 、高斯核参数{\sigma ^2} 和影响分位数距离的变量\tau 对分类器的影响。使用网格搜索法与交叉验证法结合的方式进行超参数选择。首先利用网格搜索法确定各参数的选择范围:误差惩罚参数
C 有{m_1} 种选择,高斯核参数{\sigma ^2} 有{m_2} 种选择,参数\tau 有{m_3} 种选择,将3种参数交叉组合可以得到{m_1} \times {m_2} \times {m_3} 种组合方式。然后利用交叉验证法将全部训练样本分成10份,每次将训练样本集合中的1份样本作为训练集,其余9份样本作为测试集,重复10次上述过程,并根据平均分类精度的大小来选择最优的超参数组合。3.4 基于Pin-SVM的极化SAR图像分类流程
本文提出的分类算法的流程图如图3所示,算法具体的操作步骤如下:
步骤1 使用精致LEE滤波[28]对原始极化SAR数据进行相干斑过滤;
步骤2 将极化SAR图像的典型地物进行人工标注,并在每一类地物中随机抽取一部分样本构成训练集和测试集;
步骤3 通过极化目标分解和灰度共生矩阵提取极化SAR图像的极化特征和纹理特征,构成目标的原始特征向量;
步骤4 根据每一种特征的归一化巴氏距离,对原始特征向量进行加权处理得到融合后的特征向量;
步骤5 在训练集上采用网格搜索与十折交叉验证结合的方法,在指定的参数范围内搜索Pin-SVM的最优超参数组合,训练得到Pin-SVM;
步骤6 利用最终得到的Pin-SVM,在测试集上得到算法的分类精度,并对极化SAR图像进行全图分类。
4. 实验结果及分析
4.1 实验数据介绍
实验采用的数据是EMISAR在Foulum地区获取的L波段全极化协方差矩阵数据,该图像的大小为1100×750,空间分辨率为2 m×2 m,其光学图与Pauli分解的伪彩色RGB合成图分别如图4(a)和图4(b)所示,该地区主要包括建筑物、森林、裸地以及豌豆、马铃薯、油菜、小麦等很多不同种类的农作物。通过大致比对光学图,把整幅图像划分为5类:建筑物、森林、裸地、细径作物和阔叶作物,选取的地物类别分布如图4(c)所示。
4.2 Pin-SVM与传统分类器分类结果对比与分析
实验中从每类地物选取1200个像素进行人工标注,并从中随机取出100个样本作为训练集,其余样本作为测试集。本文选取高斯核函数,采用网格搜索与十折交叉验证法选择最优的参数组合C,
{\sigma ^2} 和\tau ,最后根据“一对一”多分类策略对EMISAR数据进行全图分类,Pin-SVM分类结果如图5(a)所示。可以看出,Pin-SVM对EMISAR图像的分类效果较好,左侧和右上角的森林区域用黄色很好地标注出来,右上角和右下角的“枫叶形”和“马蹄形”建筑区域的轮廓较为清晰,裸地也表现出清晰的纹理。两种农作物之间有少数像素误分,但整体上能够与森林和建筑物清晰划分。可以从两个角度分析,从极化特征的角度,因为森林和建筑物区域散射随机性较强,散射机理较为复杂,极化散射熵值较高,各向异性度值较小,而两种农作物散射机理较为单一,极化散射熵值较小,各向异性度值较高;从纹理特征的角度,农作物区域地形较为均匀,表现为粗纹理,而森林和建筑物区域地形复杂,表现为细纹理,因此两种作物区域的能量ENY和反差距IDM更大,熵ENT、对比度CON、和平均SAV更小。为了验证本文方法的有效性,采用C-SVM分类器、监督Wishart分类器、最小二乘支持向量机(Least Square SVM, LSSVM)以及基于Hinge损失的极限学习机(OPTimization based Extreme Learning Machine, OPTELM)实验作为对比模型,对实验数据进行了分类实验,分类结果分别如图5(b)—图5(e)所示。通过图5(a)—图5(e)对比,可以看出基于Pin-SVM和C-SVM分类器的分类结果图中各地物的纹理比较清晰,但是C-SVM分类结果中包含较多杂点,Pin-SVM的分类结果中杂点较少,特别是在森林区域,C-SVM会将很多森林区域的样本判定为建筑物,而Pin-SVM对建筑物与森林的分类结果更好。监督Wishart分类器仅仅采用极化相干矩阵进行分类,没有结合纹理特征和H,A,
\bar \alpha ,因此出现将不同地物之间的边界以及森林区域有很多误分为建筑物的现象。LSSVM分类器也同样出现杂点较多的问题,OPTELM分类器对各地物的划分效果都不太理想,尤其是建筑物与森林、细径作物与阔叶作物出现误分现象较为明显。表1为不同分类器对各地物测试样本的分类精度对比,分类精度=(分类算法正确分类的样本点个数)/(测试样本像素点个数),其中Pin-SVM, C-SVM,监督Wishart, LSSVM和OPTELM的整体分类精度分别为91.3%, 86.7%, 84.0%, 84.5%和84.0%。
表 1 不同分类器对测试样本的分类精度(%)Table 1. Classification accuracy comparison of different classifiers分类器 地物类型 整体精度 建筑物 森林 裸地 细径作物 阔叶作物 Pin-SVM 94.3 90.7 95.1 82.3 94.1 91.3 C-SVM 91.0 80.6 92.3 80.1 89.7 86.7 Wishart 85.4 71.2 93.7 84.2 85.6 84.0 LSSVM 86.2 80.2 89.3 78.8 88.2 84.5 OPTELM 86.5 82.3 92.1 75.1 83.8 84.0 图6展示了各地物分类精度的对比图,从图中可以看出Pin-SVM对各种类型地物的分类精度均高于C-SVM。综合全图分类实验的结果可知:相比于传统的C-SVM分类方法,基于Pin-SVM的分类算法对极化SAR图像中各类地物均具有更好的性能,整体分类精度也更高。由于二者使用完全一致的特征输入,而此特征数据中必然存在一定程度的噪声,较高的分类精度也能够侧面印证提出的算法具有一定的噪声鲁棒性。
在以上实验中,发现建筑物和森林比较容易混淆误分,其原因除潜在的噪声之外,两者也具有较多相似散射特性和较强散射能量。针对这一现象,采用建筑物区域和森林区域的标注样本分别进行C-SVM与Pin-SVM分类,将这两种分类方法得到的
yf\left( x \right) 的概率密度函数(Probability Density Function, PDF)进行对比分析,如图7所示。从图7中可以看出,两种分类器的概率密度函数都只有1个峰,因此从森林和建筑物提取的这两类离散的样本均仅含1个样本中心,不存在子类的情况。同时,Pin-SVM得到的yf\left( x \right) 的PDF主要聚集在1附近,说明Pin-SVM在最小化误分类率的同时,也保证类内离散程度达到最小,从而使{L_\tau }\left( {1 - yf\left( x \right)} \right) 趋于0。而对于C-SVM, PDF主要在0.7左右聚集,即yf\left( x \right) < 1 ,此时{L_{{\rm{hinge}}}}\left( {1 - yf\left( x \right)} \right) > 0 ,这说明对于建筑物和森林的分类,Pin-SVM的性能要优于C-SVM。4.3 重采样的鲁棒性分析
在对极化SAR图像进行分类时,往往是人为选定训练样本的采样范围。在采用C-SVM进行极化SAR图像分类时,通常会由于改变训练样本的采样区域导致分类结果出现较大变化,因此,针对重采样问题对线性的C-SVM和Pin-SVM进行实验与分析。实验中分别从森林和建筑物区域选取与之前实验中标定区域不同的900个样本作为训练样本的采样区域,测试则采用之前选取的1100个测试样本。实验方法是每次采样时从900个样本中随机抽取100个样本作为训练样本,训练得到最优分类决策面,根据分类决策面的变化对分类器的重采样鲁棒性进行评估。固定超参数C=20,
\tau \in {\rm{\{ }}0.1,0.2,0.5,1.0\} ,表2展示了两种分类器对重采样的稳定性程度,其中重采样次数分别为30, 50, 100和150次。表 2 重采样实验结果Table 2. Experimental results of the resampling分类器 重采样 30次 50次 100次 150次 Pin-SVM w 8.96 \pm 1.11 8.69 \pm 0.99 8.57 \pm 0.96 8.63 \pm 0.95 \tau {\rm{ = }}1.0 b - 5.91 \pm 0.62 - 5.95 \pm 0.61 - 5.93 \pm 0.59 - 5.93 \pm 0.44 Pin-SVM w 9.43 \pm 1.23 9.54 \pm 1.20 9.42 \pm 1.15 9.68 \pm 1.13 \tau {\rm{ = 0}}{\rm{.5}} b - 6.93 \pm 0.75 - 7.02 \pm 0.71 - 6.91 \pm 0.67 - 6.85 \pm 0.59 Pin-SVM w 11.43 \pm 1.63 11.22 \pm 1.47 11.09 \pm 1.46 11.31 \pm 1.44 \tau {\rm{ = 0}}{\rm{.2}} b - 8.53 \pm 0.84 - 8.53 \pm 0.78 - 8.41 \pm 0.75 - 8.39 \pm 0.73 Pin-SVM w 12.30 \pm 1.84 12.12 \pm 1.74 12.23 \pm 1.61 12.09 \pm 1.59 \tau {\rm{ = 0}}{\rm{.1}} b - 9.57 \pm 1.02 - 9.88 \pm 0.99 - 9.50 \pm 0.97 - 9.62 \pm 0.92 C-SVM w 13.29 \pm 1.96 12.98 \pm 1.87 13.42 \pm 1.73 13.12 \pm 1.69 b - 16.15 \pm 3.04 - 15.81 \pm 2.74 - 15.92 \pm 2.45 - 15.48 \pm 2.28 图8给出了法向量w和偏置b稳定性的对比,从中可以看出,重采样后C-SVM的法向量w和偏置b的标准差都大于Pin-SVM,相比C-SVM, Pin-SVM对于重采样具有更好的鲁棒性。
4.4 超参数对算法性能影响的分析
由于Pin-SVM的分类性能受到超参数包括误差惩罚参数
C 、高斯核参数{\sigma ^2} 和参数\tau 的影响,因此通过实验对3种参数取值对分类算法的影响进行详细讨论。实验中固定其中1个超参数,探究另外2个超参数变化的情况下算法精度的变化情况,误差惩罚参数C 的选择范围为\left\{ {{2^i}|i = - 2, - 1,0,1,2,3} \right\} ,高斯核参数{\sigma ^2} 的选择范围为\left\{ {{2^i}|i = - 1,0,1,2,3} \right\} ,\tau 的选择范围是\left\{ {{\rm{0}}{\rm{.1,0}}{\rm{.3,0}}{\rm{.5,0}}{\rm{.7}},{\rm{0}}{\rm{.9}}} \right\} 。固定其中1个参数,Pin-SVM分类精度受另外2个参数影响如图9所示。从图9可以看出:随着惩罚参数
C 的增大,算法的分类精度逐渐提高;随着高斯核参数{\sigma ^2} 的减小,分类精度整体呈上升的趋势;随着参数\tau 的逐渐增大,分类精度呈先减小后增大的趋势。故在参数选择时应尽量选取较大的惩罚参数C 和较小的高斯核参数{\sigma ^2} ,参数\tau 的取值应该结合具体应用综合衡量。5. 结论
支持向量机在小样本情况下表现出了良好的学习能力和泛化能力,在极化SAR图像分类中应用广泛。但是极化SAR图像中的噪声会传递至图像特征以影响C-SVM的分类精度,同时标定样本的随机性会影响C-SVM的分类决策面的稳定性,这两点均不利于实际应用。本文基于Pin-SVM提出一种极化SAR图像地物分类的新方法,以提高对特征噪声和重采样的鲁棒性。通过Foulum地区EMISAR数据对提出算法的分类精度、重采样稳定性、噪声不敏感性和类内离散程度等方面进行实验分析,结果表明本文算法相对于传统方法具有更好的地物分类效果,对噪声和重采样有更强的鲁棒性。
-
表 1 不同分类器对测试样本的分类精度(%)
Table 1. Classification accuracy comparison of different classifiers
分类器 地物类型 整体精度 建筑物 森林 裸地 细径作物 阔叶作物 Pin-SVM 94.3 90.7 95.1 82.3 94.1 91.3 C-SVM 91.0 80.6 92.3 80.1 89.7 86.7 Wishart 85.4 71.2 93.7 84.2 85.6 84.0 LSSVM 86.2 80.2 89.3 78.8 88.2 84.5 OPTELM 86.5 82.3 92.1 75.1 83.8 84.0 表 2 重采样实验结果
Table 2. Experimental results of the resampling
分类器 重采样 30次 50次 100次 150次 Pin-SVM w 8.96 \pm 1.11 8.69 \pm 0.99 8.57 \pm 0.96 8.63 \pm 0.95 \tau {\rm{ = }}1.0 b - 5.91 \pm 0.62 - 5.95 \pm 0.61 - 5.93 \pm 0.59 - 5.93 \pm 0.44 Pin-SVM w 9.43 \pm 1.23 9.54 \pm 1.20 9.42 \pm 1.15 9.68 \pm 1.13 \tau {\rm{ = 0}}{\rm{.5}} b - 6.93 \pm 0.75 - 7.02 \pm 0.71 - 6.91 \pm 0.67 - 6.85 \pm 0.59 Pin-SVM w 11.43 \pm 1.63 11.22 \pm 1.47 11.09 \pm 1.46 11.31 \pm 1.44 \tau {\rm{ = 0}}{\rm{.2}} b - 8.53 \pm 0.84 - 8.53 \pm 0.78 - 8.41 \pm 0.75 - 8.39 \pm 0.73 Pin-SVM w 12.30 \pm 1.84 12.12 \pm 1.74 12.23 \pm 1.61 12.09 \pm 1.59 \tau {\rm{ = 0}}{\rm{.1}} b - 9.57 \pm 1.02 - 9.88 \pm 0.99 - 9.50 \pm 0.97 - 9.62 \pm 0.92 C-SVM w 13.29 \pm 1.96 12.98 \pm 1.87 13.42 \pm 1.73 13.12 \pm 1.69 b - 16.15 \pm 3.04 - 15.81 \pm 2.74 - 15.92 \pm 2.45 - 15.48 \pm 2.28 -
[1] CHEN Qiang, KUANG Gangyao, LI J, et al. Unsupervised land cover/land use classification using PolSAR imagery based on scattering similarity[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(3): 1817–1825. doi: 10.1109/tgrs.2012.2205389 [2] LI Wenmei, CHEN Erxue, LI Zengyuan, et al. Forest aboveground biomass estimation using polarization coherence tomography and PolSAR segmentation[J]. International Journal of Remote Sensing, 2015, 36(2): 530–550. doi: 10.1080/01431161.2014.999383 [3] FOUCHER S, LANDRY T, LÓPEZ-MARTÍNEZ C, et al. An evaluation of PolSAR speckle filters on compact-pol images[C]. Proceedings of 2012 IEEE International Geoscience and Remote Sensing Symposium, Munich, Germany, 2012: 5089–5092. doi: 10.1109/IGARSS.2012.6352466. [4] LIU Xunan and CHENG Bo. Polarimetric SAR speckle filtering for high-resolution SAR images using RADARSAT-2 POLSAR SLC data[C]. Proceedings of 2012 International Conference on Computer Vision in Remote Sensing, Xiamen, China, 2012: 329–334. doi: 10.1109/CVRS.2012.6421284. [5] 滑文强, 王爽, 侯彪. 基于半监督学习的SVM-Wishart极化SAR图像分类方法[J]. 雷达学报, 2015, 4(1): 93–98. doi: 10.12000/JR14138HUA Wenqiang, WANG Shuang, and HOU Biao. Semi-supervised learning for classification of polarimetric SAR images based on SVM-Wishart[J]. Journal of Radars, 2015, 4(1): 93–98. doi: 10.12000/JR14138 [6] ZHANG Yue, ZOU Huanxin, SHAO Ningyuan, et al. Unsupervised classification of polsar imagery based on consensus similarity network fusion[C]. Proceedings of 2017 IEEE International Geoscience and Remote Sensing Symposium, Fort Worth, USA, 2017: 3266–3269. doi: 10.1109/IGARSS.2017.8127694. [7] BI Haixia, SUN Jian, and XU Zongben. Unsupervised PolSAR image classification using discriminative clustering[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(6): 3531–3544. doi: 10.1109/TGRS.2017.2675906 [8] FERRO-FAMIL L, POTTIER E, and LEE J S. Unsupervised classification of multifrequency and fully polarimetric SAR images based on the H/A/Alpha-Wishart classifier[J]. IEEE Transactions on Geoscience and Remote Sensing, 2001, 39(11): 2332–2342. doi: 10.1109/36.964969 [9] SHANG Fang and HIROSE A. Use of Poincare sphere parameters for fast supervised PolSAR land classification[C]. Proceedings of 2013 IEEE International Geoscience and Remote Sensing Symposium, Melbourne, Australia, 2013: 3175–3178. doi: 10.1109/IGARSS.2013.6723501. [10] DABBOOR M and SHOKR M. A new likelihood ratio for supervised classification of fully polarimetric SAR data: An application for sea ice type mapping[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 84: 1–11. doi: 10.1016/j.isprsjprs.2013.06.010 [11] ZHANG Lamei, SUN Liangjie, ZOU Bin, et al. Fully polarimetric SAR image classification via sparse representation and polarimetric features[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(8): 3923–3932. doi: 10.1109/JSTARS.2014.2359459 [12] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]. Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 770–778. doi: 10.1109/CVPR.2016.90. [13] VAPNIK V N. The Nature of Statistical Learning Theory[M]. New York, US: Springer-Verlag, 2000: 267–290. doi: 10.1007/978-1-4757-3264-1. [14] MAGHSOUDI Y, COLLINS M J, and LECKIE D G. Radarsat-2 polarimetric SAR data for boreal forest classification using SVM and a wrapper feature selector[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2013, 6(3): 1531–1538. doi: 10.1109/JSTARS.2013.2259219 [15] CHEN Wenshuai, HAI Dong, GOU Shuiping, et al. Classification of PolSAR images based on SVM with Self-Paced learning optimization[C]. Proceedings of 2018 IEEE International Geoscience and Remote Sensing Symposium, Valencia, Spain, 2018: 4491–4494. doi: 10.1109/IGARSS.2018.8517452. [16] SUYKENS J A K and VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293–300. doi: 10.1023/a:1018628609742 [17] WANG Yidan, YANG Liming, and YUAN Chao. A robust outlier control framework for classification designed with family of homotopy loss function[J]. Neural Networks, 2019, 112: 41–53. doi: 10.1016/j.neunet.2019.01.013 [18] BO Liefeng, WANG Ling, and JIAO Licheng. Recursive finite newton algorithm for support vector regression in the primal[J]. Neural Computation, 2007, 19(4): 1082–1096. doi: 10.1162/neco.2007.19.4.1082 [19] WU Yichao and LIU Yufeng. Robust truncated hinge loss support vector machines[J]. Journal of the American Statistical Association, 2007, 102(479): 974–983. doi: 10.1198/016214507000000617 [20] LIU Dalian, SHI Yong, and TIAN Yingjie. Ramp loss nonparallel support vector machine for pattern classification[J]. Knowledge-Based Systems, 2015, 85: 224–233. doi: 10.1016/j.knosys.2015.05.008 [21] HUANG Xiaolin, SHI Lei, and SUYKENS J A K. Support vector machine classifier with pinball loss[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(5): 984–997. doi: 10.1109/tpami.2013.178 [22] BO Liefeng, WANG Ling, and JIAO Licheng. Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J]. Neural Computation, 2006, 18(4): 961–978. doi: 10.1162/neco.2006.18.4.961 [23] SCHOLKOPF B, MIKA S, BURGES C J C, et al. Input space versus feature space in kernel-based methods[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1000–1017. doi: 10.1109/72.788641 [24] ZHANG Lamei, ZOU Bin, CAI Hongjun, et al. Multiple-component scattering model for polarimetric SAR image decomposition[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(4): 603–607. doi: 10.1109/lgrs.2008.2000795 [25] CLOUDE S R and POTTIER E. An entropy based classification scheme for land applications of polarimetric SAR[J]. IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68–78. doi: 10.1109/36.551935 [26] HARALICK R M, SHANMUGAM K, and DINSTEIN I. Textural features for image classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, SMC-3(6): 610–621. doi: 10.1109/TSMC.1973.4309314 [27] DEKKER R J. Texture analysis of urban areas in ERS SAR imagery for map updating[C]. Proceedings of IEEE/ISPRS Joint Workshop on Remote Sensing and Data Fusion over Urban Areas, Rome, Italy, 2001: 226–230. doi: 10.1109/DFUA.2001.985885. [28] LEE J S, GRUNES M R, and DE GRANDI G. Polarimetric SAR speckle filtering and its implication for classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 2363–2373. doi: 10.1109/36.789635 期刊类型引用(2)
1. 张浩波,牛朝阳,刘伟,李陶,高欧阳,李润生. 联合SVM与AHP的PolSAR图像滑坡自动检测方法. 现代雷达. 2023(08): 33-41 . 百度学术
2. 魏丹,李渊,黄丹. 极化SAR图像地物分类方法综述. 计算机系统应用. 2020(11): 29-39 . 百度学术
其他类型引用(6)
-