-
摘要: 现代战争日趋信息化和智能化,雷达自动目标识别技术(RATR)在国家安全防卫和战略预警等军事应用方面发挥着更加重要的作用。高分辨距离像(HRRP)反映了目标散射点沿雷达视线方向的分布情况,包含了目标丰富的结构信息,对目标识别十分有价值,已成为RATR领域的研究热点。参数化统计建模旨在构建参数化数学模型表征观测数据的分布特性,是估计数据概率分布和挖掘数据隐含信息的重要手段。基于参数化统计模型的雷达HRRP目标识别就是在对HRRP参数化统计建模的基础上,直接利用估计的概率分布进行统计识别或将获取的隐含信息输入分类器进行识别。由于模型具有可融入一定的先验知识、扩展灵活、提供待求参数的不确定性评价以及能结合贝叶斯理论实现自动定阶等优势,基于参数化统计模型的HRRP识别方法整体识别性能优于其他方法,是目前HRRP识别的重点研究方向。该文从浅层和深层参数化统计建模两方面,对近15年的雷达HRRP目标识别方法进行了归纳总结,并分析了各类方法的特点和存在的问题,最后对基于HRRP参数化统计建模的雷达目标识别发展方向进行了展望。Abstract: In the gradually becoming information-based and intelligent modern warfare, Radar Automatic Target Recognition (RATR) technology plays an increasingly important role in military applications, such as national security defense and strategic early warning. The High-Resolution Range Profile (HRRP) reflects the distribution of target scatterers along the radar line of sight and contains a target’s rich structural information, thus being valuable for target recognition and having become a research hotspot in the field of RATR. Parametric statistical modeling aims to construct a parametric mathematical model to characterize the distribution of observed data. It is an important way to estimate the data probability distribution and mine the hidden information of data. Radar HRRP target recognition based on a parametric statistical model directly uses the estimated probability distribution for statistical recognition or inputs the extracted information hidden in data into the classifier for target recognition. The parametric statistical model exhibits advantages in prior knowledge integration, flexible expansion, parameter uncertainty evaluation, and automatic order determination combined with Bayesian theory; therefore, the overall performance of the HRRP recognition method based on such a model is better than that of other methods. Therefore, parametric statistical modeling is currently the key research direction for radar HRRP recognition. This paper summarizes the radar HRRP target recognition methods of the last 15 years from the two aspects of shallow statistical modeling and deep statistical modeling, analyzes the characteristics and problems of these methods, and forecasts the development direction of radar target recognition based on HRRP parametric statistical modeling.
-
1. 引言
作为一种具有全天时、全天候和远距离探测能力的无线电装备,雷达通过发射电磁波并利用电磁波的后向散射回波来发现目标并对其空间位置进行测定,是军事领域中重要的目标探测工具[1-4]。然而,当前战争日趋信息化和智能化,雷达常规的目标检测与定位功能远远不能满足实际作战需求,希望进一步获取目标更详细的信息实现对战场环境的监测预警,雷达自动目标识别(Radar Automatic Target Recognition, RATR)技术因此发展起来。RATR是实现对目标属性、类别或型号判定的重要手段,可以为目标用途、威胁等级的研判以及保障后续作战指挥的正确决策提供可靠的情报信息,是现代战场态势感知的迫切需求。
如图1所示,宽带雷达探测目标的高分辨距离像(High-Resolution Range Profile, HRRP)是目标散射点子回波沿雷达视线方向投影后叠加形成的一维向量,包含了目标形状、结构、尺寸、散射中心分布等较为精细的信息,且较二维合成孔径雷达(Synthetic Aperture Radar, SAR)图像/逆合成孔径雷达(Inverse Synthetic Aperture Radar, ISAR)图像更易获取和处理,对雷达系统要求低。因此,研究基于雷达HRRP回波信号的目标识别对快速可靠的目标身份确认、进一步实现目标特性和事件的准确感知具有重要意义[5-12]。
目前,基于HRRP信号的雷达目标识别方法众多,图2从非参数化和参数化的角度对现有雷达HRRP目标识别方法进行了归纳总结。
(1) 非参数化HRRP目标识别方法
此类方法无需构建包含待估参数的数学模型,大致又可细分为基于非参数化特征提取和非参数化概率密度估计的HRRP识别方法两种。
非参数化特征提取方法计算HRRP的统计特征或变换域特征,然后利用所提特征训练分类器实现对未知目标类别的判断。由于特征质量直接影响识别系统的性能,基于非参数化特征提取的雷达HRRP目标识别主要集中在对HRRP特征提取的研究上。文献[8]从HRRP回波中提取了目标径向尺寸,并利用序贯脉冲积累对尺寸估计结果进行滑窗处理,通过计算各个窗内径向尺寸的均值、极差、中值以及结尾均值4种统计特征实现了目标识别;文献[13,14]从HRRP中提取了目标峰值个数和重心等一些具有物理意义的特征,文献[15]提取了方位稳健的HRRP散射点强度分布像,这些都属于统计特征;文献[16,17]分别计算了HRRP样本的中心矩和双谱特征,杜兰等研究人员分析比较了HRRP的功率谱[18]、FFT幅度特征[19]和高阶谱[20]等频域特征,这些特征都属于变换域特征。如图2所示,非参数化特征提取方法计算简单,识别的特征具有明确含义、解释性强,但过分依赖研究人员对数据的认知和经验的积累,缺乏灵活性,且特征提取与分类器训练是独立进行的,很容易造成特征与后端分类器的不匹配,从而限制识别系统的性能。
非参数化概率密度估计利用非参数化方法估计HRRP各距离单元回波的概率分布,各距离单元概率分布相乘得到HRRP样本的概率分布,然后基于最大类后验准则对未知样本进行识别,如Parzen窗核估计[21]和k近邻估计[22]等。非参数化概率密度估计方法在数据分布形式未知的情况下仅利用数据本身就能做出分布估计,具有较强的通用性。然而,这类方法完全数据驱动,难以在概率密度函数估计过程中加入先验知识,而合理先验信息的融入对数据拟合精度的提升具有一定帮助。而且,非参数化概率密度估计方法在实际运用中需要比参数化方法更多的训练样本,这带来很大的存储和计算开销。
(2) 参数化HRRP目标识别方法
此类方法通过构建包含待估参数的数学模型实现对未知目标类别的判断,由于其建模方式多样、模型自由度高,较非参数化方法整体灵活性更强,进而面向不同任务需求可以设计不同的、针对性强的建模方法,因此是近年来许多研究者的主要研究方向。从模型能否描述数据概率分布的角度,参数化HRRP识别方法可细分为基于非统计模型特征提取和基于统计模型概率密度估计的方法两种。
非统计模型不能描述观测HRRP数据的概率分布,通常获得数据隐特征的点估计,然后基于隐特征进行分类识别。如文献[23]基于散射点模型,通过正交匹配追踪(Orthogonal Matching Pursuit, OMP)算法对HRRP强散射点的幅度和位置进行了估计,并利用Hausdorff距离[24]实现了对HRRP的噪声稳健识别;文献[25]基于K次奇异值分解(K Singular Value Decomposition, K-SVD)算法学习了各类HRRP数据的超完备字典,利用OMP算法求解测试HRRP样本在各类字典条件下的稀疏编码后,通过最小重构误差准则进行识别;文献[26-27]和文献[28]分别构建了堆栈校正自编码器(Stacked Corrective AutoEncoders, SCAE)、注意力循环神经网络(Target-Aware Recurrent Attentional Network, TARAN)和卷积神经网络(Convolutional Neural Network, CNN),提取了HRRP数据的深层特征,获得了比浅层模型更优的识别性能。
参数化统计模型旨在通过拟合观测HRRP的概率分布实现对数据概率密度函数的估计或概率隐特征的提取,然后直接基于概率密度函数进行统计识别或将概率隐特征输入分类器进行识别。如图2所示,相较于参数化非统计模型,统计建模方法主要具有以下优势:
(1) 可融入一定先验知识,为目标类别的判断提供除数据自身外更多可靠的信息,提升识别准确率。例如,在结合HRRP方位分帧且各帧独立建模的统计识别中,可以根据目标方位信息,缩小最优方位帧模板的搜索范围,提高识别效率的同时减少匹配到异类模板的情况,增强了模型的识别能力[18,29]。又如,基于对HRRP非严格高斯分布的经验认知,对HRRP幂次变换后高斯建模,在保留高斯模型推理简便、易实现的优势的同时可以降低模型与数据的失配程度,如图3所示。
(2) 能够对模型参数的分布进行估计,相较于非概率统计模型的点估计,合理拓展了模型参数的取值范围,泛化能力更强。如利用概率自编码器[30]可以估计得到各类HRRP训练样本隐特征的概率分布,从而对那些与同类训练样本特征同分布但数值差异较大的测试样本特征仍能够给出正确的类别判断,而传统代数框架下的自编码器[26,31]在此情况下很可能识别错误。具体地,对于同一批实测飞机目标HRRP数据,基于概率自编码模型特征提取的目标识别准确率达到92.12%,较传统代数框架下的自编码模型高1.5%左右。
(3) 模型扩展灵活,同一模型框架延伸使用方式或改变参数分布便可用于不同的任务场景。例如,文献[32]将散射中心模型[23]概率化,在保留目标散射点提取能力的同时,还可以刻画各目标散射点分布在不同角域下的统计特性,并以此作为识别模板直接进行基于散射中心模板匹配的HRRP识别,实现信号模型与识别模型相统一。该方法能够提取物理可解释的识别特征,具有比非统计模型更优的识别性能,如图4所示。又如,将概率自编码模型隐特征的高斯分布替换为混合高斯分布[33],模型在保留数据生成能力的同时可实现特征聚类的功能扩展。
(4) 可结合贝叶斯理论实现模型自动定阶,如聚类模型中,结合狄利克雷过程(Dirichlet Process, DP)先验实现聚类个数的自动确定,如图5所示的基于DP先验的变分自编码器模型[34]。
由于在集成附加信息、提供待求参数的不确定性评价、灵活扩展以及模型自动定阶等方面的独特优势,参数化统计建模广泛应用于雷达HRRP目标识别,并且展现出优异性能。如图6所示,从模型结构的角度,参数化HRRP统计模型可以细分为浅层统计模型和深层统计模型两种。
浅层参数化统计模型通常事先对HRRP数据的概率分布形式作出假设,然后利用最大似然估计、最大后验估计等数理统计方法直接求解分布参数。例如,文献[35,36]假设HRRP服从伽马分布;文献[37]在HRRP服从单高斯分布的假设条件下构建了自适应高斯分类器(Adaptive Gaussian Classifier, AGC),并采用最大似然估计法对高斯分布的均值和协方差矩阵进行了估计;考虑到由于方位敏感性产生的HRRP多模分布特性,文献[38]假设HRRP服从混合高斯分布并采用期望最大化算法对各模态的高斯均值与协方差矩阵进行求解,以表征HRRP的非线性非高斯特性。除直接估计分布参数外,浅层参数化统计建模方法也可通过建立隐变量z到观测数据x的单次线性/非线性映射关系,即定义
x=fθ(z) (1) 其中,
fθ(⋅) 表示参数为θ 的单次线性映射或多个不同线性变换组合形成的非线性映射,然后通过对隐变量先验分布p(z) 进行假设,并根据表达式p(x) = ∫p(x|z)p(z)dz (2) 其中,
p(x|z) 可由fθ(⋅) 的具体形式计算得到,最终可实现对观测数据分布p(x) 的间接求解。例如,文献[39]在假设HRRP服从各距离单元统计相关的联合高斯分布条件下,分别利用概率主成分分析(Probability Principal Components Analysis, PPCA)模型、因子分析(Factor Analysis, FA)模型将HRRP表示为高斯分布低维隐变量的线性投影过程,通过估计投影矩阵、隐变量后验分布表达式,并根据高斯分布性质,间接计算得到了HRRP数据的显式分布表达式;同样考虑到HRRP的多模分布特性,文献[40]提出了多个FA模型集成的局部因子分析(Local Factor Analysis, LFA)模型,形成了隐变量到观测数据的单层非线性映射;文献[41]利用隐马尔可夫模型(Hidden Markov Model, HMM)对单个HRRP样本建模,将HRRP样本各距离单元看作由一个隐状态相应的高斯分布采样生成,且当前距离单元回波的隐状态由之前距离单元对应的隐状态依一定的转移概率得到,从而挖掘了HRRP距离单元之间存在时序相关性;文献[42,43]在利用FA模型对数据的概率分布进行描述的同时,还将隐变量利用支持向量机(Support Vector Machine, SVM)映射到样本的类别标签,利用类别标签之间的差异性约束隐变量向更可分的方向学习,最终增强了不同类模型之间的差异。在识别阶段,HRRP浅层统计建模方法一方面可以利用估计的各目标类观测数据概率分布{pc(x)}Cc=1 (C表示目标类别数)基于贝叶斯定理计算测试样本x∗ 在各目标类条件下的后验概率,即p(c|x∗)∝p(x∗|c)p(c)=pc(x∗)p(c) (3) 其中,
c=1,2,⋯,C ,然后将测试样本判别为最大后验概率所对应的目标类,即c∗=argmaxcp(c|x∗) (4) 其中,
c∗ 表示测试样本x∗ 的预测类别,最终可以实现HRRP的统计识别,如文献[35-41];另一方面,对于建模隐变量分布到数据分布的浅层统计模型,也可将估计的隐变量后验分布p(z|x,θ) 视为特征,通过设计合适的分类器对HRRP隐特征进行分类,如文献[42]直接利用构建的SVM对FA模型提取的数据隐特征进行识别。浅层HRRP统计建模方法的关键是观测数据概率分布形式的选取,然而,现有浅层模型难以兼顾不同HRRP距离单元回波之间分布形式的差异及其之间的统计相关性,数据分布描述精度还有较大提升空间。深层HRRP统计建模方法不需对HRRP概率分布形式进行预设,通常建立隐变量分布到HRRP数据分布的多次非线性映射,即定义
x=fθ1(z1),z1=fθ2(z2),⋯,zL−1=fθL(zL) (5) 其中,
fθl(⋅) 表示参数为θl 的单次非线性映射,然后通过对各层隐变量zl (l=1,2,⋯,L )或最高层隐变量zL 赋予先验分布,实现对观测数据分布的间接拟合。一方面多层非线性变化使模型具备对观测数据分布更为强大的拟合能力,另一方面由于深层网络能够挖掘数据的层次化隐特征,且较浅层特征,深层特征更有效、更能反映目标的本质结构特性,从而在类间可分性方面更具优势,如图6所示。同时,考虑到多层非线性映射致使难以获得数据概率分布的显式表达式,雷达HRRP深层统计建模方法主要基于所提深层概率隐特征并选择合适的分类器进行目标识别。例如,文献[30]在变分自编码器(Variational Autoencoder, VAE)[44]的基础上结合HRRP回波特性构建了稳健变分自编码器,通过引入距离像平均像约束提升了特征在低信噪比、存在幅度扰动和奇异样本情况下的稳定性,基于线性SVM的特征识别验证了所提方法的有效性;文献[45]在稳健VAE的基础上进一步将模型所提隐特征映射到样本类别标签,增强了特征可分性的同时避免了所提特征与所学分类器适配的问题,进一步提升了模型的识别性能;考虑到大规模情况下HRRP数据分布的复杂性,文献[34]提出了判别混合变分自编码器,通过采用多个子解码器集成共同描述全部观测数据的方式,增强了模型对数据分布的精细能力、缓解了因数据描述不准而造成的特征对数据表征能力差、可分性弱的问题;为了深度挖掘HRRP距离单元回波之间的复杂时序关系,深层时序网络(如结合混合高斯模型的循环神经网络[46]、循环伽马置信网络[47]等)被提出,实现了对信号序列更精确的建模。本文以雷达HRRP目标识别为背景,分别从浅层模型构建和深层模型构建的角度,集中对近15年来的HRRP参数化统计建模方法进行归纳总结,并分析该技术领域存在的问题,指出其发展趋势。具体地,第2节介绍基于浅层参数化统计模型的雷达HRRP目标识别方法,按照模型是否能够描述HRRP不同距离单元之间的统计相关性,分别介绍了独立统计模型和联合统计模型,并将联合统计模型细分为自回归模型、子空间学习模型、时序模型和散射点模型4类进行详细分析。HRRP深度概率统计建模方面,目前相关研究还相对较少,第3节主要从变分自编码器及其改进模型、深层时序模型两方面进行了总结分析。基于第2,3节对现有浅层和深层参数化统计建模方法存在问题的分析,第4节对未来雷达HRRP参数化统计建模方法的发展趋势进行了展望。第5节对全文进行了归纳总结。
2. 基于浅层参数化统计模型的雷达HRRP目标识别
构建浅层参数化统计模型获得HRRP数据概率分布的解析表达式或浅层隐特征,然后基于概率分布进行统计识别或基于隐特征学习分类器进行识别,是HRRP目标识别领域一类典型的识别方法。如图7所示,从是否考虑HRRP不同距离单元之间统计相关性的角度,目前浅层HRRP参数化统计模型可分为独立统计模型和联合统计模型两大类。
2.1 独立统计模型
基于独立统计模型的雷达HRRP识别方法认为HRRP各距离单元回波相互独立,即服从独立的概率分布。根据各距离单元回波分布形式假设的不同,相关研究者提出了不同的独立统计模型,如表1所示,大致包括假设HRRP各距离单元回波均具有单峰特性的单模分布模型、假设HRRP距离单元回波具有多峰特性的多模分布模型以及综合参数化独立统计建模与非参数化统计建模的半参数化模型。
表 1 不同独立统计建模方法比较Table 1. Comparison of different independent statistical modeling methods方法 优点 缺点 单模分布模型 计算简单、易实现。 各距离单元回波分布复杂性考虑不足,对多模分布距离单元回波的拟合精度低。 多模分布模型 能够准确拟合具有多模特性的距离单元回波分布。 计算复杂,模态个数需要人为预设,易造成过拟合/欠拟合。 半参数化模型 避免了多模分布模型中的模态个数预设问题,
实现模态数随数据的自适应确定。引入非参数化统计方法对训练样本数的需求大大增加。 在单模分布建模方面,李斌等人[36]分别利用高斯分布和伽马分布对HRRP各距离单元回波建模,然后基于所构建的模型进行统计目标识别。考虑到HRRP的方位敏感性,文献[36]首先对训练HRRP数据进行方位帧划分,保证每帧数据对应的目标方位角不发生越距离单元走动。对于第c类第m帧观测HRRP数据
{x(c,m)n}N(c,m)n=1 (c=1,2,⋯,C ,C表示类别数;m=1,2,⋯,Mc ,Mc 表示第c类数据中包含的方位帧数,N(c,m) 表示该帧HRRP样本数),在训练阶段,高斯独立统计模型和伽马独立统计模型基于最大似然准则分别估计该方位帧数据的高斯分布参数(均值向量和协方差矩阵,其中HRRP各距离单元统计独立,因此协方差矩阵为对角阵)以及伽马分布参数(形状参数和尺寸参数),然后将估计的各帧数据分布参数作为模板储存用于后续识别。测试阶段,对于待测HRRP样本x∗ ,首先根据贝叶斯定理计算其在各目标各帧模板条件下的后验概率,即p(c,m|x∗)∝p(x∗|c,m)p(c,m) (6) 其中,
c=1,2,⋯,C ,m=1,2,⋯,Mc ,然后将x∗ 判别为具有最大帧后验概率对应的目标类,即统计识别。式(6)中,p(c,m) 表示各帧先验概率,p(x∗|c,m) 表示测试样本在目标c第m帧模板条件下的条件似然概率,由训练阶段得到的高斯/伽马分布参数估计得到。文献[36]以两类椎体目标、一类球体目标的仿真数据识别为具体应用,独立高斯模型与独立伽马模型的识别准确率分别为87.5%和96.9%;同样利用独立高斯模型和独立伽马模型,文献[18]在3类实测飞机目标上的识别结果分别为87.87%和89.82%,说明伽马模型较高斯模型对HRRP数据分布特性的描述能力更强。然而,Copsey等人[48]指出利用单一分布形式对所有HRRP样本建模过于严苛。如对于图8所示的呈双峰分布的距离单元回波,单一分布形式的统计模型很难准确地表征数据分布特性。多模分布模型提供了一种具有足够灵活的参数化方法,能够对HRRP数据中可能存在的广泛的概率密度分布形式进行建模。基于对雷达回波物理特性的研究,文献[48]采用混合伽马分布对每一类HRRP数据进行建模。对来自目标c的观测HRRP样本x,混合伽马模型将其分布表示为多个不同伽马分布的加权和,采用MCMC算法对模型参数求解后基于类最大后验准则实现了对测试样本类别属性的判断。同样基于多模分布建模的思想,文献[49]在对HRRP方位分帧和各帧各距离单元回波聚类的基础上,将只包含弱散射点(第1类距离单元)以及仅包含一个特显点的距离单元(第2类距离单元)回波建模为伽马分布、将包含多个特显点的距离单元(第3类距离单元)回波建模为混合高斯分布,提出了伽马-高斯混合独立双分布模型。如图9所示,伽马-高斯混合独立双分布模型能够对不同分布形式的HRRP距离单元回波进行较好的拟合,相比于各距离单元回波只用具有单一分布形式的、单峰分布的高斯或伽马模型,其对HRRP回波统计特性的描述更细致全面,具有更优的统计识别性能。在最优幂次变换参数搜索情况下,独立双分布模型较独立高斯模型和独立伽马模型在实测飞机目标HRRP数据集上的识别准确率高6.71%和4.76%[49]。
混合伽马模型需要预先确定混合成分的个数,伽马-高斯混合独立双分模型需要通过一定的聚类算法估计距离单元中特显点个数来确定相应距离单元的分布类型,混合成分个数设置不合适或者聚类结果不稳定会严重影响上述混合模型的识别准确率。针对上述问题,半参数化HRRP统计建模方法被提出。文献[21]将参数化概率密度估计方法和非参数化概率密度估计方法相结合,引入了非参数化修正因子对伽马模型进行修正,在实现对不同分布形式的HRRP距离单元回波灵活建模的同时避免了模型超参数的提前设定或估计。同样基于半参数化建模的思想,文献[50]结合伽马模型和基于累计量的随机学习(Stochastic Learning of the Cumulative, SLC)算法来描述HRRP的概率分布,基于最大熵原则从两种方法估计的概率分布中选择一种用作单个距离单元回波的概率密度函数,也实现了对不同分布形式距离单元回波的精细描述。
2.2 联合统计模型
实际在不发生越距离单元走动的方位角范围内,目标转动时不同距离单元内驻留的散射点的转动形式是完全相同的,从而各距离单元内散射点间波程差的变化相关,造成HRRP样本某些距离单元回波幅度起伏具有相关性;而且,为了获取去噪HRRP所进行的雷达回波加窗处理、散射点间多次散射以及目标不同部位几何结构的相似性都会造成HRRP距离单元回波之间的相关性。如图10所示,一定角域内的HRRP样本协方差阵存在非对角线元素为非0值的情况,表明HRRP各距离单元之间并非完全独立。
独立统计模型忽略了HRRP不同距离单元之间的统计相关性,对数据信息利用不足,整体识别性能受限。联合统计模型能够建模HRRP距离单元之间的相关性,在刻画HRRP距离单元回波分布特性时充分考虑了距离单元之间的相互关系,数据统计特性描述能力较独立统计模型更强。从建模方式的角度,联合统计模型可以分为自回归模型、子空间学习模型、时序模型和散射点模型。
2.2.1 自回归模型
通过数学推导可知,HRRP频谱幅度服从广义平稳过程[51],不同目标结构不同,其频谱幅度所服从的广义平稳过程的统计特性也各不相同,因此可以使用频谱幅度统计特性的差异作为区分不同目标的判别信息。自回归(Autoregressive, AR)模型广泛应用于平稳过程建模。假设某HRRP回波样本为x,其对应的频幅为
z=[z1,z2,⋯,zd] ,其中zf (f=1,2,⋯,d )代表频幅中第f个频率分量幅度大小,d代表该频幅z的维度,则m阶的AR模型可以表示为zf=a0+∑mk=1akzf−k+ef (7) 其中,
a0 为频幅分量的均值,ak (k=1,2,⋯,m) 表示AR模型系数,白噪声序列{ef}df=1 服从均值为0、方差为σ2 的高斯分布。由AR模型表达式可知,与假设HRRP样本各距离单元独立同分布的独立统计模型不同,AR模型中各频幅分量均依赖于之前的观测值,充分考虑了不同距离单元之间的相关性。自回归系数{ak}mk=0 表征着HRRP频谱幅度全局的频率变化信息,常作为特征用于目标识别。AR模型将HRRP频谱幅度建模为单高斯分布,然而,如图11所示,HRRP频幅分量并非完全服从单峰分布,具有一定的多模分布特性。基于上述分析,文献[52]提出了混合自回归(Mixture Autoregressive, MAR)模型。
考虑J个不同的AR模型,假设第j(
j=1,2,⋯,J )个AR模型的阶数为mj ,均值为aj0 ,系数为ajk(k=1,2,⋯,mj) ,则MAR模型定义为pMAR(zf|{zf−k}mjk=1,Θ)=∑Jj=1γjN(zf|aj0+∑mjk=1ajkzf−k,σ2j) (8) 其中,
γj (j=1,2,⋯,J )分别表示各个AR分量的权重,且∑Jj=1γj=1 ,Θ={{γj}Jj=1,{ajk}J,mjj=1,k=0,{σ2j}Jj=1} 表示MAR模型参数的集合。MAR模型实际上是混合高斯模型与AR模型的结合。首先,在给定的频点f处,频幅分量zf 服从混合高斯分布;其次,当自回归分量个数J=1 时,MAR模型退化为AR模型。根据AR模型的性质可知,多个AR模型的和仍可以描述平稳过程。由于MAR模型上述特点,其能够较好地对HRRP数据分布进行建模。如图12所示,AR模型与MAR模型均考虑了HRRP距离单元之间的相关性,整体识别精度明显优于独立高斯模型;由于MAR模型采用多模型混合建模方式对数据分布的描述精度更精细,能够更充分、准确地获取不同目标之间的统计差异性信息,故其对不同目标的识别能力更稳健,整体识别率也高于只能描述单峰分布数据的AR模型。综上,自回归模型主要分为对HRRP频幅建模为单高斯分布和混合高斯分布的自回归模型两种,如表2所示。传统单高斯自回归模型整体计算简单、易实现,但难以对多模分布的频幅分量准确建模,整体描述能力受限;混合自回归模型集成多个单高斯自回归模型能更准确、细致地表征HRRP频幅分量的分布复杂性,但其需要预先设定混合成分的个数,这依赖于较强的人工经验与先验认知,削弱了模型的数据自适应性。
表 2 不同自回归模型比较Table 2. Comparison of different autoregressive models方法 优点 缺点 单高斯自回归模型 计算简单、易实现;考虑了HRRP距离单元回波之间的相关性,能够反映HRRP的频谱幅度变化特性。 难以对呈多模分布的频幅分量进行高精度拟合,整体描述能力有限。 混合自回归模型 对各频幅分量采用多个单高斯自回归模型描述,可以表征频幅分量的多模分布特性,建模精度更高。 需要预先设定混合成分个数,对人工经验和先验认知依赖性强,数据自适应性能力差。 2.2.2 子空间学习模型
子空间学习模型的基本思想是基于某种准则函数建立一个低维的特征子空间,通过一定的映射关系,将已有的高维雷达HRRP样本向这个低维的特征子空间投影[53]。由表3可知,子空间学习模型主要包括基于主成分分析(Principal Component Analysis, PCA)的方法和基于因子分析(Factor Analysis, FA)的方法两种。
表 3 不同子空间学习模型对比Table 3. Comparison of different subspace learning models方法 代表性模型 优点 缺点 基于PCA的子空间学习模型 子空间近
似模型保留信号主要成分、实现数据降维,一定程度抑制信号中的噪声成分。 忽略了噪声子空间中包含的支撑区长度信息,数据信息利用不全。 PPCA
模型保留了噪声子空间的部分统计信息,数据信息利用更充分。 要求信号子空间的基正交、支撑区内外噪声方差相同,灵活性不强。 基于FA的
子空间学
习模型统计
识别传统FA
模型不要求投影各列正交、支撑区内外噪声方差不要求相同,建模更灵活、准确。 模型复杂度高、训练样本需求量大,小样本识别能力弱。 MTL-FA
CFA
LA-FA
LC-CFA引入多任务学习/卷积操作/标签约束策略降低模型复杂度、提升模型类间可分性,小样本识别能力明显提升。 假设HRRP服从单高斯分布,对HRRP的多模分布特性描述不足。 LFA
DMR-MFA多个描述不同分布的子FA模型集成拟合HRRP的多模分布特性。 子模型个数需要提前预设,预设合理性难以保证,影响识别精度。 特征
提取MMFA
MMRFA特征提取与分类器学习联合进行,增强特征可分性的同时避免了特征与分类器的失配。 单高斯FA建模,对HRRP数据的多模分布特性描述能力不足。 基于PCA的子空间学习模型主要包括子空间近似模型[39]和概率主成分分析(Probability Principal Components Analysis, PPCA)模型[39]。基于PCA的子空间近似模型对各目标各方位帧HRRP样本统计的协方差矩阵进行特征值分解,并将大特征值对应的特征向量所组成的矩阵视为信号子空间,小特征值对应的特征向量组成的矩阵视为噪声子空间,然后用信号子空间近似样本协方差矩阵的全空间,在高斯分布假设条件下基于最大帧后验概率准则实现了HRRP的统计识别。子空间近似模型在识别时直接扔掉了噪声子空间,只使用了信号子空间的统计特性。虽然小特征值及其特征向量所描述的噪声起伏信息对识别是无用的,但小特征值相应特征向量所包含的支撑区长度信息对识别应当是有用的。基于上述分析,文献[39]提出了PPCA模型,PPCA模型会同时考虑噪声分量进行统计建模。对于第c(
c=1,2,⋯,C )类目标第m(m=1,2,⋯,Mc )帧的P维HRRP样本x(c,m)n ,PPCA模型将x(c,m)n 表示为x(c,m)n=A(c,m)z(c,m)n+μ(c,m)+ε(c,m)n (9) 其中,
μ(c,m)∈RP 称为均值向量,A(c,m)∈RP×V (V≪P )称为权矩阵且矩阵各列相互正交,V维隐变量z(c,m)n∼N(0,IV) ,P维噪声变量ε(c,m)n∼N⋅(0,σ(c,m)2IP) 。利用最大对数似然估计法求解模型参数μ(c,m) ,A(c,m) 和σ(c,m)2 后可得,x(c,m)n 协方差矩阵的小特征值是样本协方差矩阵中P−V 个小特征值的平均值,因此PPCA模型保留了噪声子空间的部分统计信息。由于PPCA对数据信息的利用更充分,在3类实测飞机目标HRRP数据上的识别率较子空间近似模型从88.92%提高到了90.73%。然而,PPCA模型在获得各元素相互独立的隐变量以方便参数求解时要求信号子空间的基正交,同时假设支撑区内外的噪声方差完全相同(实际支撑区噪声会受到信号抑制),建模条件相对苛刻且精度仍不够高。基于上述分析,文献[39]利用因子分析(Factor Analysis, FA)模型对HRRP建模。对于观测HRRP样本
x(c,m)n ,FA模型将其表示为x(c,m)n=A(c,m)z(c,m)n+μ(c,m)+ε(c,m)n (10) 其中,
A(c,m)∈RP×V 称为加载矩阵且不要求矩阵各列相互正交,噪声变量ε(c,m)n∼N(0,Ψ(c,m)) ,Ψ(c,m) 为对角阵且对角线元素不要求相同。与PPCA相同,FA模型也考虑了噪声分量对识别的影响,但不要求支撑区内外噪声方差相同,与实际信号特性更相符,因此对数据有更准确的分布描述能力,识别准确率也应更高,如图13所示。文献[19]指出,在训练样本数充足的情况下,FA模型能够较好地描述HRRP数据的分布特性,识别性能较好。然而,当仅有少量的训练样本时,FA模型的参数估计精度降低,对数据分布特性的描述能力差,进而识别能力减弱。图14给出了基于FA模型的HRRP统计识别方法在不同训练样本数情况下对3类飞机目标的平均正确识别率。从中可以看出,FA模型的识别性能随训练样本数的减少而变差;若以70%作为最低识别门限,则当每帧训练样本数小于30时,FA模型已不具备识别能力。
针对FA识别存在的小样本问题,系列改进模型相继提出。文献[19]引入不同方位帧数据联合学习机制,构建了多任务FA (Factor Analysis with Multi-task Learning, MTL-FA)模型。MTL-FA模型通过在所有目标所有方位帧数据上共享一个大尺寸的加载矩阵,具体表示为
x(c,m)n=A(z(c,m)n∘s(c,m)n)+μ(c,m)+ε(c,m)n (11) 而各观测样本所需的“加载矩阵基向量”(即加载矩阵的某些列)由0-1分布的隐变量
s(c,m)n∼Bern(ζ(c,m)) 进行自动选择,其中ζ(c,m) 为控制s(c,m)n 稀疏度的超先验,∘ 表示向量的点乘,Bern(⋅) 表示伯努利分布。参数共享避免了不同方位帧间基向量的重复学习,因此,MTL-FA模型自由度降低,小样本识别性能得到改善。在MTL-FA模型的基础上,文献[54]引入额外标签信息,提出了标签辅助因子分析(Label-Aided Factor Analysis, LA-FA)模型。LA-FA模型将MTL-FA学习的隐变量z(c,m)n∘s(c,m)n 通过非线性变化映射到样本对应的类别标签,利用类别标签之间的差异性引导隐变量向类间更可分的方向学习,从而有利于提升模型整体的可分性,进一步促进少量训练样本情况下的识别性能。通过借鉴卷积网络中卷积操作在局部连接和权值共享方面的优势,文献[55]提出了基于卷积因子分析(Convolutional Factor Analysis, CFA)模型的雷达HRRP统计识别方法。区别于FA模型简单的线性变换,CFA模型将观测样本x(c,m)n 表示为一系列字典原子{ a(c,m)k|a(c,m)k∈RJ} Kk=1 (K表示预设的字典原子个数)与对应权向量{ z(c,m)nk|z(c,m)nk∈RP−J+1} Kk=1 的卷积之和,即x(c,m)n=∑Kk=1a(c,m)k∗z(c,m)n+μ(c,m)+ε(c,m)n (12) 作为卷积核,字典原子维度远小于样本维度,即
J≪P ;而且,相比于FA模型加载矩阵学习数据的全局抽象信息,如图15(a)所示,CFA模型字典原子能够获取更能反映数据本质的局部细节信息,如图15(b)所示的线条、单尖峰等。局部信息较全局信息具有更强的共享特性,进而利用CFA模型描述全部观测数据所需的字典原子数更少,即K≪V 。综上,对于CFA模型中的字典A(c,m)=[a(c,m)1,a(c,m)2,⋯,a(c,m)K]∈RJ×K ,其尺寸远小于FA中的加载矩阵尺寸,从而待估参数个数大大减少,降低了对训练样本数的需求。在CFA模型的基础上,文献[56]同样引入多任务学习机制,在所有目标所有方位帧数据上共享卷积字典,并将卷积模型学出的隐变量映射到样本对应的类别标签,提出了标签约束卷积因子分析(Label Constrained Convolutional Factor Analysis, LC-CFA)模型。LC-CFA模型进一步降低了卷积模型的参数量,同时,如图16所示,LC-CFA模型相关系数矩阵呈现更明显的分块现象,即类内权向量相关系数大、类间相关系数小,说明LC-CFA模型的类间可分性更强。由于LC-CFA模型综合了卷积操作、多任务学习与标签约束策略,其获得了最优的小样本HRRP识别性能,如图17所示。FA系列模型只能描述单高斯分布的观测数据,然而HRRP由于具有方位敏感性,是典型的多模分布数据,因此,FA模型的数据描述能力还是有限。针对此问题,多个子FA集成的混合模型提出以实现对HRRP数据分布更精确的表征。文献[40]构建了局部因子分析(Local Factor Analysis, LFA)模型。具体地,对于观测HRRP样本x,LFA模型将其概率密度函数定义为多个高斯分布的加权和,对于第k个高斯分布,其由一个联合高斯模型描述,即
x=Ukz+μk+ε,z∼N(0,Λk),ε∼N(0,ψk) (13) 其中,投影矩阵
Uk 的各列向量相互正交,以便利用一些学习理论框架实现模型分量个数的自动确定,隐变量z∈RV 的协方差阵Λk 及噪声变量ε∈RP 的协方差阵ψk 均为正定对角阵。通过一定求解算法获得模型参数的估计后可实现对各观测样本的概率密度估计,进而可对HRRP数据进行统计识别。LFA通过多个单高斯概率密度函数的叠加实现了对HRRP距离单元非高斯性和相关性的同时描述,对HRRP分布特性的表征能力更强。通过松弛Uk 各列正交的约束,文献[57]提出了混合因子(Mixture Factor Analysis, MFA)模型,基于MFA模型,文献[58]引入距离度量学习,提出了距离度量约束的混合因子分析(Distance Metric Restricted Mixture Factor Analysis, DMR-MFA)模型。DMR-MFA约束MFA模型每个混合分量所学习的样本隐变量的类内距离小、类间距离大,从而拉大了模型的类间可分性。数据分布的非线性描述能力与监督信息的引入保证了DMR-MFA模型更高的识别准确率。例如,对于图18(a)所示的两类人工数据集,各类数据呈明显的双高斯分布特性,利用DMR-MFA模型一方面能够将类别不同分布相近的数据用同一个混合分量进行描述、同类别但分布不相近的数据用不同混合分量进行描述,如图18(b)所示,从而保证了数据的描述精度;另一方面通过在各混合分量中引入距离度量约束来增强隐变量的类间可分性,从而提取出明显线性可分的隐变量,如图18(c)所示,进而获得了100%的识别准确率,而传统FA模型对多模分布的人工数据的识别正确率仅有55%。同样地,对于3类实测飞机目标HRRP数据,DMR-MFA模型的识别准确率达到93.81%,比传统FA模型和MFA模型分别高1.41%, 1%。然而,LFA, DMR-MFA模型均需要预设子模型的个数,很容易因不合理的模态个数设置造成模型描述精度降低,影响识别性能。利用子空间学习模型除可基于最大类后验概率进行HRRP统计识别外,还可将模型所学隐变量视为数据隐特征并选择合适的分类器实现基于特征的识别。文献[42]利用FA模型和隐变量SVM对HRRP样本和样本对应的标签进行联合建模,学习出了判别性更强的低维概率隐空间特征,并在测试阶段利用训练好的隐变量SVM实现了对测试样本概率隐特征的分类。由于该模型同时进行特征学习与分类器训练,避免了所学隐特征与分类器之间的失配,其在3类飞机目标数据上的识别准确率达到91%。区别于文献[42]在FA模型学得的隐空间内构建分类器,文献[59]提出的最大间隔正则化因子分析(Max-margin Regularized Factor Analysis, MMRFA)对基于FA模型的HRRP重构样本进行最大间隔约束,其提高了隐特征类间可分性的同时避免了有益信息的丢失,进一步提高了系统的识别性能,在相同数据集上,其识别率较文献[42]高约1%。但二者仍采用单高斯建模方式,数据多模分布特性描述能力不足。
2.2.3 时序模型
挖掘HRRP样本之间或者HRRP样本不同距离单元之间存在的时序相关性,并利用时序信息进行目标类别的判断,也是参数化HRRP目标识别领域的一类方法。隐马尔可夫模型(Hidden Markov Model, HMM)是一种常用的对时间序列建模的模型,在雷达HRRP自动目标识别中得以广泛应用。HMM是一个双重随机模型,由两部分组成:一部分是一条隐马尔可夫链构成的隐含层,隐含层是一个描述事物背后隐含规律的内在过程。另一部分是实际观测序列构成的观测层,观测层是一个由测量本身引起的外在过程。设HMM由随机过程
{(sn,xn),n≥1} 组成,其中{xn,n≥1} 表示观测序列,xn 是第n个观测值:{sn,n≥1} 表示有限状态隐马尔可夫链,sn 表示观测值xn 所对应的状态。隐马尔可夫模型可由参数集Φ={W,w0,θ} 表示,其中W和w0 是描述隐状态的参数,W={wi}Ii=1 ,wi={wi,j}Ij=1 ,wi,j 表示隐状态i转移到隐状态j的转移概率,I表示隐状态的总数,w0={w0,i}Ii=1 ,w0,i 表示隐马尔可夫链中初始状态为隐状态i的概率,θ={θi}Ii=1 表示观测值所服从概率分布的参数,观测值服从的最常见的分布形式是高斯分布。HMM认为观测值xn 在确定其对应的隐状态sn∈{1,2,⋯,I} 的条件下,可由参数为θsn 的概率分布生成,而sn 的具体值由序列的初始隐状态w0 和状态转移概率W确定。雷达HRRP浅层时序模型的研究主要围绕HMM展开,从时序信息利用方式的角度,时序模型可以分为基于HRRP样本间时序信息挖掘的方法和基于HRRP样本内距离单元回波间时序信息挖掘的方法两种,如表4所示。
表 4 不同时序模型对比Table 4. Comparison of different temporal models方法 优点 缺点 基于HRRP样本间时序信息挖掘的模型 能够利用HRRP样本间的时序相关性进行目标识别。 数据降维预处理丢失了一部分可用信息;要求训练和测试阶段目标相对雷达视线的转角保持一致,实际很难满足;无法对单个HRRP样本给出实时判决结果。 基于HRRP样本内距离单元回波间时序信息挖掘的模型 对各HRRP样本内的不同距离单元回波建立时序模型,挖掘样本距离单元之间的时序信息。无需降维、不要求训练和测试阶段目标相对雷达视线转动的一致性、能够给出各HRRP样本的实时判决结果。 对各距离单元回波进行单高斯分布建模,未充分考虑距离单元回波存在的非高斯特性,建模精度仍有提升空间。 在建模HRRP样本间的时序特性方面,文献[60]首先提出了一种基于散射中心和HMM分类的多视角雷达目标识别方法,其首先利用Relax算法提取HRRP中散射中心的位置信息作为特征,并将多个HRRP样本的特征构成序列,然后在训练阶段使用HMM模型对该特征序列统计建模,最后在测试阶段采用最大后验概率准则判定测试HRRP特征序列所属的目标类别。文献[61]联合HRRP散射中心位置与幅度信息构成低维特征,并建立了非平稳的HMM模型对该特征组成的序列建模。然而,上述对HRRP样本间建立HMM的方法存在以下问题:(1)为了避免直接对高维HRRP建模带来的高额计算开销而进行的降维操作不可避免地损失大量有用识别信息;(2)对多个HRRP样本组成的序列利用HMM建模隐含了一个条件,即在测试阶段中目标相对雷达视线变化的角速度需和训练阶段保持一致,否则就会导致训练阶段和测试阶段采样率不一致的问题,而这一条件在实际中难以满足;(3)HMM只能对由多个HRRP样本构成的观测序列进行识别,对高速运动的非合作目标(如敌方战斗机类目标)雷达很难进行持续跟踪检测,导致识别算法失效。这些问题的存在,大大限制了HMM模型的识别性能和应用范围。
针对HRRP样本间建立时序模型存在的问题,文献[62]提出了截断Stick-Breaking过程HMM (Truncated Stick-Breaking HMM, TSB-HMM)。该模型将单个HRRP样本视为一个观测序列,样本中每个距离单元回波作为一个观测值,各目标各方位帧HRRP样本组成的一组观测序列共同学习模型参数。由于各观测值是一个数而不再是传统方法中所用的高维向量,因此它要求的计算资源负担比较小,并且避免了特征降维带来的信息丢失问题。而且,TSB-HMM将单个HRRP作为一维观测序列避免了多个HRRP样本构成的序列所存在的训练和测试阶段需保证目标速度方向与雷达视线夹角的角速度变化一致的问题。此外,在TSB-HMM的识别过程中,单个距离像作为一个观测序列可直接进行识别。训练阶段,TSB-HMM分别对各目标各方位帧进行建模学习,获得相应的模型参数估计。测试阶段,根据贝叶斯准则计算测试样本在各目标各方位帧条件下的帧似然值,并将其判为具有最大帧似然值的目标类,实现HRRP的统计识别。对于3类实测飞机目标HRRP数据,当每帧训练HRRP样本数为1024时,TSB-HMM的识别率达到89.40%,如表5所示。在提取HRRP样本谱图特征以综合利用目标信号时域特性和频谱密度随时间变化特性的基础上,文献[41]通过引入多任务学习机制,将TSB-HMM观测层概率分布的参数在所有目标所有方位帧间进行共享,提出了多任务TSB-HMM。由于参数共享,多任务TSB-HMM具有更低的模型复杂度,进而小样本HRRP识别能力更优。如图19所示,每帧HRRP样本数少于60时,多任务TSB-HMM识别率明显高于单任务TSB-HMM。以80%为识别门限,多任务TSB-HMM对标注训练样本的需求量下降为单任务方法的1/25。然而,对HRRP样本不同距离单元间时序信息建模的方法通常假设HRRP各距离单元服从单高斯分布,由前述可知,存在HRRP距离单元回波非高斯的情况,因此,整体建模精度仍有待提高。
2.2.4 散射点模型
雷达HRRP回波具有其特有的物理模型,基于雷达回波物理模型对观测HRRP数据进行参数化建模,可以提取出具有明确物理含义的特征,提升模型的可解释性,在HRRP雷达目标识别领域具有巨大的应用前景。散射中心模型是一种典型的用于描述雷达回波形成机制的物理模型。以脉冲体制雷达为例,假设雷达发射线性调频信号,目标回波经脉压后的频率响应y可以表示为
y=Φw+ε (14) 其中,
y=[y(1),y(2),⋯,y(L)]T , L表示频点个数;矩阵Φ=[β(r1),β(r2),⋯,β(rP)] ,β(rp)=[1,exp(−j4πrpΔf/4πrpΔfcc),⋯,exp(−j4πrp(L−1)Δf/4πrp(L−1)Δfcc)]T ,Δf 表示相邻频点的间隔,p=1,2,⋯,P 表示距离单元索引,rp 表示第p个距离单元的位置,c表示雷达信号的传播速度;噪声成分ε=[ε(1),ε(2),⋯,ε(L)]T ,w=[w(1),w(2),⋯,w(P)]T 表示复散射系数,|w| 即为相应的HRRP样本。式(14)即为雷达回波散射中心模型。文献[32]将散射中心模型概率化,提出了一种分层贝叶斯信号模型。对于第c(
c=1,2,⋯,C )类目标第m(m=1,2,⋯,Mc )帧的L维频域回波样本y(c,m)n ,该模型将其表示为y(c,m)n=Φw(c,m)n+ε(c,m)n (15) 其中,
Φ 表示散射中心模型中的傅里叶基,w(c,m)n 表示y(c,m)n 对应的复散射系数,ε(c,m)n∼CN(0,σ(c,m)2IL) 表示噪声变量,CN(⋅) 表示复高斯分布。当Φ 为正交基时,w(c,m)n 的维度和原始信号y(c,m)n 的维度一致;当Φ 为过完备的基矩阵时,w(c,m)n 的维度大于原始信号y(c,m)n 的维度,此时可以得到超分辨的复散射系数,实现对目标信息的精细挖掘。雷达回波信号可近似为一组稀疏分布在目标上的强散射点的回波向量和,具体体现为w(c,m)n 的稀疏性,非0值对应的位置即为散射点位置、具体元素值即为散射系数强度。为了实现散射点的自动提取,文献[32]将复散射系数分解为w(c,m)n=ˆw(c,m)n∘z(c,m)n ,其中ˆw(c,m)n∼CN(μ(c,m)n,Σ(c,m)n) 表示复散射系数强度,0-1分布的选择因子z(c,m)n∼Bern(ρ) 用于确定目标散射点位置,z(c,m)n 中非0元素对应的距离单元即表示该距离单元回波为目标散射点回波,参数ρ 用于控制复散射系数w(c,m)n 的稀疏度。训练阶段,基于最大边缘对数似然准则可以实现对各目标各方位帧复散射系数{w(c,m)n}N(c,m),Mc,Cn=1,m=1,c=1 的求解,从而可以根据高斯分布特性估计各方位帧频域回波对应的概率密度函数。对于测试样本频率响应y∗ ,将其代入各目标各方位帧概率密度函数中,最大帧似然值对应的目标类即判定为该样本的所属类别,即实现了目标的统计识别。文献[32]所提统计模型实现了雷达回波信号模型与识别模型的相统一,由于该模型能够自动取目标散射点,如图4(a)所示,其在识别过程中能够有效摒弃噪声成分的不利影响,从而具有较好的噪声稳健识别能力,如图20所示。此外,与子空间学习模型中的投影矩阵不同,分层贝叶斯信号模型的投影矩阵Φ 具有明确含义,设置超分辨傅里叶基能够挖掘更精细、丰富的目标信息,从而有利于目标识别准确率的进一步提升;而子空间学习模型中的投影矩阵含义抽象,增加其维度很有可能因模型参数增加而造成过拟合,反而影响模型识别性能。浅层参数化统计模型能够给出HRRP数据概率分布的显式估计,但难兼顾HRRP不同距离单元回波之间的相关性与分布形式的差异性,建模精度仍有较大提升空间。而且,为了获得数据概率分布的显式估计以及保证模型参数具有解析解,浅层统计模型大多采用线性变换或多个线性变换的集成方式,结构简单,对数据内隐知识的充分挖掘能力有限。而对于大规模的、呈复杂分布的HRRP,仅依靠数据的分布特性准确完成目标类别的预测很困难。
3. 基于深层参数化统计模型的雷达HRRP目标识别
近年来,深度网络在计算机视觉、语音识别等领域得到广泛应用,其具有多层特征提取能力,在数据表示学习方面性能优越,为雷达目标识别研究提供了一条新的技术途径。将统计模型与深度网络相结合,综合利用由统计模型所表征的雷达回波统计分布特性和由深度网络所学习的数据内隐知识,提升HRRP数据分布描述精度、挖掘数据更有效的深层识别特征,是雷达HRRP参数化统计建模的发展趋势。如图21所示,现有深层HRRP参数化统计模型主要包括变分自编码器及其改进模型和深层时序模型两大类。下面分别对二者进行归纳总结。
3.1 变分自编码器及其改进模型
2014年,Kingma等人[44]将深度网络嵌入最大边缘对数似然的变分推导中,提出了具有编码器学习概率隐分布、解码器对概率隐分布的采样特征进行重构的变分自编码器(Variational AutoEncoder, VAE)。VAE以观测数据边缘对数似然的下界推理为导向,对于由隐变量z经参数为
θ 的模型映射生成的样本x,其边缘对数似然lnpθ(x) 存在下界LB=Eqφ(z|x)[lnpθ(x|z)]−KL(qφ(z|x)‖ (16) 其中,
{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right) 表示隐变量的后验分布,\varphi 表示后验分布参数,\mathbb{E}\left( \cdot \right) 表示后验期望;{p_\theta }\left( {\boldsymbol{z}} \right) = {\rm{N}}\left( {{\boldsymbol{z}}\left| {{\boldsymbol{0}},{\boldsymbol{I}}} \right.} \right) 表示隐变量先验分布,{\text{KL}}\left( \cdot \right) 表示Kullback-Leibler(KL)散度。对于{\mathbb{E}_{{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right)}}\left[ {\ln {p_\theta }\left( {{\boldsymbol{x}}\left| {\boldsymbol{z}} \right.} \right)} \right] ,其可近似表示为{\mathbb{E}_{{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right)}}\left[ {\ln {p_\theta }\left( {{\boldsymbol{x}}\left| {\boldsymbol{z}} \right.} \right)} \right] \approx \frac{1}{L}\sum\limits_{l = 1}^L {\ln {p_\theta }\left( {{\boldsymbol{x}}_{}^l\left| {{\boldsymbol{z}}_{}^l} \right.} \right)} (17) 其中,
{\boldsymbol{z}}_{}^l 表示从分布{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right) 中对隐变量进行的第l次采样,l = 1,2, \cdots ,L ,L表示采样次数。统计模型参数\theta 可以通过最大化\ln {p_\theta }\left( {\boldsymbol{x}} \right) 估计获得,而最大化\ln {p_\theta }\left( {\boldsymbol{x}} \right) 等价于最大化下界LB,因此,通过优化LB获得的模型参数\left\{ {\theta ,\varphi } \right\} 最终可以保证所构建模型对数据分布的准确描述。基于上述分析,VAE将LB的形成过程看作先将观测数据x经参数为\varphi 的编码器编码得到隐变量后验{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right) 的分布参数,然后从{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right) 中对隐变量进行采样,并将采样后的隐变量z经参数为\theta 的解码器解码得到观测数据x条件概率密度函数{p_\theta }\left( {{\boldsymbol{x}}\left| {\boldsymbol{z}} \right.} \right) 的分布参数,最终生成观测样本;对于KL距离项,其可视为在隐变量后验分布学习过程中对隐变量附加的约束项,即约束隐变量后验分布与先验分布尽可能一致。以隐变量后验与观测样本均服从高斯分布为例,图22给出了VAE的结构示意图。由图22可知,VAE并未直接从后验分布{q_\varphi }\left( {{\boldsymbol{z}}\left| {\boldsymbol{x}} \right.} \right) = {\rm{N}}\left( {{\boldsymbol{z}}\left| {{{\boldsymbol{\mu}} _\varphi }\left( {\boldsymbol{x}} \right),{\boldsymbol{\sigma}} _\varphi ^2\left( {\boldsymbol{x}} \right)} \right.} \right) 采样隐变量,而是将隐变量再参数化为{\boldsymbol{z}} = {{\boldsymbol{\mu}} _\varphi }\left( {\boldsymbol{x}} \right) + {{\boldsymbol{\sigma}} _\varphi }\left( {\boldsymbol{x}} \right) \odot {\boldsymbol{\varepsilon}} ,{\boldsymbol{\varepsilon}} \,{\text{~}}\,{\rm{N}}\left( {{\boldsymbol{0}}\,,\, {\boldsymbol{I}}} \right) ,通过对噪声变量{\boldsymbol{\varepsilon}} 采样并将采样值作为常数项与后验分布标准差点乘后与均值相加间接实现对隐变量的采样。再参数化方法能够避免在利用随机梯度上升法对下界进行优化时由于隐特征z的采样过程致使z为非变量而造成的误差无法继续下传的问题。在VAE中,编码器和解码器通常设计为具有多层非线性变换的深层结构,而高度非线性映射结构可以大大增强VAE对复杂数据分布的拟合能力,且深层隐特征z较浅层特征也更能反映数据的本质特性,更有利于后端识别。由于模型结构的复杂性,VAE很难像浅层统计模型一样给出观测数据分布的显式表达式,但VAE具有深层概率隐特征提取能力,因此,现有基于VAE的深层统计模型大多通过所提特征进行后续的识别任务。基于VAE,针对HRRP目标识别的改进VAE模型相继提出,主要分为仅包含单一解码网络的单解码器VAE与多个解码器集成的VAE两大类,如表6所示。
表 6 不同变分自编码模型比较Table 6. Comparison of different VAE models方法 优点 缺点 单解码器VAE 综合统计模型的数据分布描述能力、深度网络的数据分层学习能力以及HRRP回波特性,能够提取较浅层模型表征力更强的内隐特征。 对大规模复杂分布HRRP数据的拟合精度仍有限、特征可分性仍有提升空间。 多解码器集成VAE 综合多个对部分观测数据具有高精度描述能力的子解码网络实现对全部HRRP数据分布的准确表达,具备挖掘类间细微差异信息的能力,有利于难分样本类别的准确判断。 训练计算复杂度高、模型学习效率低、存储需求量大。 单解码器VAE建模方面,文献[30]提出了稳健的变分自编码器(Robust Variational Autoencoder, RVAE)。考虑到各目标一定角域内HRRP数据的平均像具有稳定的物理特性,如能够提高信号的信噪比、抑制幅度扰动和奇异样本对信号的影响,RVAE不仅约束生成的HRRP样本与原始HRRP样本的重构误差最小,而且还约束与其对应帧的平均像之间具有最小重构误差。如图23所示,原始不同类HRRP数据相互混叠,经VAE特征提取后,不同类特征间的相交区域减小,特别是雅克-42目标特征与其他两类的区分性明显增强,说明VAE在有效识别特征提取方面的可行性。RVAE引入平均像约束,3类目标特征之间的混叠现象进一步减弱,表明RVAE具有学习目标更本质、判别性更强的隐特征的能力,进而可为后续不同目标的准确识别提供优质的特征保障。例如,将RVAE所提3类飞机目标HRRP数据的隐特征输入线性SVM分类器,识别准确率达到92.12%。
传统VAE及RVAE虽然能够提取HRRP数据的层次化概率隐特征,但是这两种方法的特征提取器和分类器是独立学习的,即无监督学习,存在所提特征与分类器失配的问题,进而限制了模型的识别性能。为了解决此问题,文献[45]提出了一种VAE模型和分类器联合学习的可分解判别条件变分自编码器(Factorized Discriminative Conditional Variational Autoencoder, FDCVAE)。FDCVAE的网络结构如图24所示。具体地,FDCVAE在利用VAE对观测样本x和样本对应的平均像m进行重构的基础上,通过将所提隐特征z经参数为
\bar{\boldsymbol{\varPsi}} 的分类器映射到样本对应的类别标签y,实现了深层概率隐特征的监督学习。标签信息的引入一方面可以约束隐特征向类间差异性更强的方向学习,从而进一步增强特征的可分性,如图25所示,另一方面能够实现特征与分类器之间的最优匹配。此外,区别于VAE和RVAE将各类隐变量先验固定为同一的标准正态分布,FDCVAE中各类隐变量先验分布由其对应的类别标签经参数为{\boldsymbol{\phi}} 的多层感知机编码得到,进而不同目标具有不同的先验分布,在KL距离约束条件下,更有利于强分性隐特征的学习。FDCVAE综合了平均像约束、标签约束、可学习先验设置等策略,较传统VAE与RVAE获得了更优的识别性能,如表7所示。然而,HRRP具有方位敏感性,大规模目标类情况下数据分布复杂、具有明显的多模分布特性,单解码器VAE仅用单一解码网络描述数据分布的方式拟合精度仍然有限、难以挖掘不同类但相近样本之间的细微差异性信息,进而影响特征可分性、最终识别性能提升受限。针对上述单解码器VAE存在的问题,多解码器集成VAE相关模型提出,通过综合多个对部分观测数据具有高精度描述能力的子解码网络实现对全部HRRP数据分布的准确表达,从而具备挖掘类间细微差异信息的能力,有利于难分样本类别的准确判断。文献[63]提出了类分解复变分自编码器(Class-factorized Complex Variational Autoencoder, CFCVAE),如图26所示。CFCVAE将VAE解码器按目标类分解为多个子解码器,各子解码器只对相应类别的隐特征进行解码,获得该类别样本的重构数据。按类解码的模型构建方式使各类别的解码器对所属类别的数据有较好的描述能力,而对其他类别数据的描述能力则较差,进而使CFCVAE能够通过比较测试样本在各类解码器条件下的重构误差直接实现对测试数据类别属性的判决,同样避免了所提特征与后端分类器不匹配的问题。同时,CFCVAE将实数VAE扩展到了复数域,通过充分利用对识别有利的回波相位信息获得了较FDCVAE更高的识别准确率,如表7所示。此外,由表7还可以看出,深层统计模型的识别正确率整体高于浅层统计模型(VAE+LSVM[64]由于存在特征提取与分类不匹配的问题以及VAE并非是针对HRRP设计的专属模型、未结合HRRP回波特性,因此识别能力弱于面向HRRP识别的浅层模型),表明深层模型在挖掘数据更本质的、可分性更强的内隐知识方面的有效性,从而有利于突破浅层模型识别性能“天花板”的瓶颈问题。CFCVAE利用多个解码器实现了对观测数据的按类描述,一定程度上提高了模型对数据的表征能力,但对复杂数据集来说,同目标类观测样本的分布特性通常也会存在较大的差异。针对复杂分布HRRP数据的统计特性描述问题,文献[34]结合混合专家(Mixture of Experts, ME)机制[65],提出了判别混合变分自编码器(Discriminative Mixture Variational Autoencoder, DMVAE),如图27所示。一方面,DMVAE将整个观测数据集自适应地划分成多个子集,各子集通过一个解码网络来描述该子集数据的生成过程。对于观测样本x,其具体的子解码归属
{c_{\boldsymbol{x}}} ({c_{\boldsymbol{x}}} 表示观测样本x对应的子解码器指示因子)由狄利克雷过程(DP)先验决定,通过利用狄利克雷分布的性质,可以获得指示因子{c_{\boldsymbol{x}}} 在各解码器条件下的后验概率p\left( {{c_{\boldsymbol{x}}} = k\left| {{\boldsymbol{x}},{{\boldsymbol{\theta}} _k},{\boldsymbol{\alpha}} } \right.} \right) 解析解,其中{{\boldsymbol{\theta}} _k} 表示第k(k = 1, 2, \cdots ,K )个子解码器的模型参数,进而确定该样本所属的子解码器。相同分布的数据经同一解码网络生成,不同解码网络表示不同分布数据的生成过程,如图28所示,DMVAE对3类飞机目标HRRP数据聚成5个子集,即使属于同一目标类,若数据分布差异较大,也会由不同子解码网络进行描述。DMVAE通过多个解码器的集合能够给出全部观测数据更精确的描述,进而有利于改善复杂数据分布情况下因单一解码器不能准确描述数据分布而造成的特征表征能力差的问题,如图29所示,DMVAE所提特征可分性明显由于优于单解码器VAE。另一方面,DMVAE采用了半监督学习机制,即利用多个解码网络对观测数据(包括标记样本和未标记样本)分布进行无监督描述的同时,还利用一个参数为\bar{\boldsymbol{\varPsi }} 分类网络描述了标记样本的隐特征到其对应标签的生成过程,且分类器约束无标记样本预测标签的熵最小。由于DMVAE综合利用对大量无标记样本隐特征的重构约束和预测标签的最小熵约束,能够辅助模型学得更具可分性的隐特征以及提升分类器的泛化性能,进而降低了对标记训练样本数的需求,有利于提升少量标记训练样本情况下的识别准确率。如图30所示,深层模型较浅层模型的识别准确率整体性能更优,识别性能随比较样本数的变化也更加稳健。深层模型中,DMVAE性能最优,特别是仅有540个标记样本(每帧4个样本)时,其识别率仍大于90%。然而,多解码器集成VAE由于包含多个子模型且所需子模型个数往往随数据规模的扩大而增加,训练计算复杂度高、模型学习效率低、存储需求量大,在算法实现方面成本开销巨大。
3.2 深层时序模型
VAE及其改进模型从HRRP结构信息深度挖掘的角度区别不同类目标,深层时序模型主要探究HRRP深层隐特征中蕴含的时序特性,具体表现为隐特征的学习同时与当前输入观测数据以及之前隐特征相关,较浅层能更深入地挖掘数据本质信息,准确识别潜力更优。如表8所示,从模型结构的角度,目前深层时序模型主要包括对现有非统计循环神经网络(Recurrent Neural Network, RNN)概率化的贝叶斯RNN以及循环伽马置信网络。
表 8 不同深层时序模型比较Table 8. Comparison of different deep temporal models方法 优点 缺点 贝叶斯RNN 结合贝叶斯理论可以实现对HRRP不同局部信号非平稳时序关系的准确建模,数据时序特性挖掘更准确。 仅考虑数据时间维信息的深度挖掘,结构信息的深层次提取能力有限,特征表达能力不全面。 循环伽马置信网络 同时对HRRP时间维时序信息和空间维结构信息进行深度挖掘,特征对数据的表征性更强。 建模复杂、推理困难,需要选择合适的参数先验分布保证参数求解的可行性、灵活性低。 如图31所示,基于RNN的HRRP目标识别方法通常先将HRRP样本
{{\boldsymbol{x}}_n} (n = 1,2, \cdots ,N , N表示观测HRRP样本数)沿距离维划分成不同数据段\left\{ {{{\boldsymbol{x}}_{t,n}}} \right\}_{t = 1}^T (T表示HRRP数据段个数),然后将各HRRP数据段依次作为RNN不同时间步输入并经过参数为{{\boldsymbol{W}}_{xh}} 和{{\boldsymbol{W}}_{hh}} 的非线性映射获得各时间步相应的隐特征\left\{ {{{\boldsymbol{h}}_{t,n}}} \right\}_{t = 1}^T ,之后将各时间步隐特征经参数为{{\boldsymbol{W}}_{hy}} 的非线性映射投影到各数据段对应的类别标签\left\{ {{{\boldsymbol{y}}_{t,n}}} \right\}_{t = 1}^T ,最终以最后一个时间步特征输出的类别标签或通过对所有时间步特征输出的类别标签进行投票表示对HRRP样本{{\boldsymbol{x}}_n} 的类别预测。其中,对于t时刻的隐特征{{\boldsymbol{h}}_{t,n}} (t = 2, 3,\cdots ,T ),由于其形成不仅与当前时刻的输入{{\boldsymbol{x}}_{t,n}} 有关,而且与前一时刻的隐特征{{\boldsymbol{h}}_{t - 1,n}} 相关,即{{\boldsymbol{h}}_{t,n}} = {f} \left( {{{\boldsymbol{W}}_{xh}}{{\boldsymbol{x}}_{t,n}} + {{\boldsymbol{W}}_{hh}}{{\boldsymbol{h}}_{t - 1,n}}} \right) (18) 其中,
{f} {\text{(}} \cdot {\text{)}} 表示非线性映射。因此,RNN在特征提取过程中充分考虑了不同HRRP距离单元之间的时序相关信息,不同目标结构不同,距离单元回波之间表现出的时序特性也不同,进而RNN所提特征可用于目标类别的判断。而且,与浅层时序模型(如HMM)相比,RNN由于非线性激活函数的使用可以处理高维时序数据中更加复杂的时序行为。此外,由图31可知,RNN不同时刻数据段参数共享,从而使得其隐含任意不同时刻输入信号之间的关系是相似的这一假设。然而,实际HRRP样本不同局部信息之间并非具有平稳的时序关系,存在一定的波动特性,如图32所示。因此,RNN对HRRP的时序特性建模精度有限,难以准确描述复杂多样的时间序列信号。针对上述问题,文献[46]将RNN概率化,提出了伴有混合高斯模型张量循环神经网络(Tensor Recurrent Neural Network with Gaussian Mixture Model, GmTRNN)。GmTRNN设置多组RNN参数
\left\{ {{\boldsymbol{W}}_{xh}^k,{\boldsymbol{W}}_{hy}^k} \right\}_{k = 1}^K (K表示参数组数),不同RNN参数组成三维张量矩阵,哪些时间步输入共享RNN参数通过混合高斯模型聚类实现。具体地,混合高斯模型利用多组服从不同高斯分布的子高斯模型共同描述HRRP各数据段分布,即{{\boldsymbol{x}}_{t,n}} \sim {\displaystyle\prod\nolimits_{k = 1}^K {{\rm{N}}\left( {{{\boldsymbol{x}}_{t,n}}\left| {{{\boldsymbol{\mu}} _k},{\rm{diag}}{\text{(}}{\boldsymbol{\lambda}} _k^{ - 1}{\text{)}}} \right.} \right)} ^{{{\boldsymbol{z}}_{t,n,k}}}} ,而各HRRP数据段具体的子高斯分布归属由服从类别分布的二值one-hot向量{{\boldsymbol{z}}_{t,n}} 决定,即{{\boldsymbol{z}}_{t,n}} = \left[ {z_{t,n,1}}, \cdots , {z_{t,n,k}}, \cdots ,{z_{t,n,K}} \right] \sim {\text{Categorical(}}\zeta {\text{)}} ,其中\zeta 为超先验。当{{\boldsymbol{z}}_{t,n}} 中某一元素为1时,{{\boldsymbol{x}}_{t,n}} 分布由{{\boldsymbol{z}}_{t,n}} 非0元素对应的子高斯模型表征,分布相近的HRRP数据段属于相同子高斯模型,不同子高斯模型描述了HRRP不同数据段之间复杂的非平稳分布特性。对于混合高斯模型聚类后的任一时间步输入{{\boldsymbol{x}}_{t,n}} ,GmTRNN进而将其隐特征表示为{{\boldsymbol{h}}_{t,n}} = {f} \left( {{\boldsymbol{W}}_{xh}^{{{\boldsymbol{z}}_{t,n}}}{{\boldsymbol{x}}_{t,n}} + {\boldsymbol{W}}_{hh}^{{{\boldsymbol{z}}_{t,n}}}{{\boldsymbol{h}}_{t - 1,n}}} \right) (19) 其中,
{\boldsymbol{W}}_{xh}^{{{\boldsymbol{z}}_{t,n}}} 和{\boldsymbol{W}}_{hh}^{{{\boldsymbol{z}}_{t,n}}} 为混合高斯模型从RNN三维参数张量中选择的更能够表征数据段{{\boldsymbol{x}}_{t,n}} 特性的一组RNN参数。与传统RNN类似,获得各数据段相应的隐特征后,GmTRNN将各数据段隐特征非线性映射到样本类别标签。测试阶段经HRRP数据段划分、聚类、特征提取与类别预测后,通过对各数据段的预测标签采用投票法最终实现对相应HRRP样本类别属性的预测。GmTRNN通过将混合高斯模型与RNN强力地耦合在一起,能够挖掘HRRP距离单元之间更复杂的、非平稳的时序相关性,较浅层时序模型与非统计RNN对HRRP时序特性的表征能力更准确,进而识别性能更优。表9给出了浅层参数化统计时序模型HMM、深层非统计时序网络RNN以及GmTRNN在包含3类飞机目标共7800个训练HRRP样本情况下对5200个HRRP样本类别预测准确性的比较。可以看出,深层时序网络较浅层时序模型在HRRP复杂时序特性挖掘方面更具优势,因此整体识别性能较浅层HMM识别性能更优;GmTRNN充分考虑了HRRP不同距离单元之间存在的非平稳时序特性,建模更精确,进而识别准确率高于传统深层时序网络。尽管GmTRNN在HRRP时序特性准确挖掘方面具有优势,然而如何选择混合高斯模型中混合成分的个数(聚类个数)是一个难点问题,因为不合适的数目设定可能会降低模型的预测性能表现。如图33所示,GmTRNN在聚类个数预设为4的情况下具有最优识别性能,而不合适的聚类个数设置会使模型性能大大下降。为了解决这个问题,文献[46]进一步结合贝叶斯非参方法,提出了伴有狄利克雷过程混合模型的张量循环神经网络(Tensor RNN with Dirichlet Process Mixture, DPmTRNN)。DPmTRNN对混合高斯模型中的聚类指示因子设置狄利克雷过程先验,通过事先预设一个较大的聚类个数值K,然后基于狄利克雷过程先验对HRRP各数据段从K个子高斯模型中依分布自适应地进行选择,从而实现了HRRP样本不同数据段中高斯混合成分个数的自动确定,避免了混合成分个数预设带来的模型过拟合或者欠拟合问题,提升了模型的数据自适应能力。图34给出了GPmTRNN对3类飞机目标实测HRRP测试样本各数据段的聚类结果,其中不同颜色表示不同聚类标签。结合图33和图34可以看出,GPmTRNN能够将所有HRRP样本的数据段聚成4类,这与GmTRNN中最优识别率对应的聚类个数一致,说明狄利克雷先验在自动确定混合成分数方面的准确性,由于GPmTRNN无需人为设置聚类个数,其具有更稳健的识别准确率。贝叶斯RNN仍然只是时间维度上的加深,在HRRP空间结构信息的挖掘方面仍然属于浅层模型(不具有对特征的深度挖掘能力),特征对数据的表征性仍不够全面,仅依靠时序信息识别性能提升有限。在文献[47]中,郭丹丹等人提出一种循环伽马置信网络(supervised recurrent Gamma Belief Network, s-rGBN)。s-rGBN主要包含生成模块和推断模块两个部分,分别用于描述隐变量到观测数据的生成过程和推断隐变量的后验概率分布。生成模型块包含多个隐层和一个输出层,图35(a)以3个隐层为例,给出了生成模块的基本结构。s-rGBN首先将HRRP样本
{{\boldsymbol{x}}_n} (n = 1, 2,\cdots ,N ,N表示样本数)沿距离维分割成T个数据段,对于第t(t = 1, 2,\cdots ,T )个数据段{{\boldsymbol{x}}_{t,n}} ,s-rGBN将其生成过程表示为\begin{split} & {{\boldsymbol{x}}_{t,n}} \sim {{\rm{Gam}}} \left( {{r_{t,n}},1/c} \right),{r_{t,n}} \sim {{\rm{Pois}}} \left( {{{\boldsymbol{\varPhi}} ^{\left( 1 \right)}}{\boldsymbol{s}}_{t,n}^{\left( 1 \right)}} \right), \\ & {\boldsymbol{s}}_{t,n}^{\left( l \right)} \sim {{\rm{Gam}}} \left( {{b^{\left( l \right)}}\left( {{{\boldsymbol{\varPi}} ^{\left( l \right)}}{\boldsymbol{s}}_{t - 1,n}^{\left( l \right)} + {{\boldsymbol{\varPhi}} ^{\left( {l + 1} \right)}}{\boldsymbol{s}}_{t,n}^{\left( {l + 1} \right)}} \right) ,{{{1 \mathord{\left/ {\vphantom {1 b}} \right. } b}}^{\left( l \right)}}} \right),\\ & \qquad\quad l = 1,2 ,\cdots ,L - 1 \\[-10pt] \end{split} (20) 其中,
{\boldsymbol{s}}_{t,n}^{\left( l \right)} 表示{{\boldsymbol{x}}_{t,n}} 对应于第l层的隐特征,L表示隐层数,{{\boldsymbol{\varPi}} ^{\left( l \right)}} 表示前一时刻隐特征与当前时刻隐特征在第l层中连接矩阵,{{\boldsymbol{\varPhi}} ^{\left( {l{\text{ + }}1} \right)}} 表示第l{\text{ + }}1 层隐特征{\boldsymbol{s}}_{t,n}^{\left( {l{\text{ + }}1} \right)} 与第l层{\boldsymbol{s}}_{t,n}^{\left( l \right)} 之间的连接矩阵,{{\rm{Gam}}} \left( \cdot \right) 表示伽马分布,{{\rm{Pois}}} \left( \cdot \right) 表示泊松分布。式(20)表明生成模块中各层隐特征{\boldsymbol{s}}_{t, n}^{(d)} 的获得包括两部分,其中一部分为当前层的转移矩阵{{\boldsymbol{\varPi}} ^{\left( l \right)}} 和上一个时刻的隐状态{\boldsymbol{s}}_{t - 1,n}^{\left( l \right)} 的乘积,刻画了当前层的不同时间步特征之间的时序关系;另一部分为上一层的连接权值矩阵{{\boldsymbol{\varPhi}} ^{\left( {l{\text{ + }}1} \right)}} 和隐状态{\boldsymbol{s}}_{t,n}^{\left( {l + 1} \right)} 的乘积,刻画了不同隐层征之间的相关性。因此,s-rGBN模型刻画了所有层、所有时刻隐含状态之间的相关性,从而模型所提特征具有较强的表达能力。由于观测数据的生成需要首先确定隐特征的具体值,s-rGBN引入推断模块以获得隐特征的后验分布。以3个隐层为例,图35(b)给出了推断模块的基本结构。以{\boldsymbol{s}}_{t,n}^{\left( l \right)} 为例,各层隐特征后验分布q\left( {{\boldsymbol{s}}_{t,n}^{\left( l \right)}} \right) 的获取可以表示为\begin{split} & q\left( {{\boldsymbol{s}}_{t,n}^{\left( l \right)}} \right) \sim {{\rm{Weibull}}} \left( {k_{t,n}^{\left( l \right)},\lambda _{t,n}^{\left( l \right)}} \right),\\ & {\boldsymbol{k}}_{t,n}^{\left( l \right)} = \ln \left[ {1 + \exp \left( {{\boldsymbol{W}}_{hk}^{\left( l \right)}{\boldsymbol{h}}_{t,n}^{\left( l \right)} + b_1^{\left( l \right)}} \right)} \right], \\ & {\boldsymbol{h}}_{t,n}^{\left( l \right)} = \tanh \left( {{\boldsymbol{W}}_{xh}^{\left( l \right)}{\boldsymbol{h}}_{t,n}^{\left( {l - 1} \right)} + {\boldsymbol{W}}_{hh}^{\left( l \right)}{\boldsymbol{h}}_{t - 1,n}^{\left( l \right)} + b_3^{\left( l \right)}} \right) \end{split} (21) 其中,
{\boldsymbol{W}}_{xh}^{\left( l \right)} ,{\boldsymbol{W}}_{hh}^{\left( l \right)} 和b_3^{\left( l \right)} 均为推断模型中的网络参数,{{\rm{Wellbull}}} \left( \cdot \right) 表示韦布尔分布。另外,为了将该模型应用于雷达HRRP目标识别,该模型将不同时刻隐含特征拼接后经softmax映射到样本类别标签,实现了特征提取与分类器的联合优化。由图35可以看出,无论是生成模块还是推断模块,对于不同时刻的观测数据,其在s-rGBN中各层节点的获取不仅考虑了前一层的节点值,而且考虑了之前时刻在该层对当前时刻节点值的影响。因此s-rGBN在学习数据分层特征的同时还挖掘了HRRP不同距离单元之间的相关性,从而特征能够更充分地表征数据特性,进而有利于后续不同目标之间的准确区分。例如基于3类实测飞机目标HRRP数据,s-rGBN的识别准确率达到93.54%。s-rGBN模型是一种单向的时序模型,时序信息的传递仅仅由上一时刻向下一时刻传递。由于HRRP序列中不同距离单元之间的时序关系并不是单一方向的,Chen等人[66]提出一种双向循环伽马置信网络(bidirectional recurrent Gamma Belief Network, bi-rGBN)。相比于s-rGBN,bi-rGBN考虑了隐特征的双向相关性,可以挖掘HRRP序列的距离单元之间更多的时序相关信息,在3类飞机目标HRRP数据上的识别率提高到94.03%。
循环伽马置信网络一方面考虑了不同时刻输入信号隐特征之间存在的时序相关性,实现时间维的加深,另一方面对不同时刻隐特征还进行了深度挖掘(即特征提取层的堆叠),且对于任一层不同时刻隐特征的学习考虑了当前时刻隐特征层的输入与该层前一时刻隐特征之间的相关性。因此,循环伽马置信网络实现了HRRP时间维与空间维的同时拓展,所提特征对数据的表达能力更强,识别准确率也更高。但该方法建模复杂,为了方便模型推理需要选择合适的参数先验分布、灵活性有限,且也存在对HRRP不同局部信号非平稳时序关系考虑不足的问题。
4. 发展趋势
构建参数化统计模型从而利用不同类目标HRRP数据之间统计分布特性的差异进行目标类别属性的判断,是雷达HRRP目标识别领域常用的一类方法。浅层HRRP统计模型结构简单、易于推理,已经得到广泛研究,但对数据分布的描述能力整体有限,性能提升遭遇“天花板”;深层HRRP统计模型结合了深度网络对数据强大的非线性拟和能力,为突破浅层模型对数据表征能力的限制瓶颈提供了有效途径,逐渐成为雷达HRRP参数化统计建模领域的研究热点。针对现有基于参数化统计模型的雷达HRRP目标识别方法所存在的不足,特别是深层参数化统计模型,今后的研究工作可考虑以下4个问题。
(1) 雷达HRRP识别可解释深层参数化统计模型的设计:现有深层参数化统计模型对雷达目标HRRP数据自身特性考虑不足,在模型机理分析、领域知识利用等方面还存在很大局限性,导致识别网络可解释性差、决策逻辑难以被理解,从而当识别结果与预期存在偏差时难以进行针对性的改进,限制了深层统计模型的性能优势。现有少量的深层统计建模方法虽然力图解释模型的决策逻辑,但大多是对训练好的模型进行事后解释,如s-rGBN[49],但这实际上只是对原始模型的一种近似理解和间接解释,与模型真实决策行为可能存在不一致性,从而很有可能导致错误的解释。实际雷达HRRP回波具有自身特点和明确的物理模型,将这些先验认知嵌入深层网络,设计可解释的深层统计模型,提取具有明确含义的深层概率隐特征,对真正突破HRRP识别性能的提升限制、增强模型的决策可靠性具有重要意义。
(2) 基于深层参数化统计模型的雷达HRRP小样本识别:具有多层堆叠结构的深层统计模型参数量巨大,依赖于完备训练数据的充分学习。然而,对于雷达HRRP目标识别,尤其是非合作目标识别问题,由于雷达采样率限制和目标姿态快速变化,很难保证能够获得充足的HRRP回波数据,甚至存在某些方位帧HRRP完全缺失的情况。网络参数在有限观测样本的学习下难以找到泛化性能较好的解,导致深层统计模型的过拟合,而深层框架设计下采用传统低复杂度统计建模的方法收益甚微。面对雷达HRRP深层参数化统计建模存在的小样本识别问题,可结合数据扩充技术与迁移学习、元学习等小样本模型优化策略,逐渐形成HRRP特有的小样本深层统计模型学习体系。
(3) 雷达目标HRRP开放性识别:研究高性能HRRP识别模型的最终目的是实际装备应用,然而,目前HRRP识别参数化统计模型的设计大多局限于封闭环境设置下,即假设所有待测目标类都在模型训练阶段已知,且每类对应的标记训练数据都可以同时获取。然而,待识别目标型号众多,且出于机密考虑,许多军事目标很难提前观测。因此,雷达HRRP目标识别实际面对的往往是库内已知类目标和库外未知类新目标共同存在的开放集环境,此时,传统闭集训练的识别模型会将库外未知类新目标样本强制划分到库内已知目标类中,产生严重决策错误,影响战场指挥,限制了模型的实际应用。虽然现有一些手段具备对库外目标的发现能力,但大多需要人工干预,如目标典型部件提取后目视判断、预先设置拒判门限等,实时性和数据自适应性难以保证。设计具有目标类开放性识别能力的参数化统计模型,使其准确识别库内已知类目标的同时也能对库外未见过的目标进行准确快速的身份甄别,从而提升雷达HRRP目标识别模型的实用性。
(4) 雷达HRRP参数化统计模型在线建库:现有参数化统计模型大多采用离线学习方式,即利用所有数据训练模型,完成后便认为学习过程结束,当出现新目标时,需要以旧目标样本和新目标样本重新训练整个模型,然后再加载部署到装备中。然而实际应用中,训练数据往往是逐渐积累得到的,如果新数据到达后重新学习全部数据,需要消耗大量的时间和空间资源,进而导致对新目标的响应周期过长。面对新数据不断获得的动态环境,后续还应考虑如何利用新类目标数据对已有统计模型进行高效更新,且保证更新后的识别模型对旧类和新类目标均具有良好的识别能力。
5. 结语
基于雷达HRRP回波的目标识别技术对战场态势的快速感知具有重要意义,本文对近15年基于参数化统计模型的雷达HRRP目标识别方法从浅层和深层统计建模两方面进行了归纳整理,分析了不同方法的优缺点,并对未来雷达HRRP参数化统计建模方法的发展趋势进行了展望。由于参数化统计建模方法本质上是基于学习机制的算法,学习过程中需要尽可能全面地考虑实际应用时所面临的问题(如模型泛化性、雷达参数变化情况下目标识别的稳健性、开放动态环境适应性等),才能推进理论研究走向现实应用。希冀更多研究学者能够对雷达HRRP参数化统计建模方法进行深入研究、博采众长,为进一步促进雷达HRRP目标识别方法的应用提供更丰富的技术支撑。
-
表 1 不同独立统计建模方法比较
Table 1. Comparison of different independent statistical modeling methods
方法 优点 缺点 单模分布模型 计算简单、易实现。 各距离单元回波分布复杂性考虑不足,对多模分布距离单元回波的拟合精度低。 多模分布模型 能够准确拟合具有多模特性的距离单元回波分布。 计算复杂,模态个数需要人为预设,易造成过拟合/欠拟合。 半参数化模型 避免了多模分布模型中的模态个数预设问题,
实现模态数随数据的自适应确定。引入非参数化统计方法对训练样本数的需求大大增加。 表 2 不同自回归模型比较
Table 2. Comparison of different autoregressive models
方法 优点 缺点 单高斯自回归模型 计算简单、易实现;考虑了HRRP距离单元回波之间的相关性,能够反映HRRP的频谱幅度变化特性。 难以对呈多模分布的频幅分量进行高精度拟合,整体描述能力有限。 混合自回归模型 对各频幅分量采用多个单高斯自回归模型描述,可以表征频幅分量的多模分布特性,建模精度更高。 需要预先设定混合成分个数,对人工经验和先验认知依赖性强,数据自适应性能力差。 表 3 不同子空间学习模型对比
Table 3. Comparison of different subspace learning models
方法 代表性模型 优点 缺点 基于PCA的子空间学习模型 子空间近
似模型保留信号主要成分、实现数据降维,一定程度抑制信号中的噪声成分。 忽略了噪声子空间中包含的支撑区长度信息,数据信息利用不全。 PPCA
模型保留了噪声子空间的部分统计信息,数据信息利用更充分。 要求信号子空间的基正交、支撑区内外噪声方差相同,灵活性不强。 基于FA的
子空间学
习模型统计
识别传统FA
模型不要求投影各列正交、支撑区内外噪声方差不要求相同,建模更灵活、准确。 模型复杂度高、训练样本需求量大,小样本识别能力弱。 MTL-FA
CFA
LA-FA
LC-CFA引入多任务学习/卷积操作/标签约束策略降低模型复杂度、提升模型类间可分性,小样本识别能力明显提升。 假设HRRP服从单高斯分布,对HRRP的多模分布特性描述不足。 LFA
DMR-MFA多个描述不同分布的子FA模型集成拟合HRRP的多模分布特性。 子模型个数需要提前预设,预设合理性难以保证,影响识别精度。 特征
提取MMFA
MMRFA特征提取与分类器学习联合进行,增强特征可分性的同时避免了特征与分类器的失配。 单高斯FA建模,对HRRP数据的多模分布特性描述能力不足。 表 4 不同时序模型对比
Table 4. Comparison of different temporal models
方法 优点 缺点 基于HRRP样本间时序信息挖掘的模型 能够利用HRRP样本间的时序相关性进行目标识别。 数据降维预处理丢失了一部分可用信息;要求训练和测试阶段目标相对雷达视线的转角保持一致,实际很难满足;无法对单个HRRP样本给出实时判决结果。 基于HRRP样本内距离单元回波间时序信息挖掘的模型 对各HRRP样本内的不同距离单元回波建立时序模型,挖掘样本距离单元之间的时序信息。无需降维、不要求训练和测试阶段目标相对雷达视线转动的一致性、能够给出各HRRP样本的实时判决结果。 对各距离单元回波进行单高斯分布建模,未充分考虑距离单元回波存在的非高斯特性,建模精度仍有提升空间。 表 5 TSB-HMM模型对3类飞机目标HRRP数据的识别率混淆矩阵(%)[62]
Table 5. Confusion matrix of recognition rate via the TSB-HMM on three types of airplanes (%)[62]
识别目标 安-26 奖状 雅克-42 安-26 90.8 9.8 3.5 奖状 8.7 83.0 2.0 雅克-42 0.5 7.2 94.5 平均识别率 89.4 表 6 不同变分自编码模型比较
Table 6. Comparison of different VAE models
方法 优点 缺点 单解码器VAE 综合统计模型的数据分布描述能力、深度网络的数据分层学习能力以及HRRP回波特性,能够提取较浅层模型表征力更强的内隐特征。 对大规模复杂分布HRRP数据的拟合精度仍有限、特征可分性仍有提升空间。 多解码器集成VAE 综合多个对部分观测数据具有高精度描述能力的子解码网络实现对全部HRRP数据分布的准确表达,具备挖掘类间细微差异信息的能力,有利于难分样本类别的准确判断。 训练计算复杂度高、模型学习效率低、存储需求量大。 表 7 不同模型在3类飞机目标HRRP数据上的识别率比较
Table 7. Comparison of recognition rates of different models on HRRP data from three airplanes
表 8 不同深层时序模型比较
Table 8. Comparison of different deep temporal models
方法 优点 缺点 贝叶斯RNN 结合贝叶斯理论可以实现对HRRP不同局部信号非平稳时序关系的准确建模,数据时序特性挖掘更准确。 仅考虑数据时间维信息的深度挖掘,结构信息的深层次提取能力有限,特征表达能力不全面。 循环伽马置信网络 同时对HRRP时间维时序信息和空间维结构信息进行深度挖掘,特征对数据的表征性更强。 建模复杂、推理困难,需要选择合适的参数先验分布保证参数求解的可行性、灵活性低。 -
[1] SKOLNIK M I. Introduction to Radar Systems[M]. 2nd ed. New York: McGraw-Hill, 1980. [2] 向敬成, 张明友. 雷达系统[M]. 北京: 电子工业出版社, 2001.XIANG Jingcheng and ZHANG Mingyou. Radar System[M]. Beijing: Publishing House of Electronics Industry, 2001. [3] 丁鹭飞, 耿富录. 雷达原理[M]. 3版. 西安: 西安电子科技大学出版社, 2002.DING Lufei and GENG Fulu. Principle of Radar[M]. 3rd ed. Xi’an: Xidian University Press, 2002. [4] SKOLNIK M I, 王军, 林强, 米慈中, 等译. 雷达手册[M]. 2版. 北京: 电子工业出版社, 2003.SKOLNIK M I, WANG Jun, LIN Qiang, MI Cizhong, et al. translation. Radar Handbook[M]. 2nd ed. Beijing: Publishing House of Electronics Industry, 2003. [5] 刘宏伟, 杜兰, 袁莉, 等. 雷达高分辨距离像目标识别研究进展[J]. 电子与信息学报, 2005, 27(8): 1328–1334.LIU Hongwei, DU Lan, YUAN Li, et al. Progress in radar automatic target recognition based on high range resolution profile[J]. Journal of Electronics &Information Technology, 2005, 27(8): 1328–1334. [6] 杜兰. 飞机目标的雷达回波特性研究[D]. [硕士论文], 西安电子科技大学, 2004.DU Lan. Research on the characteristics of the radar echoes from aircraft targets[D]. [Master dissertation], Xidian University, 2004. [7] 单凯晶, 肖怀铁, 朱俊. 基于C-均值聚类的高分辨距离像识别[J]. 现代雷达, 2010, 32(6): 49–53. doi: 10.16592/j.cnki.1004-7859.2010.06.025SHAN Kaijing, XIAO Huaitie, and ZHU Jun. High resolution range profiles recognition based on C-means clustering[J]. Modern Radar, 2010, 32(6): 49–53. doi: 10.16592/j.cnki.1004-7859.2010.06.025 [8] 邱祥风, 霍凯, 张新禹, 等. 一种基于雷达高分辨距离像的空天时敏目标识别方法[J]. 航空兵器, 2022, 29(2): 13–18. doi: 10.12132/ISSN.1673-5048.2020.0261QIU Xiangfeng, HUO Kai, ZHANG Xinyu, et al. A recognition method of aerospace time-sensitive targets based on radar high resolution range profile[J]. Aero Weaponry, 2022, 29(2): 13–18. doi: 10.12132/ISSN.1673-5048.2020.0261 [9] 郭宇. 基于高分辨距离像的支持向量数据描述目标识别算法研究[D]. [博士论文], 国防科技大学, 2018.GUO Yu. Research on support vector data description for HRRP-based target recognition[D]. [Ph. D. dissertation], National University of Defense Technology, 2018. [10] 周云. 基于高分辨距离像的雷达目标识别研究[D]. [博士论文], 电子科技大学, 2016.ZHOU Yun. Research on radar target recognition based on high resolution range profile[D]. [Ph. D. dissertation], University of Electronic Science and Technology of China, 2016. [11] 王彩云, 孔一荟. 基于稀疏表示字典优化的雷达高分辨距离像目标识别[J]. 南京航空航天大学学报, 2013, 45(6): 837–842. doi: 10.16356/j.1005-2615.2013.06.026WANG Caiyun and KONG Yihui. Radar high-resolution range profile target recognition based on sparse representation of dictionary optimized[J]. Journal of Nanjing University of Aeronautics &Astronautics, 2013, 45(6): 837–842. doi: 10.16356/j.1005-2615.2013.06.026 [12] 刘华林. 高分辨距离像雷达自动目标识别研究[D]. [博士论文], 电子科技大学, 2008.LIU Hualin. Research on radar automatic target recognition using high resolution range profiles[D]. [Ph. D. dissertation], University of Electronic Science and Technology of China, 2008. [13] PILCHER C M and KHOTANZAD A. Maritime ATR using classifier combination and high resolution range profile[J]. IEEE Transactions on Aerospace and Electronic Systems, 2011, 47(4): 2558–2573. doi: 10.1109/TAES.2011.6034651 [14] SLOMKA S, GIBBINS D, GRAY D, et al. Features for high resolution radar range profile based ship classification[C]. The fifth International Symposium on Signal Processing and its Applications, Brisbane, Australia, 1999: 329–332. [15] 杜兰, 刘宏伟, 保铮, 等. 一种利用目标雷达高分辨距离像幅度起伏特性的特征提取新方法[J]. 电子学报, 2005, 33(3): 411–415. doi: 10.3321/j.issn:0372-2112.2005.03.007DU Lan, LIU Hongwei, BAO Zheng, et al. A new feature extraction method using the amplitude fluctuation property of target HRRPs for radar automatic target recognition[J]. Acta Electronica Sinica, 2005, 33(3): 411–415. doi: 10.3321/j.issn:0372-2112.2005.03.007 [16] KIM K T, SEO D K, and KIM H T. Efficient radar target recognition using the MUSIC algorithm and invariant features[J]. IEEE Transactions on Antennas and Propagation, 2002, 50(3): 325–337. doi: 10.1109/8.999623 [17] ZHANG Xianda, SHI Yu, and BAO Zheng. A new feature vector using selected bispectra for signal classification with application in radar target recognition[J]. IEEE Transactions on Signal Processing, 2001, 49(9): 1875–1885. doi: 10.1109/78.942617 [18] 杜兰. 雷达高分辨距离像目标识别方法研究[D]. [博士论文], 西安电子科技大学, 2007.DU Lan. Study on radar HRRP target recognition[D]. [Ph. D. dissertation], Xidian University, 2007. [19] DU Lan, LIU Hongwei, WANG Penghui, et al. Noise robust radar HRRP target recognition based on multitask factor analysis with small training data size[J]. IEEE Transactions on Signal Processing, 2012, 60(7): 3546–3559. doi: 10.1109/TSP.2012.2191965 [20] DU Lan, LIU Hongwei, BAO Zheng, et al. Radar HRRP target recognition based on higher order spectra[J]. IEEE Transactions on Signal Processing, 2005, 53(7): 2359–2368. doi: 10.1109/TSP.2005.849161 [21] 朱劼昊, 周建江, 吴杰. 基于半参数化概率密度估计的雷达目标识别[J]. 电子与信息学报, 2010, 32(9): 2161–2166. doi: 10.3724/SP.J.1146.2009.0120ZHU Jiehao, ZHOU Jianjiang, and WU Jie. Radar target recognition based on semiparametric density estimation[J]. Journal of Electronics &Information Technology, 2010, 32(9): 2161–2166. doi: 10.3724/SP.J.1146.2009.0120 [22] 崔姗姗. 基于概率统计模型的雷达目标HRRP识别[D]. [硕士论文], 南京航空航天大学, 2012.CUI Shanshan. Radar target recognition based on the statistic model of high resolution range profile[D]. [Master dissertation], Nanjing University of Aeronautics and Astronautics, 2012. [23] DU Lan, HE Hua, ZHAO Le, et al. Noise robust radar HRRP target recognition based on scatterer matching algorithm[J]. IEEE Sensors Journal, 2016, 16(6): 1743–1753. doi: 10.1109/JSEN.2015.2501850 [24] SIM D G, KWON O K, and PARK R H. Object matching algorithms using robust Hausdorff distance measures[J]. IEEE Transactions on Image Processing, 1999, 8(3): 425–429. doi: 10.1109/83.748897 [25] FENG Bo, DU Lan, LIU Hongwei, et al. Radar HRRP target recognition based on K-SVD algorithm[C]. 2011 IEEE CIE International Conference on Radar, Chengdu, China, 2011: 642–645. [26] FENG Bo, CHEN Bo, and LIU Hongwei. Radar HRRP target recognition with deep networks[J]. Pattern Recognition, 2017, 61: 379–393. doi: 10.1016/j.patcog.2016.08.012 [27] XU Bin, CHEN Bo, WAN Jinwei, et al. Target-aware recurrent attentional network for radar HRRP target recognition[J]. Signal Processing, 2019, 155: 268–280. doi: 10.1016/j.sigpro.2018.09.041 [28] WAN Jinwei, CHEN Bo, XU Bin, et al. Convolutional neural networks for radar HRRP target recognition and rejection[J]. EURASIP Journal on Advances in Signal Processing, 2019, 2019: 5. doi: 10.1186/s13634-019-0603-y [29] 朱新奎. 空间目标高分辨距离像识别及微动特征提取方法研究[D]. [硕士论文], 西安电子科技大学, 2017.ZHU Xinkui. Research on space target HRRP recognition and micro-motion feature extraction methods[D]. [Master dissertation], Xidian University, 2017. [30] 翟颖. 基于自编码模型的雷达高分辨距离像目标识别方法研究[D]. [硕士论文], 西安电子科技大学, 2018.ZHAI Ying. Study of radar high range resolution profiles target recognition based on auto-encoder[D]. [Master dissertation], Xidian University, 2018. [31] 冯博. 雷达高分辨距离像特征提取与识别方法研究[D]. [博士论文], 西安电子科技大学, 2015.FENG Bo. Feature extraction and recognition methods for radar high range resolution profiles[D]. [Ph. D. dissertation], Xidian University, 2015. [32] DU Lan, WANG Penghui, ZHANG Lei, et al. Robust statistical recognition and reconstruction scheme based on hierarchical Bayesian learning of HRR radar target signal[J]. Expert Systems with Applications, 2015, 42(14): 5860–5873. doi: 10.1016/j.eswa.2015.03.029 [33] DILOKTHANAKUL N, MEDIANO P A M, GARNELO M, et al. Deep unsupervised clustering with Gaussian mixture variational autoencoders[EB/OL]. https://doi.org/10.48550/arXiv.1611.02648, 2016. [34] CHEN Jian, DU Lan, and LIAO Leiyao. Discriminative mixture variational autoencoder for semisupervised classification[J]. IEEE Transactions on Cybernetics, 2022, 52(5): 3032–3046. doi: 10.1109/TCYB.2020.3023019 [35] WEBB A R. Gamma mixture models for target recognition[J]. Pattern Recognition, 2000, 33(12): 2045–2054. doi: 10.1016/S0031-3203(99)00195-8 [36] 李斌, 姚康泽, 张银河, 等. 基于HRRP统计模型的目标识别[J]. 航天电子对抗, 2010, 26(3): 48–51. doi: 10.3969/j.issn.1673-2421.2010.03.014LI Bin, YAO Kangze, ZHANG Yinhe, et al. Target recognition based on the statistical model of high resolution range profile[J]. Aerospace Electronic Warfare, 2010, 26(3): 48–51. doi: 10.3969/j.issn.1673-2421.2010.03.014 [37] PAN Mian, DU Lan, WANG Penghui, et al. Noise-robust modification method for Gaussian-based models with application to radar HRRP recognition[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(3): 558–562. doi: 10.1109/LGRS.2012.2213234 [38] 赵乃杰, 李辉, 金宝龙. 改进的雷达高分辨距离像统计识别方法[J]. 计算机工程与应用, 2012, 48(21): 118–122. doi: 10.3778/j.issn.1002-8331.2012.21.025.ZHAO Naijie, LI Hui, and JIN Baolong. Improved statistical identification method of high resolution range profiles[J]. Computer Engineering and Applications, 2012, 48(21): 118–122. doi: 10.3778/j.issn.1002-8331.2012.21.025. [39] DU Lan, LIU Hongwei, and BAO Zheng. Radar HRRP statistical recognition: Parametric model and model selection[J]. IEEE Transactions on Signal Processing, 2008, 56(5): 1931–1944. doi: 10.1109/TSP.2007.912283 [40] SHI Lei, WANG Penghui, LIU Hongwei, et al. Radar HRRP statistical recognition with local factor analysis by automatic Bayesian Ying-Yang harmony learning[J]. IEEE Transactions on Signal Processing, 2011, 59(2): 610–617. doi: 10.1109/TSP.2010.2088391 [41] PAN Mian, DU Lan, WANG Penghui, et al. Multi-task hidden Markov modeling of spectrogram feature from radar high-resolution range profiles[J]. EURASIP Journal on Advances in Signal Processing, 2012, 2012: 86. doi: 10.1186/1687-6180-2012-86 [42] ZHANG Xuefeng, CHEN Bo, LIU Hongwei, et al. Infinite max-margin factor analysis via data augmentation[J]. Pattern Recognition, 2016, 52: 17–32. doi: 10.1016/j.patcog.2015.10.020 [43] LI Liling, DU Lan, ZHANG Wei, et al. Enhancing information discriminant analysis: Feature extraction with linear statistical model and information-theoretic criteria[J]. Pattern Recognition, 2016, 60: 554–570. doi: 10.1016/j.patcog.2016.06.004 [44] KINGMA D P and WELLING M. Auto-encoding variational Bayes[C]. 2nd International Conference on Learning Representations, Banff, Canada, 2014. [45] DU Chuan, CHEN Bo, XU Bin, et al. Factorized discriminative conditional variational auto-encoder for radar HRRP target recognition[J]. Signal Processing, 2019, 158: 176–189. doi: 10.1016/j.sigpro.2019.01.006 [46] CHEN Wenchao, CHEN Bo, PENG Xiaojun, et al. Tensor RNN with Bayesian nonparametric mixture for radar HRRP modeling and target recognition[J]. IEEE Transactions on Signal Processing, 2021, 69: 1995–2009. doi: 10.1109/TSP.2021.3065847 [47] GUO Dandan, CHEN Bo, CHEN Wenchao, et al. Variational temporal deep generative model for radar HRRP target recognition[J]. IEEE Transactions on Signal Processing, 2020, 68: 5795–5809. doi: 10.1109/TSP.2020.3027470 [48] COPSEY K and WEBB A. Bayesian gamma mixture model approach to radar target recognition[J]. IEEE Transactions on Aerospace and Electronic systems, 2003, 39(4): 1201–1217. doi: 10.1109/TAES.2003.1261122 [49] DU Lan, LIU Hongwei, BAO Zheng, et al. A two-distribution compounded statistical model for radar HRRP target recognition[J]. IEEE Transactions on Signal Processing, 2006, 54(6): 2226–2238. doi: 10.1109/TSP.2006.873534 [50] 赵峰, 张军英, 刘敬, 等. 基于Gamma-SLC混合密度估计的雷达目标识别[J]. 系统工程与电子技术, 2008, 30(3): 438–443. doi: 10.3321/j.issn:1001-506X.2008.03.012ZHAO Feng, ZHANG Junying, LIU Jing, et al. Radar target recognition based on the compounded density estimation of Gamma-SLC[J]. Systems Engineering and Electronics, 2008, 30(3): 438–443. doi: 10.3321/j.issn:1001-506X.2008.03.012 [51] VAN TREES H L. Detection, Estimation, and Modulation Theory[M]. New York: John Wiley & Sons, 1971. [52] 王鹏辉. 基于统计建模的雷达高分辨距离像目标识别方法研究[D]. [博士论文], 西安电子科技大学, 2012.WANG Penghui. Study of radar high resolution range profile target recognition based on statistical modeling[D]. [Ph. D. dissertation], Xidian University, 2012. [53] 李晓辉, 黎湘, 郭桂蓉. 基于LDA算法的一维距离像特征提取[J]. 国防科技大学学报, 2005, 27(6): 72–76. doi: 10.3969/j.issn.1001-2486.2005.06.016LI Xiaohui, LI Xiang, and GUO Guirong. Feature extraction of HRRP based on LDA algorithm[J]. Journal of National University of Defense Technology, 2005, 27(6): 72–76. doi: 10.3969/j.issn.1001-2486.2005.06.016 [54] DU Lan, CHEN Jian, HU Jing, et al. Statistical modeling with label constraint for radar target recognition[J]. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(2): 1026–1044. doi: 10.1109/TAES.2019.2925472 [55] CHEN Jian, DU Lan, HE Hua, et al. Convolutional factor analysis model with application to radar automatic target recognition[J]. Pattern Recognition, 2019, 87: 140–156. doi: 10.1016/j.patcog.2018.10.014 [56] CHEN Jian, DU Lan, and GUO Yuchen. Label constrained convolutional factor analysis for classification with limited training samples[J]. Information Sciences, 2021, 544: 372–394. doi: 10.1016/j.ins.2020.08.048 [57] CHEN Minhua, SILVA J, PAISLEY J, et al. Compressive sensing on manifolds using a nonparametric mixture of factor analyzers: Algorithm and performance bounds[J]. IEEE Transactions on Signal Processing, 2010, 58(12): 6140–6155. doi: 10.1109/TSP.2010.2070796 [58] CHEN Jian, LIAO Leiyao, ZHANG Wei, et al. Mixture factor analysis with distance metric constraint for dimensionality reduction[J]. Pattern Recognition, 2022, 121: 108156. doi: 10.1016/J.PATCOG.2021.108156 [59] 何珺田. 联合生成与判别模型的雷达HRRP目标识别方法研究[D]. [硕士论文], 西安电子科技大学, 2018.HE Juntian. Research on radar HRRP target recognition based on hybrid generative discriminative models[D]. [Master dissertation], Xidian University, 2018. [60] PEI Bingnan and BAO Zheng. Multi-aspect radar target recognition method based on scattering centers and HMMs classifiers[J]. IEEE Transactions on Aerospace and Electronic Systems, 2005, 41(3): 1067–1074. doi: 10.1109/TAES.2005.1541451 [61] ZHU Feng, ZHANG Xianda, HU Yafeng, et al. Nonstationary hidden Markov models for multiaspect discriminative feature extraction from radar targets[J]. IEEE Transactions on Signal Processing, 2007, 55(5): 2203–2214. doi: 10.1109/TSP.2007.892708 [62] 潘勉, 王鹏辉, 杜兰, 等. 基于TSB-HMM模型的雷达高分辨距离像目标识别方法[J]. 电子与信息学报, 2013, 35(7): 1547–1554. doi: 10.3724/SP.J.1146.2012.01190PAN Mian, WANG Penghui, DU Lan, et al. Radar HRRP target recognition based on truncated stick-breaking hidden Markov model[J]. Journal of Electronics &Information Technology, 2013, 35(7): 1547–1554. doi: 10.3724/SP.J.1146.2012.01190 [63] LIAO Leiyao, DU Lan, and CHEN Jian. Class factorized complex variational auto-encoder for HRR radar target recognition[J]. Signal Processing, 2021, 182: 107932. doi: 10.1016/j.sigpro.2020.107932 [64] 陈健. 基于概率统计模型的雷达高分辨距离像目标识别方法研究[D]. [博士论文], 西安电子科技大学, 2020.CHEN Jian. Study of radar HRRP target recognition based on probability statistical model[D]. [Ph. D. dissertation], Xidian University, 2020. [65] YUKSEL S E, WILSON J N, and GADER P D. Twenty years of mixture of experts[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(8): 1177–1193. doi: 10.1109/TNNLS.2012.2200299 [66] CHEN Wenchao, CHEN Bo, LIU Yicheng, et al. Bidirectional recurrent gamma belief network for HRRP target recognition[J]. Signal Processing, 2021, 188: 108213. doi: 10.1016/j.sigpro.2021.108213 期刊类型引用(6)
1. 闫军,顾村锋,孔德永,龚江昆. 基于微多普勒信号的无人机回波检测技术研究. 空天防御. 2025(01): 10-16+23 . 百度学术
2. 王沙飞,朱梦韬,李云杰,杨健,李岩. 对先进多功能雷达系统行为的识别、推理与预测:综述与展望. 信号处理. 2024(01): 17-55 . 百度学术
3. 陈士超,魏靖彪,范俊,魏玺章,王泽朝,孙谦,刘明. 基于判别性无穷模糊受限玻尔兹曼机模型的HRRP序列识别. 兵工学报. 2024(S1): 43-50 . 百度学术
4. 赵娟娟. 基于统计模型的电子信息产业企业成长性分析. 中国电子商情. 2024(04): 64-66 . 百度学术
5. 苏海龙,水鹏朗. 采用双迭代寻优算法的舰船复HRRP估计. 西安电子科技大学学报. 2023(06): 105-119 . 百度学术
6. 赵春雷,姚嘉嵘,李京效,戚张行,魏汇赞. 地基雷达空中目标识别方法研究综述. 空天预警研究学报. 2023(05): 313-320+334 . 百度学术
其他类型引用(10)
-