-
摘要: 稀疏恢复空时自适应处理(SR-STAP)方法能够利用少量训练距离单元实现对机载雷达杂波的有效抑制。然而,现有SR-STAP方法均基于模型驱动实现,存在着参数设置困难、运算复杂度高等问题。针对这些问题,该文将基于模型驱动的SR方法和基于数据驱动的深度学习方法相结合,首次将深度展开(DU)引入到机载雷达杂波抑制和目标检测之中。首先,建立了阵列误差(AE)条件下的杂波空时谱和阵列误差参数联合估计模型,并利用交替方向乘子法(ADMM)进行求解;接着,将ADMM算法展开为深度神经网络AE-ADMM-Net,利用充足完备的数据集对其迭代参数进行优化;最后,利用训练后的AE-ADMM-Net对训练距离单元数据进行处理,快速获得杂波空时谱和阵列误差参数的准确估计。仿真结果表明:与典型SR-STAP方法相比,该文所提出的DU-STAP方法能够在保持较低运算复杂度的同时提高杂波抑制性能。Abstract: The Sparse Recovery Space-Time Adaptive Processing (SR-STAP) method can use a small number of training range cells to effectively suppress the clutter of airborne radar. The SR-STAP approach may successfully eliminate airborne radar clutter using a limited number of training range cells. However, present SR-STAP approaches are all model-driven, limiting their practical applicability due to parameter adjustment difficulties and high computational cost. To address these problems, this study, for the first time, introduces the Deep Unfolding/Unrolling (DU) method to airborne radar clutter reduction and target recognition by merging the model-driven SR method and the data-driven deep learning method. Firstly, a combined estimation model for clutter space-time spectrum and Array Error (AE) parameters is established and solved using the Alternating Direction Method of Multipliers (ADMM) algorithm. Secondly, the ADMM algorithm is unfolded to a deep neural network, named AE-ADMM-Net, to optimize all iteration parameters using a complete training dataset. Finally, the training range cell data is processed by the trained AE-ADMM-Net, jointly estimating the clutter space-time spectrum and the radar AE parameters efficiently and accurately. Simulation results show that the proposed DU-STAP method can achieve higher clutter suppression performance with lower computational cost compared to typical SR-STAP methods.
-
1. 引言
空时自适应处理(Space-Time Adaptive Processing, STAP)是机载雷达地/海杂波抑制和运动目标检测的关键技术[1,2]。为设计空时滤波器自适应抑制杂波,STAP方法一般需要利用一定数量的独立同分布(Independent Identically Distributed, IID)训练距离单元估计待测距离单元(Range cell Under Test, RUT)的杂波协方差矩阵(Clutter Covariance Matrix, CCM)。为保证输出信杂噪比相比理想条件的损失不超过3 dB,传统STAP方法所需IID训练单元的数量至少为系统自由度的2倍。然而,在实际非均匀杂波环境中,通常难以获得足够的IID训练单元。为解决这一问题,学者提出降维、降秩、直接数据域、知识辅助和稀疏恢复等STAP新方法[3-8]。其中,稀疏恢复空时自适应处理(SR-STAP)方法基于杂波在角度-多普勒域(即空时二维平面)的稀疏特性,利用少量训练距离单元即可获得杂波空时谱的准确估计,从而重构CCM或杂波子空间,构造空时滤波器对杂波进行抑制[9-16]。
在实际应用中,机载雷达不可避免地存在着阵列误差,包括幅度误差和相位误差。由于误差信息隐含于CCM的估计之中,传统STAP方法具有较强的误差自适应补偿能力。然而,由于SR-STAP方法通常利用理想空时导向矢量构建杂波空时谱估计模型,其性能受误差的影响较大。阵列误差会降低杂波空时谱及CCM的估计准确性,从而严重影响SR-STAP方法的杂波抑制和目标检测性能。针对这一问题,文献[17]提出了基于迭代交替下降(Iterative Alternating Descent, IAD)算法的SR-STAP方法,能够同时估计杂波空时谱和阵列误差参数,但该方法的运算复杂度较高;文献[18]提出了基于ADMM算法的杂波空时谱和阵列误差参数联合估计方法,相比IAD方法运算复杂度较低,但需要同时对多个迭代参数进行设置。
在构建杂波空时谱估计模型或杂波空时谱及阵列误差参数联合估计模型的前提下,现有SR-STAP方法的性能往往依赖于所采用的SR算法。目前,典型的SR算法均基于模型驱动实现,具有理论保证性高、可解释性强等优点。但是,模型驱动类SR算法通常需要设置一个或多个参数,例如正则化因子、迭代步长等。不恰当的参数设置会影响SR算法的收敛速度和精度,从而使得SR-STAP方法的运算复杂度升高、杂波抑制性能下降,限制了其在实际中的应用。针对模型驱动类SR算法存在的问题,受深度学习技术的启发,学者提出了DU方法[19-23]。DU方法将特定SR算法展开为深度神经网络,将算法的迭代次数作为网络的层数、算法的参数作为网络的学习参数,利用训练数据集对SR算法所涉及的迭代参数进行训练,获得最优参数,从而提高SR算法的收敛速度和精度。例如,Gregor等人[19]基于迭代软阈值算法(Iterative Soft Thresholding Algorithm, ISTA),提出了学习型ISTA(Learned ISTA, LISTA)算法;Borgerding等人[21]对近似消息传递(Approximate Message Passing, AMP)算法进行展开,提出了LAMP算法;Yang等人[22]基于近端算子方法(Proximal Operator Methods, POM),提出了LePOM算法。相比其对应的SR算法,DU方法将模型驱动和数据驱动相结合,能够有效降低算法复杂度、提高算法性能。
目前,尚未有研究将DU方法引入到机载雷达SR-STAP之中,且上述DU方法仅能用于杂波空时谱估计,无法同时估计阵列误差参数。因此,为解决现有SR-STAP方法存在的参数设置困难和运算复杂度高等问题,本文提出了机载雷达DU-STAP方法,以验证DU方法在机载雷达杂波抑制和目标检测中的适用性。首先,建立了阵列误差条件下的机载雷达回波信号模型,并利用ADMM算法对杂波空时谱和阵列误差参数进行联合估计;接着,根据对其迭代步骤和数据流图的分析,将ADMM算法展开为深度神经网络,构建具有正则化因子、迭代步长、二次惩罚因子和比例因子等可学习参数的AE-ADMM-Net;然后,定义网络损失函数,基于充足完备的数据集对AE-ADMM-Net进行训练,获得最优参数;最后,利用训练后的AE-ADMM-Net对训练距离单元数据进行处理,快速获得杂波空时谱和阵列误差参数的准确估计,从而设计空时滤波器进行杂波抑制和目标检测。仿真实验表明:相比基于稀疏贝叶斯学习(Sparse Bayesian Learning, SBL)算法[13]、欠定系统聚焦式求解算法(Focal Under-determined System Solver, FOCUSS)[10]和ADMM算法的典型SR-STAP方法,本文所提出的DU-STAP方法均能够在保持较低运算复杂度的同时提高杂波抑制性能。
2. 理论基础
2.1 信号模型
如图1所示,假设机载雷达以高度H、速度v沿y轴匀速飞行,正侧视均匀线阵的阵元个数为M,阵元间距为
d=λ/2 (λ 为波长),脉冲重复频率为fr ,在一个相干处理间隔内共有N个脉冲。不考虑距离模糊杂波的影响,假设每个距离单元所对应的距离环中共有
Nc 个杂波块均匀分布在方位角θ∈[0,π] 上,则包含运动目标的RUT空时回波信号可表示为y0=αTsdsT+Nc∑i=1αisdsi+ε0=yT0+yC0+ε0∈CNM×1 (1) 其中,
αT 和αi 分别表示目标和第i个杂波块的复幅度;sdsT=sdT⊗ssT∈CNM×1 和sdsi=sdi⊗ssi∈CNM×1 分别表示目标和第i个杂波块的空时导向矢量;sdi=[1,ej2πfdi,⋯,ej2π(N−1)fdi]T∈CN×1 和ssi=[1,ej2πfsi,⋯,ej2π(M−1)fsi]T∈CM×1 分别表示第i个杂波块的时域导向矢量和空域导向矢量,fdi=2vcosφicosθi/(λfr) 和fsi=dcosφicosθi/λ 分别表示第i个杂波块的归一化多普勒频率和空间频率,φi 和θi 表示第i个杂波块的俯仰角和方位角;⊗ 表示Kronecker积,[⋅]T 表示转置,j=√−1 ;yT0 ,yC0 和ε0 分别表示目标、杂波和噪声信号。假设各个杂波块之间相互独立,与噪声不相关,且噪声服从均值为0、协方差矩阵为
RN = σ2INM 的复高斯分布,则杂波加噪声协方差矩阵(Clutter plus Noise Covariance Matrix, CNCM)可表示为RC=E[(yC0+ε0)(yC0+ε0)H]=Nc∑i=1E[|αi|2](sdsi)(sdsi)H+RN∈CNM×NM (2) 其中,
E[⋅] 表示期望,[⋅]H 表示共轭转置,INM 表示NM×NM 的单位矩阵。STAP通过计算空时回波信号的加权组合实现对杂波和噪声的抑制以及对运动目标的检测。为使输出信杂噪比(Signal to Clutter plus Noise Ratio, SCNR)最大,空时滤波器的最优权值可通过式(3)计算得出:
wopt=R−1CsdsT/[(sdsT)HR−1CsdsT]∈CNM×1 (3) 其中,
(⋅)−1 表示对矩阵求逆。实际上,RUT的CNCM是未知的,一般需要一定数量的无目标训练距离单元对其进行估计。假设训练距离单元与RUT的杂波独立同分布,则RUT的CNCM可以通过采样协方差矩阵求逆(Sample Matrix Inversion, SMI)方法估计得到[1],表示为
ˆRC=(1/L)L∑l=1ylyHl (4) 其中,
l=1,2,⋯,L ,L表示IID训练距离单元个数,yl 表示第l个训练距离单元的空时回波信号。根据RMB准则[2],SMI方法确保输出SCNR损失小于 3 dB所需的 IID 训练距离单元数应至少为 2 倍的系统自由度。在实际非均匀环境中,该条件通常难以得到满足。此外,实际机载雷达不可避免地存在阵列幅相误差。此时,RUT空时回波信号、CNCM和最优空时权值可分别表示为
˜y0=αT˜sdsT+Nc∑i=1αisdi⊗(e⊙ssi)+ε0=αT˜sdsT+Nc∑i=1αi˜sdsi+ε0=˜yT0+˜yC0+ε0 (5) ˜RC=Nc∑i=1E[|αi|2]sdi⊗(e⊙ssi)[sdi⊗(e⊙ssi)]H+RN=Nc∑i=1E[|αi|2]sdi(sdi)H⊗(eeH⊙ssi(ssi)H)+RN (6) ˜wopt=˜R−1C˜sdsT/[(˜sdsT)H˜R−1C˜sdsT] (7) 其中,
⊙ 表示Hadamard积,˜sdsT=sdT⊗(e⊙ssT) 表示阵列误差下的目标空时导向矢量,e=[e1,e2,⋯,eM]T 表示阵列幅相误差矢量,em=(1+νm)ejϕm ,m=1,2,⋯,M ,νm∈R 和ϕm∈R 分别为第m个实际阵元与理想阵元之间的幅度误差和相位误差。2.2 SR-STAP
由式(1)可以看出,杂波信号可由不同空间频率和多普勒频率的空时信号叠加而成。如果分别将空间频率和多普勒频率离散化为
Ns=κsM 和Nd=κdN 个网格点(其中κs>1 和κd>1 表示尺度因子),则第l个无目标训练距离单元的空时回波信号可表示为yl=NsNd∑q=1αqlsdq⊗ssq+εl=NsNd∑q=1αqlsdsq+εl=Aαl+εl (8) 其中,
αql 为第q个网格点对应的复幅度,q=1,2,⋯,NsNd ,αl=[α1l,α2l,⋯,αNsNdl]T∈CNsNd×1 为所有网格点对应的复幅度矢量,即杂波空时谱;sdq=[1,ej2πfdq,⋯,ej2π(N−1)fdq]T 和ssq=[1,ej2πfsq,⋯,ej2π(M−1)fsq]T 为第q个网格点对应的时域导向矢量和空域导向矢量,fdq 和fsq 为第q个多普勒频率和空间频率,A=[sds1,sds2,⋯,sdsNsNd]∈CNM×NsNd 为空时导向矢量字典,εl 为噪声信号。根据杂波空时谱的稀疏性,可将欠定问题(8)转化为如下约束优化问题进行求解:
argmin (9) 其中,
|| \cdot |{|_0} 和|| \cdot |{|_2} 分别表示向量的L0范数和L2范数,\xi 表示噪声电平。在存在L个训练距离单元的情况下,式(9)可扩展至多观测模型,表示为
\mathop {\arg \min }\limits_{\boldsymbol{\varLambda}} ||{\boldsymbol{\varLambda}} |{|_{2,0}}\;\; {{\rm{s}}}{.{\rm{t}}}.||{\boldsymbol{Y}} - {\boldsymbol{A\varLambda}} ||_{{\rm{F}}}^2 \le L\xi (10) 其中,
{\boldsymbol{Y}} = [{{\boldsymbol{y}}_1},{{\boldsymbol{y}}_2},\cdots,{{\boldsymbol{y}}_L}] \in {\mathbb{C}^{NM \times L}} ,{\boldsymbol{\varLambda}} = [{{\boldsymbol{\alpha}} _1}, {{\boldsymbol{\alpha}} _2},\cdots,{{\boldsymbol{\alpha}} _L}] \in {\mathbb{C}^{NM \times L}} ,|| \cdot |{|_{2,0}} 表示先对矩阵各行取L2范数再对列取L0范数,|| \cdot |{|_{\rm{F}}} 表示矩阵的Frobenius范数。利用L1凸优化算法、FOCUSS算法或SBL算法等稀疏恢复算法对式(9)或式(10)进行求解,可获得
{{\boldsymbol{\alpha}} _l} 或{\boldsymbol{\varLambda}} 的高分辨估计。然后,可通过式(11)计算CNCM,并根据式(3)设计空时滤波器:{\hat {\boldsymbol{R}}_{{\rm{C}}}} = (1/L)\sum\limits_{l = 1}^L {\sum\limits_{q = 1}^{{N_{{\rm{s}}}}{N_{{\rm{d}}}}} {|\alpha _l^q{|^2}{\boldsymbol{s}}_q^{{{\rm{ds}}}}{{({\boldsymbol{s}}_q^{{{\rm{ds}}}})}^{\text{H}}}} } + {{\boldsymbol{R}}_{{\rm{N}}}} (11) 同理,当存在阵列误差时,第l个训练距离单元的空时回波信号可表示为
{\tilde {\boldsymbol{y}}_l}{\text{ = }}\sum\limits_{q = 1}^{{N_{\rm{s}}} \times {N_{\rm{d}}}} {\alpha _l^q{\boldsymbol{s}}_q^{\rm{d}} \otimes {\text{(}}{\boldsymbol{e}} \odot {\boldsymbol{s}}_q^{{\rm{s}}}) + {{\boldsymbol{\varepsilon}} _l}} = {\boldsymbol{EA}}{{\boldsymbol{\alpha}} _l} + {{\boldsymbol{\varepsilon}} _l} (12) 其中,
{\boldsymbol{E}} = {{\boldsymbol{I}}_N} \otimes {\rm{diag}}({\boldsymbol{e}}) ,{{\boldsymbol{I}}_N} 表示N \times N 的单位矩阵,{\rm{diag}}( \cdot ) 表示取对角矩阵。此时,需要同时估计杂波空时谱
{{\boldsymbol{\alpha}} _l} 和阵列误差参数e,表示为\mathop {\arg \min }\limits_{{{\boldsymbol{\alpha}} _l},{\boldsymbol{e}}} ||{{\boldsymbol{\alpha}} _l}|{|_0}\;\;{{\rm{s}}}{.{\rm{t}}}.||{\tilde {\boldsymbol{y}}_l} - {\boldsymbol{EA}}{{\boldsymbol{\alpha}} _l}||_2^2 \le \xi (13) 在求解(13)的基础上,CNCM可通过式(14)进行计算,从而根据式(7)设计空时滤波器:
{\hat {\tilde {\boldsymbol{R}}}_{{\rm{C}}}} = \sum\limits_{q = 1}^{{N_{{\rm{s}}}}{N_{{\rm{d}}}}} {|\alpha _l^q{|^2}{\boldsymbol{s}}_q^{{\rm{d}}}{{({\boldsymbol{s}}_q^{{\rm{d}}})}^{\text{H}}} \otimes \left({\boldsymbol{e{}}{\boldsymbol{e}}^{\text{H}}} \odot {\boldsymbol{s}}_q^{{\rm{s}}}{{({\boldsymbol{s}}_q^{{\rm{s}}})}^{\text{H}}}\right)} + {{\boldsymbol{R}}_{{\rm{N{\boldsymbol{}}}}}} (14) SR-STAP方法利用少量甚至单个训练距离单元即可获得CNCM的准确估计,从而实现对杂波的抑制,在实际非均匀环境中具有显著优势。为简便起见,本文仅考虑单个训练距离单元的情况,即L=1,多个训练距离单元的情况可对本文算法进行拓展处理。此外,需要说明的是:在存在距离模糊的情况下,仍然可以建立如式(9)或式(10)所示的优化模型,利用SR算法进行求解,获得距离模糊杂波空时谱的高分辨估计,具体可参考文献[24,25]。
3. DU-STAP方法
为降低运算复杂度、提高杂波抑制性能,本文拟利用DU方法对杂波空时谱和阵列误差参数联合估计模型(13)进行求解。由文献[21]可知,对于
{\boldsymbol{y}} = {\boldsymbol{A\alpha}} {\text{ + }}{\boldsymbol{\varepsilon}} 所示的稀疏恢复问题,大多迭代类SR算法的步骤可表示为{{\boldsymbol{\alpha}} ^{k + 1}} = P({{\boldsymbol{\alpha}} ^k} - {\gamma _k}{{\boldsymbol{A}}^{\rm{H}}}({\boldsymbol{A}}{{\boldsymbol{\alpha}} ^k} - {\boldsymbol{y}})) 。其中,{{\boldsymbol{\alpha}} ^k} 为第k次迭代估计结果,{\gamma _k} 为迭代步长,P( \cdot ) 为非线性算子。令{{\boldsymbol{W}}^k} = {{\boldsymbol{I}}_{NM}} - {\gamma _k}{{\boldsymbol{A}}^{\rm{H}}}{\boldsymbol{A}} ,{{\boldsymbol{B}}^k} = {\gamma _k}{{\boldsymbol{A}}^{\rm{H}}} ,则SR算法的第k次迭代等价于{{\boldsymbol{\alpha}} ^{k + 1}} = P({{\boldsymbol{W}}^k} \cdot{{\boldsymbol{\alpha}} ^k}+ {{\boldsymbol{B}}^k}{\boldsymbol{y}}) 。将{{\boldsymbol{W}}^k} 和{{\boldsymbol{B}}^k} 定义为深度神经网络的权重参数,P( \cdot ) 定义为深度神经网络的激活函数,{{\boldsymbol{\alpha}} ^k} 和{{\boldsymbol{\alpha}} ^{k + 1}} 分别定义为深度神经网络第k层的输入和输出,则SR算法的第k次迭代等价于深度神经网络的第k层运算。因此,DU方法可以看作基于SR算法的迭代步骤对深度神经网络的结构和参数进行设计。理论上,LISTA, LAMP和LePOM等DU方法[19-21]均可以实现对杂波空时谱的估计,即对式(9)进行求解。然而,这些方法无法同时估计阵列误差参数,即无法对式(13)进行求解。针对这一问题,本文对ADMM算法[18]进行分析,将其展开为深度神经网络,构建AE-ADMM-Net,实现对杂波空时谱和阵列误差参数的快速准确估计。3.1 ADMM算法
定义
{\boldsymbol T} = {{\boldsymbol{I}}_N} \otimes {\rm{diag}}({\boldsymbol{t}}) ,其中{\boldsymbol{t}} = {[{t_1},{t_2}, \cdots ,{t_M}]^{\rm{T}}} ,{t_m} = {{\rm{e}}}_m^{ - 1} = {(1 + {\nu _m})^{ - 1}}{{{\rm{e}}}^{ - {{\rm{j}}}{\phi _m}}} ,则可将式(12)变换为{\boldsymbol T}{\boldsymbol{y}} = {\boldsymbol T}{\boldsymbol{EA\alpha}} + {\boldsymbol T}{\boldsymbol{\varepsilon}} = {\boldsymbol{A\alpha}} + {\boldsymbol{\varepsilon}} ' (15) 其中,
{\boldsymbol{y}} = {\tilde {\boldsymbol{y}}_l} ,{\boldsymbol{\alpha}} = {{\boldsymbol{\alpha}} _l} ,{\boldsymbol{\varepsilon}} = {{\boldsymbol{\varepsilon}} _l} 。由于本文仅考虑单个训练距离单元的情况,因此忽略下标l。式(15)将阵列幅相误差矢量e转化为参数矢量t,可通过式(16)进行求解:
\mathop {\arg \min }\limits_{{\boldsymbol{\alpha ,t}}} ||{\boldsymbol{\alpha}} |{|_1} + 1/(2\rho )||{\boldsymbol{Ty}} - {\boldsymbol{A\alpha}} ||_2^2 (16) 其中,
\rho > 0 表示正则化因子。定义辅助变量
{\boldsymbol{\eta}} = {\boldsymbol T}{\boldsymbol{y}} - {\boldsymbol{A\alpha}} ,则式(16)可等效为\mathop {\arg \min }\limits_{{\boldsymbol{\alpha}} ,{\boldsymbol{\eta }}} ||{\boldsymbol{\alpha}} |{|_1} + 1/(2\rho )||{\boldsymbol{\eta}} ||_2^2{\text{ }}\;\;{\rm{s.t}}.{\text{ }}{\boldsymbol{A\alpha}} + {\boldsymbol{\eta}} = {\boldsymbol T}{\boldsymbol{y}} (17) 等式约束问题(17)的增广拉格朗日函数可表示为
\begin{split} & \mathop {\arg \min }\limits_{{\boldsymbol{\alpha}} ,{\boldsymbol{\eta}} ,{\boldsymbol{\lambda}} ,{\boldsymbol{t}}} ||{\boldsymbol{\alpha}} |{|_1} + 1/(2\rho )||{\boldsymbol{\eta}} ||_2^2 - \mathbb{R}{\text{\{ }}{{\boldsymbol{\lambda}} ^{\text{H}}}({\boldsymbol{A\alpha}} + {\boldsymbol{\eta}} - {\boldsymbol T}{\boldsymbol{y}}){\text{\} }} \\ & \quad + \gamma /2||{\boldsymbol{A\alpha}} + {\boldsymbol{\eta }} - {\boldsymbol T}{\boldsymbol{y}}||_2^2 \\[-10pt] \end{split} (18) 其中,
{\boldsymbol{\lambda}} \in {\mathbb{C}^{NM \times {1}}} 表示拉格朗日乘子,\gamma > 0 表示二次惩罚因子,\mathbb{R}\{ \cdot \} 表示取实部操作。为避免零解,引入凸约束
\displaystyle\sum\nolimits_{m = 1}^M {{t_m}} = (\delta + {{\rm{j}}}w) ,则可将式(18)改写为\begin{split} & \mathop {\arg \min }\limits_{{\boldsymbol{\alpha}} ,{\boldsymbol{\eta}} ,{\boldsymbol{\lambda}} ,{\boldsymbol{t}}} ||{\boldsymbol{\alpha}} |{|_1} + 1/(2\rho )||{\boldsymbol{\eta}} ||_2^2 \\ & \quad- \mathbb{R}\left\{ {\beta ^ * }\left(\sum\limits_{m = 1}^M {{t_m}} - \delta - {{\rm{j}}}w\right)\right\} \\ & \quad- \mathbb{R}\left\{ {{\boldsymbol{\lambda}} ^{\text{H}}}({\boldsymbol{A\alpha}} + {\boldsymbol{\eta}} - {\boldsymbol T}{\boldsymbol{y}})\right\} + \gamma /2||{\boldsymbol{A\alpha}} + {\boldsymbol{\eta}} - {\boldsymbol T}{\boldsymbol{y}}||_2^2 \end{split} (19) 其中,
\delta \in \mathbb{R} ,w \in \mathbb{R} 为比例因子,\beta 为辅助参数,{( \cdot )^ * } 表示共轭。ADMM算法利用K次迭代交替求解以下4个子问题对式(19)进行求解[18]:
\left\{ \begin{aligned} & {{\boldsymbol{\eta}} ^{(k + 1)}} = \mathop {\arg \min }\limits_{\boldsymbol{\eta}} {\text{ }}1/(2\rho )||{\boldsymbol{\eta}} ||_2^2 + \gamma /2||{\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k)}} + {\boldsymbol{\eta }} - {{\boldsymbol T}^{(k)}}{\boldsymbol{y}} - {{\boldsymbol{\lambda}} ^{(k)}}/\gamma ||_2^2 \\ & {{\boldsymbol{\alpha}} ^{(k + 1)}} = \mathop {\arg \min }\limits_{\boldsymbol{\alpha}} {\text{ }}||{\boldsymbol{\alpha}} |{|_1} + \gamma /2||{\boldsymbol{A\alpha}} + {{\boldsymbol{\eta}} ^{(k + 1)}} - {{\boldsymbol T}^{(k)}}{\boldsymbol{y}} - {{\boldsymbol{\lambda}} ^{(k)}}/\gamma ||_2^2 \\ & {{\boldsymbol{t}}^{(k + 1)}} = \mathop {\arg \min }\limits_{\boldsymbol{t}} {\text{ }}\gamma /2||{\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} + {{\boldsymbol{\eta}} ^{(k + 1)}} - {\boldsymbol T}{\boldsymbol{y}} - {{\boldsymbol{\lambda}} ^{(k)}}/\gamma ||_2^2 - \mathbb{R}\left\{ {\beta ^ * }\left(\sum\limits_{m = 1}^M {{t_m}} - \delta - {{\rm{j}}}w\right)\right\} \\ & {{\boldsymbol{\lambda}} ^{(k + 1)}} = \mathop {\arg \min }\limits_{\boldsymbol{\lambda}} {\text{ }}\mathbb{R}\left\{ {{\boldsymbol{\lambda}} ^{\text{H}}}({\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} + {{\boldsymbol{\eta}} ^{(k + 1)}} - {{\boldsymbol T}^{(k + 1)}}{\boldsymbol{y}})\right\} \end{aligned} \right. (20) 其中,
{{\boldsymbol T}^{(k + 1)}} = {{\boldsymbol{I}}_N} \otimes {\rm{diag}}({{\boldsymbol{t}}^{(k + 1)}}) ,{{\boldsymbol{\alpha}} ^{(k + 1)}} ,{{\boldsymbol{\lambda}} ^{(k + 1)}} ,{{\boldsymbol{\eta}} ^{(k + 1)}} 和{{\boldsymbol{t}}^{(k + 1)}} 分别为{\boldsymbol{\alpha}} ,{\boldsymbol{\lambda}} ,{\boldsymbol{\eta}} 和t在第k+1次迭代时的估计,k = 0,1,\cdots,K - 1 。式(20)中4个子问题的解可表示为
\left\{ \begin{aligned} & {{\bf{X}}^{(k + 1)}}:{{\boldsymbol{\eta}} ^{(k + 1)}} = \rho \gamma /(1 + \rho \gamma )\left({{\boldsymbol{\lambda}} ^{(k)}}/\gamma - {\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k)}} + {{\boldsymbol T}^{(k)}}{\boldsymbol{y}}\right) \\ &{{\bf{O}}^{(k + 1)}}:{{\boldsymbol{\alpha}} ^{(k + 1)}} = {\text{soft}}\left({{\boldsymbol{\alpha}} ^{(k)}} + \tau {{\boldsymbol{A}}^{{\rm{H}}}}{{\boldsymbol{\eta}} ^{(k + 1)}}/(\rho \gamma ),\tau /\gamma \right) \\ & {{\bf{Z}}^{(k + 1)}}:{{\boldsymbol{t}}^{(k + 1)}} = {\left[ {({b_1} + \beta )/{a_1}, \cdots ,({b_M} + \beta )/{a_M}} \right]^{\rm{T}}} \\ & {{\bf{M}}^{(k + 1)}}:{{\boldsymbol{\lambda}} ^{(k + 1)}} = {{\boldsymbol{\lambda}} ^{(k)}} - \gamma ({\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} + {{\boldsymbol{\eta}} ^{(k + 1)}} - {{\boldsymbol T}^{(k + 1)}}{\boldsymbol{y}}) \end{aligned} \right. (21) 其中,
\tau 为{\boldsymbol{\alpha}} 的迭代步长,{\text{soft}}({\boldsymbol{x}},c) = \max \{ |{\boldsymbol{x}}| - c,0\} \cdot {\boldsymbol{x}}/|{\boldsymbol{x}}| 为软阈值算子[19],\;\; \begin{split} & {a_m} = \sum\nolimits_{n = 1}^N {|{y_{(n - 1)M + m}}{|^2}} , \\ & {b_m} = \sum\nolimits_{n = 1}^N {y_{(n - 1)M + m}^ * z_{(n - 1)M + m}^{(k)}} ,\\ & {{\boldsymbol{z}}^{(k)}} = {\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} + {{\boldsymbol{\eta}} ^{(k + 1)}} - {{\boldsymbol{\lambda}} ^{(k)}}/\gamma , \end{split} \;\; \beta = \left[\delta + {\rm{j}}w - \sum\nolimits_{m = 1}^M {({b_m}/{a_m}} )\right]/\sum\nolimits_{m = 1}^M {(1/{a_m})} 。 综上所述,利用ADMM算法对式(13)进行求解的步骤如表1所示。需要强调的是:当不存在阵列误差时,表1所示的ADMM算法同样可以对式(9)进行求解。此时,可跳过步骤4,并令
{{\boldsymbol{T}}^{(k + 1)}} = {{\boldsymbol{T}}^{(0)}} 保持不变;也可令比例因子\delta = M ,w = 0 , ADMM算法将输出阵列误差的估计{\boldsymbol{e}} \approx {{\bf{1}}_M} ,即{\nu _m} \approx {\phi _m} \approx 0 。表 1 ADMM算法Table 1. ADMM algorithm输入:A, y,迭代次数K,正则化因子 \rho ,二次惩罚因子 \gamma ,迭代步长 \tau ,比例因子 \delta 和w。 步骤1 初始化:{ {\boldsymbol{\alpha} } ^{(0)} } = { {\bf{0} }_{ {N_{{\rm{d}}} }{N_{{\rm{s}}} } } }({N_{{\rm{d}}} }{N_{{\rm{s}}} } \times 1的全0列向量),{{\boldsymbol{\lambda}} ^{(0)} } = {{\bf{0}}_{NM} }(NM \times 1的全0列向量),{{\boldsymbol{t}}^{(0)} } = {{\bf{1}}_M}(M \times 1的全1列向量),
{{\boldsymbol{T}}^{(0)} } = {{\boldsymbol{I}}_N} \otimes {\rm{diag}}({{\boldsymbol{t}}^{(0)} }),k = 0;步骤2 { {\boldsymbol{\eta} } ^{(k + 1)} } = \rho \gamma /(1 + \rho \gamma )({ {\boldsymbol{\lambda} } ^{(k)} }/\gamma - {\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k)} } + { {\boldsymbol T}^{(k)} }{\boldsymbol{y} }); 步骤3 {{\boldsymbol{\alpha}} ^{(k + 1)} } = {\text{soft} }({{\boldsymbol{\alpha}} ^{(k)} } + \tau {{\boldsymbol{A}}^{{\rm{H}}} }{{\boldsymbol{\eta}} ^{(k + 1)} }/(\rho \gamma ),\tau /\gamma ); 步骤4-1
{ {\boldsymbol{z} }^{(k)} } = {\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k + 1)} } + { {\boldsymbol{\eta} } ^{(k + 1)} } - {{\boldsymbol{\lambda}} ^{(k)} }/\gamma, {b_m} = \displaystyle\sum\nolimits_{n = 1}^N {y_{(n - 1)M + m}^ * z_{(n - 1)M + m}^{(k)} }, {a_m} = \displaystyle\sum\nolimits_{n = 1}^N {|{y_{(n - 1)M + m} }{|^2} },
\beta = \left[\delta + {\rm{j}}w - \sum\nolimits_{m = 1}^M {({b_m}/{a_m}} )\right]/\sum\nolimits_{m = 1}^M {(1/{a_m})}。步骤4-2 { {\boldsymbol{t} }^{(k + 1)} } = {\left[ {({b_1} + \beta )/{a_1},({b_2} + \beta )/{a_2}, \cdots ,({b_M} + \beta )/{a_M} } \right]^{\rm{T}}}; 步骤5 { {\boldsymbol{\lambda} } ^{(k + 1)} } = { {\boldsymbol{\lambda} } ^{(k)} } - \gamma ({\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k + 1)} } + {{\boldsymbol{\eta}} ^{(k + 1)} } - { {\boldsymbol T}^{(k + 1)} }{\boldsymbol{y} }); 步骤6 令 k \leftarrow k + 1 ,若k \le K - 1,则返回步骤2,否则结束。 输出: {\boldsymbol{\alpha}} = {{\boldsymbol{\alpha}} ^K}, {e_m} = 1/t_m^K , {\boldsymbol{e} } = {[{e_1},{e_2}, \cdots ,{e_M}]^{\rm{T} } }。 ADMM属于模型驱动类算法,其正则化因子
\rho 、二次惩罚因子\gamma 、迭代步长\tau 、比例因子\delta 和w等参数均需提前给定。在实际应用中,参数的设置是比较困难的。不恰当的参数设置会影响ADMM算法的收敛速度和精度,从而使式(13)的求解复杂度升高、杂波空时谱和阵列误差参数的估计准确性下降。即使能够通过理论分析、交叉验证的方法选择合适的参数,固定的参数设置并不能保证ADMM算法获得最好的收敛效果。为解决上述问题,基于DU方法的思路,本文将ADMM算法展开为深度神经网络AE-ADMM-Net,利用学习的方法获得其最优迭代参数。为构建AE-ADMM-Net,将ADMM算法的迭代步骤映射为一个数据流图,如图2所示。图2所示数据流图主要由ADMM算法所对应的不同图节点和不同图节点之间表示数据流动的有向边组成。数据流图的第k+1层表示ADMM算法的第k+1次迭代,表1的迭代步骤2—步骤5对应4个图节点:辅助变量更新节点(
{{\bf{X}}^{(k + 1)}} )、杂波空时谱更新节点({{\bf{O}}^{(k + 1)}} )、误差参数更新节点({{\bf{Z}}^{(k + 1)}} )和拉格朗日乘子更新节点({{\bf{M}}^{(k + 1)}} )。可以看出:ADMM算法的K次迭代可以映射为一个K层的数据流图,输入的空时回波信号沿此数据流图进行传递,将获得杂波空时谱和阵列幅相误差的估计结果。3.2 AE-ADMM-Net
对于式(13)所示的优化问题,当机载雷达参数给定且杂波复幅度、阵列误差和噪声均服从一定分布时,训练距离单元的空时回波信号
{{\boldsymbol{y}}_l} 也将具有一定分布。此外,给定空时导向矢量字典A,杂波空时谱{{\boldsymbol{\alpha}} _l} 也将具有一定稀疏分布。此时,可假设存在一组最优的参数序列,使得对于所有服从一定分布的空时回波信号、杂波空时谱和阵列误差,ADMM算法均能够快速准确地求解式(13)。因此,为解决ADMM算法存在的问题,结合模型驱动算法的可解释性和数据驱动深度学习方法的非线性拟合能力,本节基于ADMM算法的迭代步骤和数据流图,构建AE-ADMM-Net,将其用于求解式(13)。基于充足完备的训练数据集对AE-ADMM-Net进行训练,能够获得最优的迭代参数,从而提高杂波空时谱和阵列误差参数的估计速度和性能。下面对AE-ADMM-Net的网络结构、数据集构建方法、网络初始化与训练进行具体描述。3.2.1 网络结构
根据表1所示的算法步骤和图2所示的数据流图,可将ADMM算法等效为一个如图3所示的K层网络AE-ADMM-Net,其输入为y, A,
{{\boldsymbol{\alpha}} ^{(0)}} ,{{\boldsymbol{\lambda}} ^{(0)}} 和{{\boldsymbol{t}}^{(0)}} ,可学习参数为{\boldsymbol{\varTheta}} = \{ {{\boldsymbol{\varTheta}} ^{(k + 1)}}\} _{k = 0}^{K - 1} = \{ {\rho _{k + 1}}, {\gamma _{k + 1}}, {\tau _{k + 1}},{\delta _{k{\text{ + }}1}},{\omega _{k + 1}} ,{\varsigma _{k + 1}}\} _{k = 0}^{K - 1} ,输出为{{\boldsymbol{\alpha}} ^{(K)}} 和{{\boldsymbol{t}}^{(K)}} ,从而可得杂波空时谱{\boldsymbol{\alpha}} = {{\boldsymbol{\alpha}} ^K} 和阵列误差{e_m} = 1/t_m^K ,{\boldsymbol{e}} = {[{e_1},{e_2}, \cdots ,{e_M}]^{\rm{T}}} 。其中,AE-ADMM-Net的第k+1层运算可表示为\begin{split} & \left\{ {{\boldsymbol{\alpha}} ^{(k + 1)}},{{\boldsymbol{\lambda}} ^{(k + 1)}},{{\boldsymbol{t}}^{(k + 1)}}\right\} \\ & \quad= {F_{k + 1}}\left\{ {\boldsymbol{y}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(k)}},{{\boldsymbol{\lambda}} ^{(k)}},{{\boldsymbol{t}}^{(k)}},{{\boldsymbol{\varTheta}} ^{(k + 1)}}\right\} \end{split} (22) 其中,
{F_{k + 1}}\{ \cdot \} 对应一个4层子网络,包括辅助变量更新层({{\bf{X}}^{(k + 1)}} )、杂波空时谱更新层({{\bf{O}}^{(k + 1)}} )、误差参数更新层({{\bf{Z}}^{(k + 1)}} )和拉格朗日乘子更新层({{\bf{M}}^{(k + 1)}} ),如图4所示,其中实箭头表示正向传播的方向,虚线箭头表示反向传播的方向,具体描述如下:(1) 辅助变量更新层(
{{\bf{X}}^{(k + 1)}} ):将y, A以及AE-ADMM-Net第k层中{{\bf{O}}^{(k)}} ,{{\bf{Z}}^{(k)}} 和{{\bf{M}}^{(k)}} 的输出{{\boldsymbol{\alpha}} ^{(k)}} ,{{\boldsymbol{t}}^{(k)}} 和{{\boldsymbol{\lambda}} ^{(k)}} 作为其输入,则{{\bf{X}}^{(k + 1)}} 的输出为\begin{split} {{\boldsymbol{\eta}} ^{(k + 1)}} =& {\rho _{k + 1}}{\gamma _{k + 1}}/(1 + {\rho _{k + 1}}{\gamma _{k + 1}})\left[{{\boldsymbol{\lambda}} ^{(k)}}/{\gamma _{k + 1}} - {\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k)}} \right.\\ & \left.+ \left({{\boldsymbol{I}}_N} \otimes {\rm{diag}}\left({{\boldsymbol{t}}^{(k)}}\right)\right){\boldsymbol{y}}\right] \\[-15pt] \end{split} (23) 其中,
{\rho _{k + 1}} 和{\gamma _{k + 1}} 为第k+1层可学习的正则化因子和二次惩罚因子。{{\bf{X}}^{(k + 1)}} 的输出{\boldsymbol{\eta}} _{}^{(k + 1)} 将作为第k+1层中{{\bf{O}}^{(k + 1)}} ,{{\bf{Z}}^{(k + 1)}} ,{{\bf{M}}^{(k + 1)}} 的输入。(2) 杂波空时谱更新层(
{{\bf{O}}^{(k + 1)}} ):将A以及AE-ADMM-Net第k层中{{\bf{O}}^{(k)}} 的输出{{\boldsymbol{\alpha}} ^{(k)}} 和第k+1层中{{\bf{X}}^{(k + 1)}} 的输出{{\boldsymbol{\eta}} ^{(k + 1)}} 作为其输入,则{{\bf{O}}^{(k + 1)}} 的输出为\begin{split} {{\boldsymbol{\alpha}} ^{(k + 1)}} =& {\text{soft}}\Bigr({{\boldsymbol{\alpha}} ^{(k)}} + {\tau _{k + 1}}{{\boldsymbol{A}}^{{\rm{H}}}}{{\boldsymbol{\eta}} ^{(k + 1)}}/({\rho _{k + 1}}{\gamma _{k + 1}}),\\ & {\tau _{k + 1}}/{\gamma _{k + 1}}\Bigr)\\[-10pt] \end{split} (24) 其中,
{\tau _{k + 1}} 为第k+1层可学习的迭代步长。{{\bf{O}}^{(k + 1)}} 的输出{{\boldsymbol{\alpha}} ^{(k + 1)}} 将作为第k+1层中{{\bf{M}}^{(k + 1)}} 和{{\bf{Z}}^{(k + 1)}} 以及第k+2层中{{\bf{X}}^{(k + 2)}} 和{{\bf{O}}^{(k + 2)}} 的输入。(3) 误差参数更新层(
{{\bf{Z}}^{(k + 1)}} ):将y,A,AE-ADMM-Net第k层中{{\bf{M}}^{(k)}} 的输出{{\boldsymbol{\lambda}} ^{(k)}} , AE-ADMM-Net第k+1层中{{\bf{X}}^{(k + 1)}} 和{{\bf{O}}^{(k + 1)}} 的输出{{\boldsymbol{\eta}} ^{(k + 1)}} 和{{\boldsymbol{\alpha}} ^{(k + 1)}} 作为其输入,则{{\bf{Z}}^{(k + 1)}} 的输出为{{\boldsymbol{t}}^{(k + 1)}} = {\left[ {({b_1} + \beta )/{a_1},({b_2} + \beta )/{a_2}, \cdots ,({b_M} + \beta )/{a_M}} \right]^{\rm{T}}} (25) 其中,
{{\boldsymbol{z}}^{(k)}} \;=\; {\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} \;+\; {{\boldsymbol{\eta}} ^{(k + 1)}} \;-\; {{\boldsymbol{\lambda}} ^{(k)}}/{\gamma _{k + 1}} ,{b_m} = \displaystyle\sum\nolimits_{n = 1}^N {y_{(n - 1)M + m}^ * z_{(n - 1)M + m}^{(k)}} ,{a_m} = \displaystyle\sum\nolimits_{n = 1}^N {|{y_{(n - 1)M + m}}{|^2}} ,\beta = [{\delta _{k + 1}} + {{\rm{j}}}{w_{k + 1}} - \displaystyle\sum\nolimits_{m = 1}^M {({b_m}/{a_m}} )]/ \displaystyle\sum\nolimits_{m = 1}^M {(1/{a_m})} ,{\delta _{k + 1}} 和{w_{k + 1}} 为第k+1层可学习的比例因子。{{\bf{Z}}^{(k + 1)}} 的输出{{\boldsymbol{t}}^{(k + 1)}} 将作为第k+1层中{{\bf{M}}^{(k + 1)}} 以及第k+2层中{{\bf{X}}^{(k + 2)}} 的输入。(4) 拉格朗日乘子更新层(
{{\bf{M}}^{(k + 1)}} ):将y, A, AE-ADMM-Net第k层中{{\bf{M}}^{(k)}} 的输出{{\boldsymbol{\lambda}} ^{(k)}} , AE-ADMM-Net第k+1层中{{\bf{X}}^{(k + 1)}} ,{{\bf{O}}^{(k + 1)}} 和{{\bf{Z}}^{(k + 1)}} 的输出{{\boldsymbol{\eta}} ^{(k + 1)}} ,{{\boldsymbol{\alpha}} ^{(k + 1)}} 和{{\boldsymbol{t}}^{(k + 1)}} 作为其输入,则{{\bf{M}}^{(k + 1)}} 的输出为\begin{split} {{\boldsymbol{\lambda}} ^{(k + 1)}} =& {{\boldsymbol{\lambda}} ^{(k)}} - {\varsigma _{k + 1}} \left[{\boldsymbol{A}}{{\boldsymbol{\alpha}} ^{(k + 1)}} + {{\boldsymbol{\eta}} ^{(k + 1)}}\right. \\ & \left.- ({{\boldsymbol{I}}_N} \otimes {\rm{diag}}({{\boldsymbol{t}}^{(k + 1)}})){\boldsymbol{y}}\right] \end{split} (26) 其中,
{\varsigma _{k + 1}} 为第k+1层可学习的乘子更新参数。{{\bf{M}}^{(k + 1)}} 的输出{{\boldsymbol{\lambda}} ^{(k + 1)}} 将作为第k+2层中{{\bf{M}}^{(k + 2)}} ,{{\bf{X}}^{(k + 2)}} 和{{\boldsymbol{Z}}^{(k + 2)}} 的输入。需要强调的是:相比利用{\gamma _{k + 1}} 作为乘子更新参数(如式(21)所示),添加新参数{\varsigma _{k + 1}} 是为了进一步增强网络的学习能力,提高AE-ADMM-Net的性能。3.2.2 数据集构建方法
与现有DU方法相同,本文AE-ADMM-Net是一种“模型+数据”联合驱动的SR方法,合理构建具有泛化能力的数据集是决定其有效性的关键。此外,DU方法大多采用监督学习的方式,按照提前给定的数据及其标签对网络进行训练。为了使空时回波信号、杂波空时谱和阵列幅相误差均具有一定的分布,本文构建数据集的方式可以概括为“设定雷达参数、设定杂波分布、设定阵列幅相误差分布、生成空时回波信号、划分训练与测试数据集、构造空时导向矢量字典、获得训练和测试标签集”,具体描述如下:
步骤1 对于机载雷达正侧视均匀线阵,设定载机高度H、载机速度v、阵元数M、脉冲数N、阵元间距d、波长
\lambda 、脉冲重复频率fr和距离范围[Rmin, Rmax]等参数;步骤2 根据雷达距离分辨率将距离范围划分为L个距离单元,将每个距离单元所对应的距离环在方位角
\theta \in [0,\pi ] 上划分为Nc个杂波块,杂波块之间相互独立且幅度服从复高斯分布;步骤3 令阵元幅度误差
{\nu_m} 和相位误差{\phi _m} 分别服从[ - {\nu_{\max }},{\nu_{\max }}] 和[ - {\phi _{\max }},{\phi _{\max }}] 上的均匀分布,随机产生P个阵元误差矢量\{ {{\boldsymbol{e}}_p}\} _{p = 1}^P ,其中{{\boldsymbol{e}}_p} = [{{e}}_1^p,e_2^p, \cdots , e_M^p]^{\rm{T}} ,e_m^p = (1 + \nu _m^p){{{\rm{e}}}^{{{\rm{j}}}\phi _m^p}} ,\nu _m^p \in U( - {\nu_{\max }},{\nu_{\max }}) ,\phi _m^p \in U( - {\phi _{\max }},{\phi _{\max }}) ,{{\nu}_{\max }} 和{\phi _{\max }} 分别表示幅度误差和相位误差的最大值;步骤4 对于每个阵元误差矢量
{{\boldsymbol{e}}_p} ,根据{{\boldsymbol{y}}_{l,p}} = \displaystyle\sum\nolimits_{i = 1}^{{N_{{\rm{c}}}}} {{\alpha _{l,i}}{\boldsymbol{s}}_{l,i}^{{\rm{d}}} \otimes ({{\boldsymbol{e}}_p} \odot {\boldsymbol{s}}_{l,i}^{{\rm{s}}})} + {{\boldsymbol{\varepsilon}} _l} 产生L个空时回波信号\{ {{\boldsymbol{y}}_{l,p}}\} _{l = 1}^L ,其中,{\boldsymbol{s}}_{l,i}^{{\rm{d}}} 和{\boldsymbol{s}}_{l,i}^{{\rm{s}}} 分别为第l个距离单元上第i个杂波块的时域导向矢量和空域导向矢量,对应的复幅度为{\alpha _{l,i}} ,{{\boldsymbol{\varepsilon}} _l} 为复高斯白噪声,杂噪比为CNR;步骤5 将
PL 个空时回波信号\{ \{ {\boldsymbol{{y}}_{l,p}}\} _{l = 1}^L{\text{\} }}_{p = 1}^P 随机划分为包含O个空时回波信号的训练数据集\{ {\boldsymbol{y}}_o^{{{\rm{train}}}}\} _{o = 1}^O 和包含S = (PL - O) 个空时回波信号的测试数据集\{ {\boldsymbol{y}}_s^{{{\rm{test}}}}\} _{s = 1}^S ;步骤6 设定空间频率和多普勒频率范围
[f_{\min }^{{\rm{s}}}, f_{\max }^{{\rm{s}}}] 和[f_{\min }^{{\rm{d}}},f_{\max }^{{\rm{d}}}] 、网格数{N_{{\rm{s}}}} = {\kappa _{{\rm{s}}}}M 和{N_{{\rm{d}}}} = {\kappa _{{\rm{d}}}}N ,构造空时导向矢量字典{\boldsymbol{A}} = [{\boldsymbol{s}}_1^{{{\rm{ds}}}},{\boldsymbol{s}}_2^{{{\rm{ds}}}}, \cdots ,{\boldsymbol{s}}_{{N_{\rm{s}}}{N_{\rm{d}}}}^{{{\rm{ds}}}}] ;步骤7 通过理论分析和交叉验证的方式设置ADMM算法参数
\rho = {\rho _0} ,\gamma = {\gamma _0} ,\tau = {\tau _0} ,\delta = {\delta _0} ,\omega = {\omega _0} 和K = {K_0} ,对式(13)进行求解,获得训练标签集\{ {\boldsymbol{\alpha}} _o^{{{\rm{train}}}},{\boldsymbol{e}}_o^{{{\rm{train}}}}\} _{o = 1}^O 和测试标签集\{ {\boldsymbol{\alpha}} _s^{{{\rm{test}}}},{\boldsymbol{e}}_s^{{{\rm{test}}}}\} _{s = 1}^S 。具体步骤为:基于理论分析,得到算法收敛时\rho ,\gamma 和\tau 需满足的条件[26,27];在满足收敛条件的数值范围内,设置多组不同的\rho ,\gamma 和\tau ;由于假设实际阵列误差服从均匀分布,设置\delta = M ,\omega = 0 不变;基于不同的参数组合对空时回波信号进行处理,终止迭代的条件设为第K次迭代结果相对第K–1次迭代结果的归一化误差小于10–6;得到对于所有空时回波信号杂波空时谱估计均较为准确、杂波抑制性能均较优的一组参数{\rho _0} ,{\gamma _0} ,{\tau _0} ,{\delta _0} ,{\omega _0} 和{K_0} ,作为ADMM算法的参数,并获得其对应的训练和测试标签集。3.2.3 初始化与训练
网络的初始化和训练方法对AE-ADMM-Net的性能具有一定的影响,较好的初始化和训练方法能够使网络更容易达到收敛,在一定程度上避免陷入局部最优。AE-ADMM-Net的参数可根据3.2.2节中的步骤(7)进行初始化,即令
{\rho _{1:K}} = {\rho _0} ,{\gamma _{1:K}} = {\gamma _0} ,{\tau _{1:K}} = {\tau _0} ,{\delta _{1:K}} = {\delta _0} ,{\omega _{1:K}} = {\omega _0} 和{\varsigma _{1:K}} = {\gamma _0} 。与采用固定参数设置的ADMM算法相比,AE-ADMM-Net经过训练后将在保证收敛性能的基础上,大幅提高收敛速度(即减少迭代次数),缩短求解式(13)的时间。基于所构建的训练数据集
\{ {\boldsymbol{\alpha}} _o^{{{\rm{train}}}},{\boldsymbol{e}}_o^{{{\rm{train}}}}, {\boldsymbol{y}}_o^{{{\rm{train}}}}\} _{o = 1}^O ,给定网络层数K,定义归一化均方根误差(Normalized Mean Square Error, NMSE)作为网络损失函数,则AE-ADMM-Net的最优参数{{\boldsymbol{\varTheta}} ^ * } = \{ \rho _{k + 1}^ * ,\gamma _{k + 1}^ * , \tau _{k + 1}^ * ,\delta _{k + 1}^ * ,\omega _{k + 1}^ * ,\varsigma _{k + 1}^ * \} _{k = 0}^{K - 1} 可通过后向传播(Back Propagation, BP)方法[28]求解下式得到:{{\boldsymbol{\varTheta}} ^ * } = \arg \mathop {\min }\limits_{\boldsymbol{\varTheta}} \frac{1}{O}\sum\limits_{o = 1}^O {0.5L_{\boldsymbol{\alpha}} ^o + 0.5L_{\boldsymbol{e}}^o} (27) 其中
\left\{ \begin{aligned} & L_{\boldsymbol{\alpha}} ^o = {\text{|}}|{{\boldsymbol{\alpha}} ^{(K)}}({\boldsymbol{\varTheta}} ,{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{\boldsymbol{y}}_o^{{{\rm{train}}}}) - {\boldsymbol{\alpha}} _o^{{{\rm{train}}}}||_2^2/{\text{|}}|{\boldsymbol{\alpha}} _o^{{{\rm{train}}}}||_2^2 \\ & L_{\boldsymbol{e}}^o = {\text{|}}|{{\boldsymbol{e}}^{(K)}}({\boldsymbol{\varTheta}} ,{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{\boldsymbol{y}}_o^{{{\rm{train}}}}) - {\boldsymbol{e}}_o^{{{\rm{train}}}}||_2^2/{\text{|}}|{\boldsymbol{e}}_o^{{{\rm{train}}}}||_2^2 \\ \end{aligned} \right. (28) {{\boldsymbol{\alpha}} ^{(K)}}({\boldsymbol{y}}_o^{{{\rm{train}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{\boldsymbol{\varTheta}} ) 表示以{\boldsymbol{y}}_o^{{{\rm{train}}}} , A,{{\boldsymbol{\alpha}} ^{(0)}} = {{\bf{0}}_{{N_{{\rm{d}}}}{N_{{\rm{s}}}}}} ,{{\boldsymbol{\lambda}} ^{(0)}} = {{\bf{0}}_{NM}} 和{{\boldsymbol{t}}^{(0)}} = {{\bf{1}}_M} 为输入、以{\boldsymbol{\varTheta}} 为参数的AE-ADMM-Net第K层中杂波空时谱更新层的输出,{{\boldsymbol{e}}^{(K)}}({\boldsymbol{\varTheta}} ,{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{\boldsymbol{y}}_o^{{{\rm{train}}}}) 对应第K层中误差参数更新层的输出{{\boldsymbol{t}}^{(K)}}({\boldsymbol{\varTheta}} ,{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}}, {{\boldsymbol{\lambda}} ^{(0)}}, {\boldsymbol{y}}_o^{{{\rm{train}}}}) ,满足{{\boldsymbol{e}}^{(K)}} = [e_1^{(K)},e_2^{(K)},\cdots,e_M^{(K)}] ,e_m^{(K)} = 1/t_m^{(K)} 。经过训练得到最优参数后,即可将AE-ADMM-Net应用于实际训练距离单元空时回波信号的处理。对于测试数据
\{ {\boldsymbol{y}}_s^{{\text{test}}}\} _{s = 1}^S ,其杂波空时谱和阵列误差参数的估计可以表示为\left\{ \begin{gathered} \hat {\boldsymbol{\alpha}} _s^{{{\rm{test}}}} = {{\boldsymbol{\alpha}} ^{(K)}}({\boldsymbol{y}}_s^{{{\rm{test}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{{\boldsymbol{\varTheta}} ^ * }) \\ \hat {\boldsymbol{e}}_s^{{{\rm{test}}}} = {{\boldsymbol{e}}^{(K)}}({\boldsymbol{y}}_s^{{{\rm{test}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{{\boldsymbol{\varTheta}} ^ * }) \\ \end{gathered} \right. (29) 其中,
{{\boldsymbol{\alpha}} ^{(K)}}({\boldsymbol{y}}_s^{{{\rm{test}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{{\boldsymbol{\varTheta}} ^ * }) 表示以{\boldsymbol{y}}_s^{{{\rm{test}}}} , A,{{\boldsymbol{\alpha}} ^{(0)}} = {{\bf{0}}_{{N_{\rm{d}}}{N_{\rm{s}}}}} ,{{\boldsymbol{\lambda}} ^{(0)}} = {{\bf{0}}_{NM}} 和{{\boldsymbol{t}}^{(0)}} = {{\bf{1}}_M} 为输入、以{{\boldsymbol{\varTheta}} ^ * } 为参数的AE-ADMM-Net第K层中杂波空时谱更新层,{{\boldsymbol{e}}^{(K)}}({\boldsymbol{y}}_s^{{{\rm{test}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}},{{\boldsymbol{\varTheta}} ^ * }) 对应第K层中误差参数更新层的输出{{\boldsymbol{t}}^{(K)}}({\boldsymbol{y}}_s^{{{\rm{test}}}},{\boldsymbol{A}},{{\boldsymbol{\alpha}} ^{(0)}},{{\boldsymbol{t}}^{(0)}},{{\boldsymbol{\lambda}} ^{(0)}}, {{\boldsymbol{\varTheta}} ^ * }) 。4. 仿真实验
本节通过仿真对基于AE-ADMM-Net的DU-STAP方法进行验证,并与基于SBL,FOCUSS和ADMM等算法的典型SR-STAP方法进行对比分析,仿真参数如表2所示。所有仿真均基于MATLAB R2020b实现,系统配置为Intel(R) Core(TM) i9-10900K CPU @ 3.70 GHz和NVIDIA GeForce RTX 2080 Ti GPU。
表 2 仿真参数Table 2. Simulation parameters参数 数值 参数 数值 载机高度H 3000 m 载机速度v 100 ms–1 阵元数M 10 个 脉冲数N 10 个 阵元间距d 0.1 m 工作波长λ 0.2 m 脉冲重复频率fr 2000 Hz 距离范围[Rmin, Rmax] [21,31] km 距离单元数L 100 个 杂波块数Nc 361 个 阵元误差数P 100 个 杂噪比CNR 60 dB 训练数据集大小O 7500 测试数据集大小S 2500 频率范围f s和f d [–0.5,0.5] 网格数Ns和Nd 50 个 为验证所提方法在不同阵列误差条件下的性能,令阵列幅相误差的最大值
({\nu_{\max }},{\phi _{\max }}) 分别等于(0,{0^\circ }) ,(0.1,{10^\circ }) ,(0.2,{20^\circ }) 和(0.3,{30^\circ }) ,按照3.2.2节步骤(1)—步骤(5)所述方法构建4组不同的数据集。然后,设置ADMM算法的迭代参数为{\rho _0} = 0.5 ,{\gamma _0} = 0.01 ,{\tau _0} = 0.04 ,{\delta _0} = M ,{\omega _0} = 0 和{K_0} = 3000 ,按照3.2.2节步骤(6)—步骤(7)所述方法构建标签集。图5给出了不同阵列误差条件下,利用ADMM算法对某一数据进行处理得到的杂波空时谱和阵列误差参数估计,其从左到右分别对应({\nu_{\max }},{\phi _{\max }}) 等于(0,{0^\circ }) ,(0.1,{10^\circ }) ,(0.2,{20^\circ }) 和(0.3,{30^\circ }) 的情况,从上到下分别为杂波空时谱、阵列幅度误差和阵列相位误差的估计。可以看出,基于上述固定参数,ADMM算法在不同条件下均能获得较为准确的估计结果,因此可利用所构建的数据集对AE-ADMM-Net进行训练。图 5 固定参数ADMM算法杂波空时谱和阵列误差参数估计结果(a1—a4:不同阵列误差参数下的空时谱估计结果,b1—b4:不同阵列误差参数下的幅度误差估计结果,c1—c4:不同阵列误差参数下的相位误差估计结果)Figure 5. Clutter space-time spectra and array error parameters estimated via ADMM algorithm with fixed parameters (a1—a4: Clutter space-time spectra estimation results in different array error parameters, b1—b4: Amplitude error estimation results in different array error parameters, c1—c4: Phase error estimation results in different array error parameters)4.1 网络收敛性
本节验证AE-ADMM-Net的收敛性,并与固定迭代参数的ADMM算法进行对比分析。设置不同的网络层数K,按照3.2.3节所述方法对AE-ADMM-Net进行初始化和训练(Adam算法,迭代次数为3000),所得结果如图6所示。其中,图6(a),图6(b)为AE-ADMM-Net在网络层数K=25时的训练NMSE和测试NMSE,图6(c)为AE-ADMM-Net和ADMM算法在网络层数(迭代次数)K=15~45时的NMSE,图6(d)为ADMM算法在迭代次数K=60~180时的NMSE。从图6(a),图6(b)可以看出,无论是否存在阵列误差,AE-ADMM-Net的训练和测试NMSE均随着训练次数的增加而逐渐下降,且在训练1500次后基本达到收敛。从图6(c)可以看出,随着网络层数(迭代次数)的增加,AE-ADMM-Net和ADMM算法的NMSE均逐渐下降,但前者的NMSM远小于后者。从图6(c),图6(d)可以看出,当ADMM算法的迭代次数为AE-ADMM-Net的4倍时,两者才具有相近的NMSE。因此,可以得出结论:无论是否存在阵列误差,AE-ADMM-Net均能够从所构建的数据集中学习得到最优迭代参数,获得更好的收敛性能。需要说明的是:当网络层数达到一定数值(35~40)时,AE-ADMM-Net就可以获得比较准确的杂波空时谱估计结果,进一步增加网络层数并不能显著提高杂波抑制性能,反而会增加运算复杂度。因此,在实际应用中,可基于不同的仿真条件对AE-ADMM-Net进行离线训练,确定可获得较好杂波抑制性能和较低运算复杂度的网络层数取值范围,再根据实际情况进行选择。
4.2 杂波空时谱
本节验证AE-ADMM-Net的杂波空时谱估计性能,并与FOCUSS算法、SBL算法和固定迭代参数的ADMM算法进行对比分析。图7给出了不同阵列误差条件下,利用不同算法对图5所对应的数据进行处理获得的杂波空时谱估计结果,其从左到右分别对应
({\nu_{\max }},{\phi _{\max }}) 等于(0,{0^\circ }) ,(0.1,{10^\circ }) ,(0.2,{20^\circ }) 和(0.3,{30^\circ }) 的情况,从上到下分别对应迭代25次的ADMM算法、迭代45次的ADMM算法、迭代200次的FOCUSS算法(正则化参数设为10–3)、迭代400次的SBL算法(噪声功率初始值设为10–6)、层数为25的AE-ADMM-Net和层数为45的AE-ADMM-Net。可以看出:(1)与图5相比,固定迭代参数的ADMM算法在迭代次数较少时难以获得准确的杂波空时谱估计;(2)在不存在阵列误差时,SBL算法和FOCUSS算法均能够获得杂波空时谱的准确估计,但存在阵列误差时估计性能急剧下降;(3)无论是否存在阵列误差,AE-ADMM-Net均能够基于少量网络层数(迭代次数),实现对杂波空时谱的准确估计。因此,可以得出结论:相比典型的SR算法,AE-ADMM-Net在不同条件下均能快速获得杂波空时谱的准确估计。图 7 不同条件下不同算法的杂波空时谱估计结果(a1—a4:ADMM算法在不同阵列误差参数下的迭代25次的估计结果,b1—b4:ADMM算法在不同阵列误差参数下的迭代45次的估计结果,c1—c4:FOCUSS算法在不同阵列误差参数下的迭代200次的估计结果,d1—d4:SBL算法在不同阵列误差参数下的迭代400次的估计结果,e1—e4:25层的AE-ADMM-Net 在不同阵列误差参数下的的估计结果,f1—f4:45层的AE-ADMM-Net 在不同阵列误差参数下的估计结果)Figure 7. Clutter space-time spectra estimated via different algorithms under different conditions (a1—a4: estimation results of ADMM algorithm with 25 iterations in different array error parameters, b1—b4: estimation results of ADMM algorithm with 45 iterations in different array error parameters, c1—c4: estimation results of FOCUSS algorithm with 200 iterations in different array error parameters, d1—d4: estimation results of SBL algorithm with 400 iterations in different array error parameters, e1—e4: estimation results of AE-ADMM-Net with 25 layers in different array error parameters, f1—f4: estimation results of AE-ADMM-Net with 45 layers in different array error parameters)4.3 阵列误差参数
本节验证AE-ADMM-Net的阵列误差参数估计性能,结果如图8所示。图8从左到右分别对应
({\nu_{\max }},{\phi _{\max }}) 等于(0,{0^\circ }) ,(0.1,{10^\circ }) ,(0.2,{20^\circ }) 和(0.3,{30^\circ }) 的情况,上图和下图分别为幅度误差和相位误差估计结果。可以看出:在不同条件下,AE-ADMM-Net均能获得阵列幅度误差和相位误差的准确估计。图 8 不同条件下AE-ADMM-Net的阵列误差参数估计结果(a1—a4:不同阵列误差参数下的幅度误差估计结果,b1—b4:不同阵列误差参数下的相位误差估计结果)Figure 8. Array error parameters estimated by AE-ADMM-Net under different conditions (a1—a4: Amplitude error estimation results in different array error parameters, b1—b4: Phase error estimation results in different array error parameters)4.4 SCNR损失
本节验证基于AE-ADMM-Net的DU-STAP方法的杂波抑制性能,并与基于FOCUSS算法、SBL算法和固定迭代参数ADMM算法的SR-STAP方法进行对比分析。需要说明的是:由于SBL算法和FOCUSS算法无法有效估计阵列误差参数,因此在进行性能对比分析时,不考虑阵列误差参数,仅对不同算法得到的杂波空时谱进行处理,即基于式(11)估计CNCM
{\hat {\boldsymbol{R}}_{{\rm{C}}}} 、基于式(3)计算空时滤波器最优权值{{\boldsymbol{w}}_{{{\rm{opt}}}}} 。然后,利用SCNR损失衡量不同方法的杂波抑制性能,表示为{{{\rm{SCNR}}}_{{{\rm{Loss}}}}} = \frac{{{\sigma ^2}|{\boldsymbol{w}}_{{{\rm{opt}}}}^{{\rm{H}}}{\boldsymbol{s}}_{{\rm{T}}}^{{{\rm{ds}}}}{|^2}}}{{NM{\text{ }}{\boldsymbol{w}}_{{{\rm{opt}}}}^{{\rm{H}}}{{\hat {\boldsymbol{R}}}_{{\rm{C}}}}{{\boldsymbol{w}}_{{{\rm{opt}}}}}}} (30) 假设目标的空间频率为0(即
{\boldsymbol{s}}_{\rm{T}}^{\rm{s}} = {{\bf{1}}_M} )、归一化多普勒频率在[–0.5,0.5]范围内变化,不同方法对应的SCNR损失曲线如图9所示,其从左到右分别对应({\nu_{\max }},{\phi _{\max }}) 等于(0,{0^\circ }) ,(0.1,{10^\circ }) ,(0.2,{20^\circ }) 和(0.3,{30^\circ }) 的情况,下图对应上图的局部放大结果。可以看出:(1)基于FOCUSS和SBL算法的SR-STAP方法仅在无阵列误差时有效,在存在阵列误差时杂波抑制性能急剧下降;(2)基于固定迭代参数ADMM算法的SR-STAP方法在迭代次数较多的条件下(ADMM-opt, K = 3000)能够有效抑制杂波,但在迭代次数较少的条件下(K = 25和45),由于杂波空时谱估计不准确,其杂波抑制性能较差;(3)基于AE-ADMM-Net的DU-STAP方法基于少量网络层数(迭代次数)即可获得杂波空时谱的准确估计,实现对杂波的有效抑制,网络层数为K=45时的性能与ADMM-opt相当。因此,可以得出结论:相比典型的SR-STAP方法,DU-STAP方法在不同条件下均能获得较好的杂波抑制性能。图 9 不同条件下不同方法对应的SCNR损失曲线(a1—a4:不同阵列误差参数下的SCNR曲线结果,b1—b4:不同阵列误差参数下的SCNR曲线局部放大结果)Figure 9. SCNR loss curves corresponding to different methods under different conditions (a1—a4: SCNR loss curves results in different array error parameters, b1—b4: SCNR loss curves results with enlarged scale in different array error parameters)4.5 运算复杂度
本节分析AE-ADMM-Net的运算复杂度,并与FOCUSS算法和SBL算法进行对比。需要强调的是:由于可以采用离线训练、在线应用的方法[25,29],本文对AE-ADMM-Net的运算复杂度分析不包括网络训练所需的运算量。此外,在进行训练获得最优参数后,AE-ADMM-Net与ADMM算法的运算完全相同,仅在迭代参数上具有差异。因此,在网络层数(迭代次数)相同的条件下,AE-ADMM-Net与ADMM算法在应用时将具有相同的运算复杂度。以乘法次数为指标,可得不同算法进行一次迭代所需的运算复杂度如表3所示。可以看出,AE-ADMM-Net的运算复杂度远小于FOCUSS算法和SBL算法。为了对此进行验证,基于MATLAB的TIC和TOC命令获得不同条件下AE-ADMM-Net, FOCUSS和SBL算法的运行时间如图10所示。其中,图10(a)对应M=N=10、Nd=Ns=50、迭代次数K=15~45;图10(b)对应M=N=4~16、Nd=Ns=50、迭代次数K=45;图10(c)对应M=N=10、Nd=Ns=20~80、迭代次数K=45;图10(d)对应M=N=Nd/5=Ns/5=4~16、迭代次数K=45。可以看出:在不同条件下,AE-ADMM-Net的运行时间均远小于FOCUSS算法和SBL算法。此外,需要指出的是:与ADMM算法相似,参数固定的FOCUSS算法和SBL算法通常也需要相比AE-ADMM-Net更多的迭代次数以达到收敛。因此,可以得出结论:相比基于FOCUSS和SBL算法的SR-STAP算法,基于AE-ADMM-Net的DU-STAP方法具有更低的运算复杂度。
表 3 不同算法的运算复杂度Table 3. Computational complexities of different algorithms算法 运算复杂度 FOCUSS O\left( {3NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^3} + 2{ {(NM)}^2}{N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) SBL O\left( {5NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^3} + 2{ {(NM)}^2}{N_{{\rm{s}}} }{N_{{\rm{d}}} } + NM + {N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) AE-ADMM-Net O\left( {2NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^2} + 2NM + {N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) 4.6 实测数据处理
本节基于Mountain Top实测数据[16]对所提DU-STAP方法的实际性能进行验证,并与基于固定迭代参数ADMM算法的SR-STAP方法进行对比分析,其中ADMM算法的参数设置与仿真实验一致,DU-STAP方法直接采用由仿真数据训练得到的AE-ADMM-Net。Mountain Top数据的阵元数为14、脉冲数为16,目标位于第147个距离单元,为与仿真相匹配,取10个阵元和10个脉冲所对应的数据进行处理。假设不存在阵元误差并设保护距离单元个数为4,基于ADMM和AE-ADMM-Net对第152个距离单元的空时回波信号进行处理,从而估计杂波空时谱、设计空时滤波器进行杂波抑制和目标检测,结果如图11所示。其中,前3个子图依次对应迭代3000次的ADMM算法、迭代45次的ADMM算法和网络层数为45的AE-ADMM-Net,第4个子图为目标检测结果。可以看出,本文所提DU-STAP方法对实测数据进行处理仍能获得较好的结果,在迭代次数相同的条件下,杂波空时谱估计和目标检测性能均优于基于固定迭代参数ADMM算法的SR-STAP方法。
5. 结语
本文提出了基于DU的机载雷达STAP方法。在存在阵列误差的条件下,对基于ADMM算法的杂波空时谱和阵列误差联合估计方法进行了分析,针对其存在的问题构建了深度神经网络AE-ADMM-Net,并对其网络结构、数据集构建方法、网络初始化与训练方法进行了介绍。通过仿真实验对基于AE-ADMM-Net的DU-STAP方法进行了验证,结果表明:相比典型的SR算法,AE-ADMM-Net能够从数据中学习得到最优迭代参数,在不同阵列误差条件下快速获得杂波空时谱和阵列误差参数的准确估计;相比典型的SR-STAP方法,DU-STAP方法能够获得较好的杂波抑制性能,且运算复杂度更低。下一步将对载机偏航、距离模糊、杂波内部运动和网格失配等非理想条件下的算法改进与分析进行深入研究。
-
图 5 固定参数ADMM算法杂波空时谱和阵列误差参数估计结果(a1—a4:不同阵列误差参数下的空时谱估计结果,b1—b4:不同阵列误差参数下的幅度误差估计结果,c1—c4:不同阵列误差参数下的相位误差估计结果)
Figure 5. Clutter space-time spectra and array error parameters estimated via ADMM algorithm with fixed parameters (a1—a4: Clutter space-time spectra estimation results in different array error parameters, b1—b4: Amplitude error estimation results in different array error parameters, c1—c4: Phase error estimation results in different array error parameters)
图 7 不同条件下不同算法的杂波空时谱估计结果(a1—a4:ADMM算法在不同阵列误差参数下的迭代25次的估计结果,b1—b4:ADMM算法在不同阵列误差参数下的迭代45次的估计结果,c1—c4:FOCUSS算法在不同阵列误差参数下的迭代200次的估计结果,d1—d4:SBL算法在不同阵列误差参数下的迭代400次的估计结果,e1—e4:25层的AE-ADMM-Net 在不同阵列误差参数下的的估计结果,f1—f4:45层的AE-ADMM-Net 在不同阵列误差参数下的估计结果)
Figure 7. Clutter space-time spectra estimated via different algorithms under different conditions (a1—a4: estimation results of ADMM algorithm with 25 iterations in different array error parameters, b1—b4: estimation results of ADMM algorithm with 45 iterations in different array error parameters, c1—c4: estimation results of FOCUSS algorithm with 200 iterations in different array error parameters, d1—d4: estimation results of SBL algorithm with 400 iterations in different array error parameters, e1—e4: estimation results of AE-ADMM-Net with 25 layers in different array error parameters, f1—f4: estimation results of AE-ADMM-Net with 45 layers in different array error parameters)
图 8 不同条件下AE-ADMM-Net的阵列误差参数估计结果(a1—a4:不同阵列误差参数下的幅度误差估计结果,b1—b4:不同阵列误差参数下的相位误差估计结果)
Figure 8. Array error parameters estimated by AE-ADMM-Net under different conditions (a1—a4: Amplitude error estimation results in different array error parameters, b1—b4: Phase error estimation results in different array error parameters)
图 9 不同条件下不同方法对应的SCNR损失曲线(a1—a4:不同阵列误差参数下的SCNR曲线结果,b1—b4:不同阵列误差参数下的SCNR曲线局部放大结果)
Figure 9. SCNR loss curves corresponding to different methods under different conditions (a1—a4: SCNR loss curves results in different array error parameters, b1—b4: SCNR loss curves results with enlarged scale in different array error parameters)
表 1 ADMM算法
Table 1. ADMM algorithm
输入:A, y,迭代次数K,正则化因子 \rho ,二次惩罚因子 \gamma ,迭代步长 \tau ,比例因子 \delta 和w。 步骤1 初始化:{ {\boldsymbol{\alpha} } ^{(0)} } = { {\bf{0} }_{ {N_{{\rm{d}}} }{N_{{\rm{s}}} } } }({N_{{\rm{d}}} }{N_{{\rm{s}}} } \times 1的全0列向量),{{\boldsymbol{\lambda}} ^{(0)} } = {{\bf{0}}_{NM} }(NM \times 1的全0列向量),{{\boldsymbol{t}}^{(0)} } = {{\bf{1}}_M}(M \times 1的全1列向量),
{{\boldsymbol{T}}^{(0)} } = {{\boldsymbol{I}}_N} \otimes {\rm{diag}}({{\boldsymbol{t}}^{(0)} }),k = 0;步骤2 { {\boldsymbol{\eta} } ^{(k + 1)} } = \rho \gamma /(1 + \rho \gamma )({ {\boldsymbol{\lambda} } ^{(k)} }/\gamma - {\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k)} } + { {\boldsymbol T}^{(k)} }{\boldsymbol{y} }); 步骤3 {{\boldsymbol{\alpha}} ^{(k + 1)} } = {\text{soft} }({{\boldsymbol{\alpha}} ^{(k)} } + \tau {{\boldsymbol{A}}^{{\rm{H}}} }{{\boldsymbol{\eta}} ^{(k + 1)} }/(\rho \gamma ),\tau /\gamma ); 步骤4-1
{ {\boldsymbol{z} }^{(k)} } = {\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k + 1)} } + { {\boldsymbol{\eta} } ^{(k + 1)} } - {{\boldsymbol{\lambda}} ^{(k)} }/\gamma, {b_m} = \displaystyle\sum\nolimits_{n = 1}^N {y_{(n - 1)M + m}^ * z_{(n - 1)M + m}^{(k)} }, {a_m} = \displaystyle\sum\nolimits_{n = 1}^N {|{y_{(n - 1)M + m} }{|^2} },
\beta = \left[\delta + {\rm{j}}w - \sum\nolimits_{m = 1}^M {({b_m}/{a_m}} )\right]/\sum\nolimits_{m = 1}^M {(1/{a_m})}。步骤4-2 { {\boldsymbol{t} }^{(k + 1)} } = {\left[ {({b_1} + \beta )/{a_1},({b_2} + \beta )/{a_2}, \cdots ,({b_M} + \beta )/{a_M} } \right]^{\rm{T}}}; 步骤5 { {\boldsymbol{\lambda} } ^{(k + 1)} } = { {\boldsymbol{\lambda} } ^{(k)} } - \gamma ({\boldsymbol{A} }{ {\boldsymbol{\alpha} } ^{(k + 1)} } + {{\boldsymbol{\eta}} ^{(k + 1)} } - { {\boldsymbol T}^{(k + 1)} }{\boldsymbol{y} }); 步骤6 令 k \leftarrow k + 1 ,若k \le K - 1,则返回步骤2,否则结束。 输出: {\boldsymbol{\alpha}} = {{\boldsymbol{\alpha}} ^K}, {e_m} = 1/t_m^K , {\boldsymbol{e} } = {[{e_1},{e_2}, \cdots ,{e_M}]^{\rm{T} } }。 表 2 仿真参数
Table 2. Simulation parameters
参数 数值 参数 数值 载机高度H 3000 m 载机速度v 100 ms–1 阵元数M 10 个 脉冲数N 10 个 阵元间距d 0.1 m 工作波长λ 0.2 m 脉冲重复频率fr 2000 Hz 距离范围[Rmin, Rmax] [21,31] km 距离单元数L 100 个 杂波块数Nc 361 个 阵元误差数P 100 个 杂噪比CNR 60 dB 训练数据集大小O 7500 测试数据集大小S 2500 频率范围f s和f d [–0.5,0.5] 网格数Ns和Nd 50 个 表 3 不同算法的运算复杂度
Table 3. Computational complexities of different algorithms
算法 运算复杂度 FOCUSS O\left( {3NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^3} + 2{ {(NM)}^2}{N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) SBL O\left( {5NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^3} + 2{ {(NM)}^2}{N_{{\rm{s}}} }{N_{{\rm{d}}} } + NM + {N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) AE-ADMM-Net O\left( {2NM{N_{{\rm{s}}} }{N_{{\rm{d}}} } + { {(NM)}^2} + 2NM + {N_{{\rm{s}}} }{N_{{\rm{d}}} } } \right) -
[1] 谢文冲, 段克清, 王永良. 机载雷达空时自适应处理技术研究综述[J]. 雷达学报, 2017, 6(6): 575–586. doi: 10.12000/JR17073XIE Wenchong, DUAN Keqing, and WANG Yongliang. Space time adaptive processing technique for airborne radar: An overview of its development and prospects[J]. Journal of Radars, 2017, 6(6): 575–586. doi: 10.12000/JR17073 [2] BRENNAN L E and REED L S. Theory of adaptive radar[J]. IEEE Transactions on Aerospace and Electronic Systems, 1973, AES-9(2): 237–252. doi: 10.1109/TAES.1973.309792 [3] YANG Zhaocheng, WANG Zetao, LIU Weijian, et al. Reduced-dimension space-time adaptive processing with sparse constraints on beam-Doppler selection[J]. Signal Processing, 2019, 157: 78–87. doi: 10.1016/j.sigpro.2018.11.013 [4] PECKHAM C D, HAIMOVICH A M, AYOUB T F, et al. Reduced-rank STAP performance analysis[J]. IEEE Transactions on Aerospace and Electronic Systems, 2000, 36(2): 664–676. doi: 10.1109/7.845257 [5] SARKAR T K, WANG Hong, PARK S, et al. A deterministic least-squares approach to space-time adaptive processing (STAP)[J]. IEEE Transactions on Antennas and Propagation, 2001, 49(1): 91–103. doi: 10.1109/8.910535 [6] WU Yong, TANG Jun, and PENG Yingning. On the essence of knowledge-aided clutter covariance estimate and its convergence[J]. IEEE Transactions on Aerospace and Electronic Systems, 2011, 47(1): 569–585. doi: 10.1109/TAES.2011.5705692 [7] 段克清, 袁华东, 许红, 等. 稀疏恢复空时自适应处理技术研究综述[J]. 电子学报, 2019, 47(3): 748–756. doi: 10.3969/j.issn.0372-2112.2019.03.033DUAN Keqing, YUAN Huadong, XU Hong, et al. An overview on sparse recovery space-time adaptive processing technique[J]. Acta Electronica Sinica, 2019, 47(3): 748–756. doi: 10.3969/j.issn.0372-2112.2019.03.033 [8] JIANG Zhizhuo, WANG Xueqian, LI Gang, et al. Space-time adaptive processing by employing structure-aware two-level block sparsity[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 6386–6397. doi: 10.1109/JSTARS.2021.3090069 [9] 孙珂, 张颢, 李刚, 等. 基于杂波谱稀疏恢复的空时自适应处理[J]. 电子学报, 2011, 39(6): 1389–1393.SUN Ke, ZHANG Hao, LI Gang, et al. STAP via sparse recovery of clutter spectrum[J]. Acta Electronica Sinica, 2011, 39(6): 1389–1393. [10] SUN Ke, MENG Huadong, WANG Yongliang, et al. Direct data domain STAP using sparse representation of clutter spectrum[J]. Signal Processing, 2011, 91(9): 2222–2236. doi: 10.1016/j.sigpro.2011.04.006 [11] YANG Zhaocheng, LI Xiang, WANG Hongqiang, et al. On clutter sparsity analysis in space-time adaptive processing airborne radar[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(5): 1214–1218. doi: 10.1109/LGRS.2012.2236639 [12] YANG Zhaocheng, LI Xiang, WANG Hongqiang, et al. Adaptive clutter suppression based on iterative adaptive approach for airborne radar[J]. Signal Processing, 2013, 93(12): 3567–3577. doi: 10.1016/j.sigpro.2013.03.033 [13] DUAN Keqing, WANG Zetao, XIE Wenchong, et al. Sparsity-based STAP algorithm with multiple measurement vectors via sparse Bayesian learning strategy for airborne radar[J]. IET Signal Processing, 2017, 11(5): 544–553. doi: 10.1049/iet-spr.2016.0183 [14] WANG Zetao, WANG Yongliang, DUAN Keqing, et al. Subspace-augmented clutter suppression technique for STAP radar[J]. IEEE Geoscience and Remote Sensing Letters, 2016, 13(3): 462–466. doi: 10.1109/LGRS.2016.2519765 [15] FENG Weike, GUO Yiduo, ZHANG Yongshun, et al. Airborne radar space time adaptive processing based on atomic norm minimization[J]. Signal Processing, 2018, 148: 31–40. doi: 10.1016/j.sigpro.2018.02.008 [16] GUO Yiduo, LIAO Guisheng, and FENG Weike. Sparse representation based algorithm for airborne radar in beam-space post-Doppler reduced-dimension space-time adaptive processing[J]. IEEE Access, 2017, 5: 5896–5903. doi: 10.1109/ACCESS.2017.2689325 [17] MA Zeqiang, LIU Yimin, MENG Huadong, et al. Sparse recovery-based space-time adaptive processing with array error self-calibration[J]. Electronics Letters, 2014, 50(13): 952–954. doi: 10.1049/el.2014.0315 [18] YANG Zhaocheng, DE LAMARE R C, and LIU Weijian. Sparsity-based STAP using alternating direction method with gain/phase errors[J]. IEEE Transactions on Aerospace and Electronic Systems, 2017, 53(6): 2756–2768. doi: 10.1109/TAES.2017.2714938 [19] GREGOR K and LECUN Y. Learning fast approximations of sparse coding[C]. The 27th International Conference on International Conference on Machine Learning, Haifa, Israel, 2010: 399–406. [20] LIU Jialin, CHEN Xiaohan, WANG Zhangyang, et al. ALISTA: Analytic weights are as good as learned weights in LISTA[C]. 7th International Conference on Learning Representations (ICLR), New Orleans, USA, 2019. [21] BORGERDING M, SCHNITER P, and RANGAN S. AMP-inspired deep networks for sparse linear inverse problems[J]. IEEE Transactions on Signal Processing, 2017, 65(16): 4293–4308. doi: 10.1109/TSP.2017.2708040 [22] YANG Chengzhu, GU Yuantao, CHEN Badong, et al. Learning proximal operator methods for nonconvex sparse recovery with theoretical guarantee[J]. IEEE Transactions on Signal Processing, 2020, 68: 5244–5259. doi: 10.1109/TSP.2020.2978615 [23] 朱晗归, 冯存前, 冯为可, 等. 一种深度学习稀疏单快拍DOA估计方法[J/OL]. 信号处理. https://kns.cnki.net/KCMS/detail/11.2406.TN.20220130.1421.006.ktml, 2022.ZHU Hangui, FENG Cunqian, FENG Weike, et al. A deep learning approach for sparse single snapshot DOA estimation[J/OL]. Journal of Signal Processing. https://kns.cnki.net/KCMS/detail/11.2406.TN.20220130.1421.006.ktml, 2022. [24] GUO Yiduo, LIAO Guisheng, GONG Jian, et al. Sparse recovery-based STAP method using prior information of azimuth-elevation[J]. Journal of Applied Remote Sensing, 2017, 11(3): 035004. doi: 10.1117/1.JRS.11.035004 [25] 段克清, 李想, 行坤, 等. 基于卷积神经网络的天基预警雷达杂波抑制方法[J]. 雷达学报, 2022, 11(3): 386–398. doi: 10.12000/JR21161DUAN Keqing, LI Xiang, XING Kun, et al. Clutter mitigation in space-based early warning radar using a convolutional neural network[J]. Journal of Radars, 2022, 11(3): 386–398. doi: 10.12000/JR21161 [26] Boyd S, Parikh N, Chu E, et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends in Machine learning, 2011, 3(1): 1–122. [27] YANG Junpeng and ZHANG Yin. Alternating direction algorithms for l1-problems in compressive sensing[J]. SIAM Journal on Scientific Computing, 2011, 33(1): 250–278. doi: 10.1137/090777761 [28] RUMELHART D E, HINTON G E, and WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323(6088): 533–536. doi: 10.1038/323533a0 [29] HU Xiaowei, XU Feng, GUO Yiduo, et al. MDLI-Net: Model-driven learning imaging network for high-resolution microwave imaging with large rotating angle and sparse sampling[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5212617. doi: 10.1109/TGRS.2021.3110579 期刊类型引用(5)
1. 廖志鹏,段克清,何锦浚,邱梓洲,王永良. 基于可解释深度卷积网络的空时自适应处理方法. 雷达学报. 2024(04): 917-928 . 本站查看
2. 李海,张强,周桉宇,熊玉. 卷积神经网络STAP低空风切变风速估计. 电子与信息学报. 2024(08): 3193-3201 . 百度学术
3. 毛德庆,杨建宇,杨明杰,张永超,张寅,黄钰林. IAA-Net:一种实孔径扫描雷达迭代自适应角超分辨成像方法. 雷达学报. 2024(05): 1073-1091 . 本站查看
4. 钟永磊. 海杂波对机载雷达探测距离的影响. 无线互联科技. 2023(11): 5-7 . 百度学术
5. 邹帛,王欣,冯为可,朱晗归,李瑶. 基于非线性回归的杂波重构STAP方法. 电光与控制. 2022(09): 32-37 . 百度学术
其他类型引用(2)
-