Loading [MathJax]/jax/element/mml/optable/MathOperators.js

一种基于深度强化学习的频率捷变雷达智能频点决策方法

张嘉翔 张凯翔 梁振楠 陈新亮 刘泉华

范磊, 杨琪, 王宏强, 等. 基于太赫兹ViSAR的无源干扰物成像[J]. 雷达学报(中英文), 2025, 14(2): 486–500. doi: 10.12000/JR24174
引用本文: 张嘉翔, 张凯翔, 梁振楠, 等. 一种基于深度强化学习的频率捷变雷达智能频点决策方法[J]. 雷达学报(中英文), 2024, 13(1): 227–239. doi: 10.12000/JR23197
FAN Lei, YANG Qi, WANG Hongqiang, et al. Terahertz-ViSAR-based imaging of passive jamming objects[J]. Journal of Radars, 2025, 14(2): 486–500. doi: 10.12000/JR24174
Citation: ZHANG Jiaxiang, ZHANG Kaixiang, LIANG Zhennan, et al. An intelligent frequency decision method for a frequency agile radar based on deep reinforcement learning[J]. Journal of Radars, 2024, 13(1): 227–239. doi: 10.12000/JR23197

一种基于深度强化学习的频率捷变雷达智能频点决策方法

DOI: 10.12000/JR23197
基金项目: 国家自然科学基金(62201048)
详细信息
    作者简介:

    张嘉翔,博士生,主要研究方向为智能干扰感知与抗干扰决策

    张凯翔,博士生,主要研究方向为分布式雷达和抗干扰

    梁振楠,博士,副研究员,硕士生导师,主要研究方向为数字阵列雷达系统和宽带雷达信号处理

    陈新亮,博士,讲师,硕士生导师,主要研究方向为目标检测跟踪和软件化雷达

    刘泉华,博士,教授,博士生导师,主要研究方向为高分辨雷达系统及信号处理

    通讯作者:

    梁振楠 liangzhennan@bit.edu.cn

  • 责任主编:全英汇 Corresponding Editor: QUAN Yinghui
  • 中图分类号: TN958

An Intelligent Frequency Decision Method for a Frequency Agile Radar Based on Deep Reinforcement Learning

Funds: The National Natural Science Foundation of China (62201048)
More Information
  • 摘要: 自卫式干扰机发射的瞄准干扰使多种基于信号处理的被动干扰抑制方法失效,对现代雷达产生了严重威胁,频率捷变作为一种主动对抗方式为对抗瞄准干扰提供了可能。针对传统随机跳频抗干扰性能不稳定、频点选取自由度有限、策略学习所需时间长等问题,该文面向频率捷变雷达,提出了一种快速自适应跳频策略学习方法。首先设计了一种频点可重复选取的频率捷变波形,为最优解提供了更多选择。在此基础上,通过利用雷达与干扰机持续对抗收集到的数据,基于深度强化学习的探索与反馈机制,不断优化频点选取策略。具体来说,通过将上一时刻雷达频点及当前时刻感知到的干扰频点作为强化学习输入,神经网络智能选取当前时刻各子脉冲频点,并根据目标检测结果以及信干噪比两方面评价抗干扰效能,从而优化策略直至最优。从提高最优策略收敛速度出发,设计的输入状态不依赖历史时间步、引入贪婪策略平衡搜索-利用机制、配合信干噪比提高奖励差异。多组仿真实验结果表明,所提方法能够收敛到最优策略且具备较高的收敛效率。

     

  • 合成孔径雷达(Synthetic Aperture Radar, SAR)作为雷达探测领域的重要技术手段,因其具备全天时、全天候的观测能力,广泛应用于地形测绘、资源勘查和环境监测等多个领域[1]。随着雷达成像技术及成像系统的快速发展,SAR图像实现了从低分辨率到高分辨率乃至超高分辨率的飞跃,这进一步提升了雷达对场景的态势感知能力[24]。与此同时,由于电磁安全保护和隐蔽性等因素,用于干扰雷达成像的干扰物也在不断更新换代。这些干扰物可能导致目标成像结果受到“污染”,进而恶化后续的雷达目标检测与识别[57]。因此,在面向高分辨且具有紧急应用需求的雷达成像领域,研究这些干扰物的成像显得尤为重要。

    目前,干扰物主要分为两类。一类是有源干扰物,其通过主动发射或转发干扰信号来破坏、压制或欺骗敌方的电子系统[8]。这种方式的优势在于能够主动出击,直接造成强有力干扰,但也有可能暴露自身位置,同时设备造价相对较高。另一类是无源干扰物,其通过反射、散射和吸收敌方发射的电磁波来降低效能,因而更加隐蔽,不容易暴露自身情况[9]。本文聚焦于对后者的成像。典型无源干扰物包括箔条、地海面中的角反阵、地面目标中伪装网以及微动角反等。其中箔条干扰可以显著降低低分辨的末制导雷达反舰导弹命中率[10];角反射器由于特殊几何结构,雷达的照射下可以产生强电磁散射信号,通过组合使用可形成与真实目标相似的假目标,即形成对末端制导雷达的冲淡式干扰[11];伪装网通常可具备特定的光学或电磁隐蔽特性,可以减少雷达散射强度,从而降低目标被探测到的概率[12];微动角反,包括振动、旋转、摇摆等,满足一定条件后可形成压制性干扰成像,从而形成对感兴趣区域/目标的“鬼影”、条带、栅栏等假目标[13]。目前,对这些无源干扰物的成像的方法采用提高雷达分辨率、多普勒滤波和多极化技术[14]。然而,由于微波频段下的波长的限制,雷达成像为达到期望分辨率所需驻留时间较长,因此较难成像,进而难以直接鉴别这些无源干扰物。此外,获得图像也仅为单张图像,缺乏时间维分辨能力,多普勒特性感知较差,使得对运动状态下无源干扰物检测和成像变得更加困难。

    太赫兹频段是指频率在0.1~10.0 THz的电磁波,对应的波长为3 mm~30 μm。相比于微波雷达,(1)太赫兹雷达由于高载频更容易形成宽带雷达,距离维高分辨成像能直接通过雷达硬件系统提高;(2)太赫兹雷达实现相同方位分辨率所需的合成孔径可以更短,从而具备更多雷达成像的条件[1517];(3)由于波长短,太赫兹雷达的多普勒特性更加敏感。因而,太赫兹雷达具备高“时空频”分辨能力,推动太赫兹视频SAR (Video SAR, ViSAR)出现[1820]。另外,太赫兹ViSAR雷达系统能兼具小型化与轻量化硬件系统的天然优势,使其在“察打一体”小型无人机群中具有重要潜力。

    ViSAR的概念最早于2003年提出[21]。加拿大国防研究与发展中心(Defence Research and Development Canada,DRDC)在2010年首次公开基于X频段宽带试验机载雷达系统与典型实验结果[22]。随后,美国桑迪亚国家重点实验室(Sandia National Laboratories, SNL)验证了Ku频段机载ViSAR雷达在高帧率成像和阴影检测等方面的技术可行性,并取得了引领性的实验成果,引发国内外的广泛关注和研究热潮;在2014年和2019年,德国弗劳恩霍夫高频物理与雷达技术研究所(Fraunhofer Institute for High Frequency Physics and Radar Techniques, FHR)公布了基于Ka频段MIRANDA-35的条带成像结果和W频段MIRANDA-94聚束成像结果[23,24]。然而,这些系统本质上成像帧率与分辨率仍然受限于波长。与此同时,太赫兹ViSAR系统的研制也在如火如荼的发展中。早在2012年,美国国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)就发布了ViSAR计划。于2018年,雷神公司在IEEE雷达年会上展示太赫兹频段外场成像结果[25]。试验证明了太赫兹雷达进行外场实验的技术可行性。国内方面,国防科技大学、电子科技大学、西安电子科技大学、哈尔滨工程大学、中国工程物理研究院、航天科工二院23所与中国电子科技集团公司14所等机构也在积极开展ViSAR雷达研制、成像技术、成像应用等方面的研究。尽管如此,受到诸如肖特基二极管、倍频后功率较小等问题约束[26],目前太赫兹频段下公里级外场实验验证还是相对较少,尤其是对这些无源干扰物的研究仍处于通过电磁仿真或简单暗室缩比模型验证阶段。太赫兹频段下,对无源干扰物的目标特性和成像研究仍处于待探索阶段。

    鉴于此,本文开展了基于太赫兹ViSAR对无源干扰物的机载成像实验与算法验证。首先,简要地给出太赫兹ViSAR的孔径划分和相关分辨率分析。然后,给出了对无源干扰物的成像的整体处理流程。对于诸如角反阵和伪装网的静止无源干扰物,分析了它们运动补偿前后的成像结果,并利用它们在太赫兹频段下的目标特性差异进行抗干扰;对于运动无源干扰物,以旋转角反为例,分析了其压制性成像特性,并利用静止场景在相邻子孔径中的相似性进行动目标检测,随后提取和解缠感兴趣信号相位,最终完成非参数化补偿。实验结果验证了太赫兹ViSAR具备对无源干扰物高分辨成像与抗干扰能力。本文的主要贡献如下:

    (1) 建立了基于太赫兹ViSAR的无源干扰物成像框架,尤其是探索了基于非参补偿的旋转角反的检测与重聚焦方法。

    (2) 开展了太赫兹频段下关于无源干扰物的公里级外场机载实验验证,有效地验证太赫兹ViSAR对角反阵、伪装网和旋转角反等无源干扰物的成像能力。

    本节首先对太赫兹ViSAR信号模型、孔径划分依据及成像分辨率进行分析。随后,将无源干扰物分为静止与运动两类。对于诸如角反阵和伪装网的静止无源干扰物,给出在太赫兹频段的成像过程;对于运动无源干扰物,以旋转角反为例,给出了一种适用于ViSAR的检测与成像方法。

    根据雷达的波束指向,ViSAR两类典型工作模式分为聚束与条带模式。两者模式互相补充,具有相似之处,本文聚焦于后者。图1展示了典型的条带太赫兹ViSAR成像场景示意图,其中,红色实线(X轴)表示飞机飞行理想路线。v为飞机飞行速度,H为理论飞行高度,β为雷达关于静止点目标P(Xη,Yη,Zη)的下视角。雷达按照正侧视照射。假设成像区域高度不存在变化,天线相位中心(Antenna Phase Center, APC)沿着理论路径匀速运动,即意味着运动补偿已完成。当慢时间为η时,理论APC位置为[X(η),Y(η),Z(η)]=[vη,0,0]在忽略二阶以上的高阶项后,雷达APC位置A到点目标P的瞬时距离可表示为[27]

    图  1  条带ViSAR成像场景示意图
    Figure  1.  Diagram of stripmap ViSAR imaging
    Rt(η)=(X(η)Xn)2+(Y(η)Yn)2+(Z(η)Zn)2=|AP|RB+(X(η)Xη)22RB (1)

    其中,Yn=RBsinβ, Zn=RBcosβ, RB=Y2n+Z2n表示理论飞行路线到场景的最近距离。雷达发射信号为线性调频信号。为降低数据采样压力,太赫兹雷达通常按照去斜方式接收回波。在完成残余视频相位校正后,来自点目标P的回波可表示为

    S(fτ,η)=Arect(fτB)wa(ηηc)exp(j4π(fc+fτ)RΔc) (2)

    其中,τ为快时间,fτfc分别表示距离频率与载频,A为信号幅度,B为带宽,rect()wa()分别为矩形和方位窗函数,c为光速,RΔ(η)=Rt(η)Rr其中Rr为提前确定的参考距离。需要说明的是,这里的相位项表示忽略了线性偏移量,这是因为太赫兹ViSAR中每帧的合成孔径较小,其对最终成像性能基本不影响,详细分析请见文献[28]。

    在完成回波数据获取与预处理后,ViSAR成像需要进行孔径划分。孔径划分策略需要综合考虑成像帧率、成像分辨率以及处理时间等因素[29]。需要说明的是,太赫兹ViSAR中孔径划分与微波频段的方式存在不同。图2对比了两种不同的孔径划分方式,即数据滑窗或不滑窗模式。对于前者,为提高成像帧率,该模式将完整的孔径划分为多个子孔径,并且执行数据滑窗。需要强调的是,此时子孔径长度需要满足至少一个完整的子孔径。这里“完整的子孔径”指的是雷达方位波束宽度与雷达作用距离的乘积。只有当合成孔径满足此条件,条带SAR的方位分辨率才为雷达方位天线长度的一半。这本质上是因为微波ViSAR受限于方位分辨率而采用的孔径划分方式[30]。尽管如此,这种模式实现高分辨成像是以高延迟成像为代价的,对面向低延迟成像应用需求存在局限性。

    图  2  两种孔径划分方式示意图
    Figure  2.  Diagram of two ways of aperture division

    对于后者,数据不滑窗模式即为本文太赫兹ViSAR的孔径划分模式。与前者不同之处在于,其不再需要一个完整的子孔径,原始回波数据可以在获取后即刻处理。前提条件在于确定合适的合成孔径长度去达到给定方位分辨率的需求。具体系统的数值分析与解释将在3.1节进行。需要补充说明的是,标准的SAR成像模式,属于该模式,其利用完整孔径去生成一幅SAR图像,可看作ViSAR成像的一种极端情况,即帧率达到最小情况。这里“完整孔径”指的是雷达随飞机飞行形成的总合成孔径长度。此时,方位分辨率ρx可通过多普勒带宽Ba和飞行速度v确定,即

    ρx=vBaλRt2vTs (3)

    其中,λ为波长,Ts为合成孔径时间,方位带宽Ba可表示为

    Ba=2vsin(θs+θa/2)λ2vsin(θsθa/2)λ=4vcosθssin(θa/2)λ2vcosθsλθa (4)

    其中,θsθa分别为斜视角和合成孔径角。不难发现,在给定分辨率与合成孔径时间后,波长应该尽可能小。因此,所提方法的孔径划分是依据于太赫兹频段的短波长。随后,ViSAR的成像帧率可确定为

    Frame rate = 11α2vλRtρx (5)

    其中,α为数据重复率。通常而言,如果α等于0,将其定义为真帧。反之,定义为伪帧。在0.2 m的方位分辨率约束下,假设雷达作用距离为3.2 km,飞行速度为60 m/s,不难计算得到只要载频大于200 GHz,即可实现真帧情况下的5 Hz帧率。当数据重复率达到80%时,此时成像帧率已经超过25 Hz,达到视频播放标准。与此同时,ViSAR中的距离分辨率定义与SAR中保持一致,仍然只与雷达带宽有关,即

    ρr=c2B (6)

    图3展示了所提方法的整体处理框架,主要包括两个部分:静止和运动无源干扰物成像。诸如角反阵和伪装网的静止无源干扰物由于本身不会产生额外运动,通过分析运动补偿前后的成像结果来探索它们在太赫兹频段的目标特性。对于运动无源干扰物,以旋转角反为例,考虑到静止场景在相邻成像结果中具有冗余性,在完成图像和幅度校准后,即可通过非相干相减完成动目标检测。随后,从散焦目标图像中提取感兴趣信号并完成相位解缠,最终实现旋转角反的重聚焦。

    图  3  整体处理框架
    Figure  3.  Overall processing framework
    2.2.1   静止无源干扰物的成像

    对于静止无源干扰物的成像,以点目标P的成像为例。首先,为了使得成像距离与目标实际所处距离匹配上,需要将用于去斜的常数相位(固定参考距离引入的相位)补偿。之后,沿快时间进行傅里叶逆变换,将式(2)转换为距离压缩域的数据。

    src(τ,η)=RC(S(fτ,η))=IFTτ(S(fτ,η))=Asinc(B(τ2Rt(η)c))wa(ηηc)exp(j2πv2λRBη2)exp(j4πfcRBc) (7)

    其中,RC()表示距离压缩操作符号。IFTτ表示沿快时间维的傅里叶逆变换。为了能统一地消除不同方位位置的距离单元徙动(Range Cell Migration, RCM),式(7)被变换到距离-多普勒域,即

    srd(τ,fη)=Asinc(B(τ2Rrd(fη)c))Wa(fηfηc)exp(jπf2ηKa)exp(j4πfccRB) (8)

    其中,fηfηc分别为方位频率和多普勒中心,Wa()为方位频谱,Ka=2v2/2v2λRBλRB为多普勒调频率。静止目标的RCM可表示为

    Rrd(fη)RB=RB[1D(fη,v)D(fη,v)] (9)

    其中,D(fη,v)=1f2ηλ2/4v2表示斜视角的余弦值。假设距离单元徙动校正的插值是足够正确的,距离徙动校正后的信号可表示为

    srcmc(τ,fη)=Asinc(B(τ2RBc))Wa(fηfηc)exp(jπf2ηKa)exp(j4πfccRB) (10)

    可以发现,这里的方位信号可近似为线性调频信号。随后,方位匹配滤波器被定义为

    Haz(fη)=exp(jπf2ηKa) (11)

    结合式(10)和式(11),最终聚焦的图像可表示为

    sfinal(τ,η)=IFTη(srcmc(τ,fη)Haz(fη))==Asinc(B(τ2RBc))sinc(Ba(ηx0v))exp(j4πfccRB)exp(j2πfηcx0v) (12)

    其中,x0表示P的方位位置。对于角反阵而言,如果角反之间的间隔大于等于成像分辨率,使其不处于同一个距离或方位成像网格中,那么它的成像结果应为一系列点目标的组合;同理,对于伪装网,由于上下起伏的网格远大于太赫兹波长,其散射的非相干分量更为丰富,最终成像结果应为一块面目标区域。

    2.2.2   运动无源干扰物的成像

    由于旋转与振动等微动的数学模型与原理是相似的[13],运动无源干扰物仅以旋转角反为例。相比于静止点目标的距离历程,旋转目标的距离历程在合成孔径时间内不再仅表现为二阶形式,而是多增加了正弦调制。以单分量的旋转为例,此时距离历程可表示为

    Rm(η)=|APm(η)|Rt(η)+Amsinβsin(2πfmη+φm) (13)

    其中,Pm(η)表示旋转目标的瞬时位置。Am, fmφm分别表示旋转半径、转动频率和初相。令rm(η)=Amsinβsin(2πfmη+φm), m=1,2。不失一般性地,m数目为2的原因在于选择的目标是一组旋转角反,其与后续实验保持一致。此外,旋转参数满足两个先验,即f1=f2|φ2φ1|=π,其可以辅助验证解缠相位的准确性。与式(7)类似,旋转角反的距离压缩域信号可表示为

    saz1(τ,η)Asinc(B(τ2RB+2rmc))exp(j4πfcRBc)exp(j2πv2λRBη2)exp(j4πfccrm(η)) (14)

    其中,第1个相位项为常数相位项,而第2个相位项为二阶相位误差项。此外,最后一个相位项满足

    exp(j4πfccrm(η))={q=Jq(zm)exp(jq(2πfmη+Δm)),fmTs1exp(j4πfcc(β0+β1η+β2η2+)),fmTs<1 (15)

    其中,zm=4πfcAm/c, Δm=φm+π, Jq(zm)为第m阶贝塞尔函数,βi,i=0,1,2,为泰勒展开系数。从式(15)可得,如果旋转目标的距离历程在合成孔径时间内包含一个及其以上的完整正弦时,其可以用雅克比-安吉尔本体公式展开;反之,它将用高阶泰勒展开。该公式可作为后续旋转角反成像结果分析的数学基础。进一步地,观测式(14),两个点需要注意:(1)幅度项引入了额外的RCM。由于其特殊的RCM形式,其较难直接补偿。当旋转半径较小时,工程上可将其忽略;(2)相位项出现了额外的相位调制,其可能会导致方位偏移、“线段”散焦(低频)以及“鬼影点”或“栅栏”(高频)。

    接下来,对动目标信号进行提取。首先,需要对动目标进行检测,主要分为3个步骤。第1步,基于静止点目标成像算法得到对于场景的序列成像结果,以相邻两帧成像结果为例,假设其为I1,I2;第2步,对序列图像进行图像校准;第3步,对校准后的图像进行非相干相减,如式(16)所示

    ΔI=argmax(I1Reg(I2)) (16)

    其中,Reg()表示对图像序列的校准,包括位置与幅度两方面。位置校准可通过相关法实现,这里不做赘述。在完成位置校准后,图4给出了幅度校准的代表性示例。图4(a)展示了旋转角反在相邻两帧的成像结果不同,但是静止场景的成像结果较接近。因此,利用这种图像差异即可进行动目标检测。需要说明的是,这种检测成立的前提在于它们成像孔径较为接近,以至于静止场景的散射特性不会发生大幅度的变化,即各向异性不明显。随后,图4(b)展示了幅度校正前后的平均幅度剖面。不难发现,经过校准后,静止目标的散射强度基本一致。最后,对幅度校准后的图像利用非相干相减即可得到的动目标检测结果,如图4(c)所示。此时,可以发现静止的飞机已经被较好地消除,更多地保留旋转角反帧间差异的成像结果,进而估计其所处的距离单元,并可提取出感兴趣信号。需要说明的是,非相干相减后的图像仍存在部分横条纹,这是由于相邻帧间图像的横条纹出现位置存在一定程度的水平偏移(与波束指向区域有关)。然而,幸运的是,通过时序的信息可以消除其对旋转角反距离单元估计的影响。随后,以处于距离单元RB为例,考虑到来自特显点的信号在信噪比较高时能较大程度代表目标运动特征,将其作为感兴趣信号,其在距离-方位时域可表示为

    图  4  基于相邻帧间图像的旋转角反检测
    Figure  4.  Detection of rotating reflectors based on adjacent frames
    SoIm(η)=exp(j4πfcc(RB+rm(η))),m=1,2 (17)

    与此同时,感兴趣信号的理论相位分布应为

    ΦSoIt,m(η)=4πfcc(RB+rm(η)) (18)

    其中, {\beta _i},i = 1,2,3,4 是拟合系数。可以发现,理论相位分布将展现出正弦分布。事实上,提取到的感兴趣信号相位是缠绕的,需要进行相位解缠。解缠算子{\text{unwarp}}( \cdot )通过以第1个方位采样点相位为基准,按照如下规则得到解缠相位

    \begin{split} & {\text{unwrap}}:\varphi \left( k \right) \\ & = \left\{ {\begin{array}{*{20}{c}} {\varphi \left( k \right)},&{\left| {\varphi \left( k \right) - \varphi \left( {k - 1} \right)} \right| < \pi } \\ {\varphi \left( k \right) - 2\pi },&{\varphi \left( k \right) - \varphi \left( {k - 1} \right) > \pi } \\ {\varphi \left( k \right) + 2\pi },&{\varphi \left( {k - 1} \right) - \varphi \left( k \right) > \pi } \end{array}} \right. \end{split} (19)

    其中,k为不小于2的整数, \varphi \left( k \right) 为第k个采样时刻相位。需要说明的是,为了尽可能地避免相位跳变大于 2\pi ,需要先对其进行多普勒模糊数求解。紧接着,感兴趣信号的相位可以以这种非参数化方式进行解缠

    {\varPhi _{{{\mathrm{SoI}}_{un,m}}}}(\eta ) = {\mathrm{unwarp}}\left( {{\varPhi _{{{\mathrm{SoI}}_{p,m}}}}(\eta )} \right) (20)

    其中,{\varPhi _{{{\mathrm{SoI}}_{p,m}}}}(\eta )为实际的感兴趣信号相位。需要说明的是,这种方式需要感兴趣信号处于相对较高的信杂比才能保证解缠准确性。幸运的是,实际场景中高价值/高威胁的旋转目标/部件大部分是金属的,因为其要保证较强的散射强度才能形成压制性成像干扰,进而保证了这个前提条件。然后,相位误差的补偿函数可构建为

    {H_{1,m}}\left( \eta \right) = \exp \left( { - {\mathrm{j}}{\varPhi _{{{\mathrm{SoI}}_{un,m}}}}(\eta )} \right),{\text{ }}m = 1,2 (21)

    进而将其代入式(14),可得到一个旋转角反重聚焦成像结果。另一个旋转角反的处理步骤与上述步骤保持一致。重复进行上述步骤即可得到另一个旋转角反的成像结果。

    为了验证所提方法的有效性,国防科技大学与航天科工二院23所在陕西蒲城开展了基于太赫兹雷达的机载外场实验。值得一提的是,太赫兹ViSAR的研究正在如火如荼地开展,但目前普遍缺乏外场实验验证。本次实验推动了太赫兹雷达从暗室测量走向实际机载外场挂飞,有力地验证了太赫兹雷达在ViSAR的有效性。表1给出了具体的太赫兹ViSAR系统参数。为实现无滑窗情况下5 Hz帧率且综合考虑方位分辨率需求,将合成孔径时间确定为0.2 s。根据实验参数,可推断出理论地距分辨率为0.18 m,方位分辨率优于0.2 m。对于方位分辨率而言,条带模式下理论方位分辨率为天线长度的一半(可由方位波束宽度和波长推断),即5 cm,其远小于距离分辨率。选取子孔径可以降低方位分辨率,同时减少每帧所需的驻留时间(从0.68 s到0.20 s),有助于实现太赫兹ViSAR低延迟成像。这里的0.68 s指的是用完整的子孔径对应载机飞行时间。这里即可解释太赫兹ViSAR中每一帧需求子孔径长度不用完整子孔径。

    表  1  太赫兹ViSAR系统参数
    Table  1.  Terahertz ViSAR system parameters
    系统指标 数值
    飞机型号 Cessna 208B
    雷达载频 216 GHz
    信号带宽 900 MHz
    地距/方位分辨率 0.18 m/0.17 m
    工作模式 条带模式
    飞行速度 219.6 km/h
    飞行高度 1.34 km
    地面海拔 0.34 km
    下视角 71.8°
    脉冲重复频率 16 kHz
    合成孔径时间 0.2 s
    方位波束宽度 0.745°
    成像帧率 5 Hz
    极化方式 VV极化
    下载: 导出CSV 
    | 显示表格

    图5展示了设计的条带ViSAR飞行路径与波束覆盖区域。在机场中,我们提前部署3个代表性无源干扰物目标,分别为形如“THz”的角反阵,伪装网、两个四面的旋转角反。这些目标布设的基本参数如下:角反阵间隔约为1.4 m;伪装网的尺寸为5.5 m×4.7 m;旋转角反的旋转速度和旋转半径分别为120 r/min和0.32 m。图6展示了相应布设位置下的光学照片。前两个目标作为静止无源干扰物的代表,而最后一个作为运动无源干扰物的代表。随后,图7(a)展示了基于惯导数据绘制的实际飞机飞行轨迹。这段轨迹飞行时间约为20 s,长度约1.2 km。可以发现,受到大气湍流的影响,实际机载飞行轨迹难以严格按照理论设定的路线飞行,高度维的最大起伏有2.5 m。这种量级的运动误差会严重降级需要亚毫米级补偿精度的太赫兹频段成像。同时,图7(b)展示了这段飞行时间内飞行速度与斜视角变化情况,进一步表明了太赫兹频段进行SAR成像的挑战。幸运的是,基于回波驱动的运动补偿方法已经在我们前期工作中成功探索,有效地解决基于惯导、全球定位系统等设备补偿精度不够以及太赫兹频段振动误差问题[31]。受限于文章篇幅限制,这里不对回波驱动的运动补偿进行过多解释。下面将对这3个无源干扰物的成像进行具体分析。

    图  5  太赫兹条带ViSAR实验场景示意图
    Figure  5.  Diagram of airborne experiments regarding stripmap terahertz ViSAR
    图  6  机场场景下3组实验目标的光学照片
    Figure  6.  Optical photos of three experimental targets in the airport
    图  7  实际机载飞行状态
    Figure  7.  Practical airborne flying status

    在太赫兹波束与条带模型共同约束下,实验发现可对角反阵与伪装网进行2 s的持续观测。为避免结果重复展示,我们挑选了3帧运动补偿前后的完整场景成像结果,如图8所示。这3帧的时间间隔扩大到0.4 s。可以发现:(1)得益于短驻留时间以及太赫兹雷达被布置于气浮台,能有效地减缓机载运动误差带来影响,未进行运动补偿前的成像结果能得到基本形状。然而,残余的运动误差仍然会对太赫兹频段成像质量恶化,尤其是导致关键目标与场景边缘产生模糊,如若无先验知识指引,难以辨别这些目标;(2)经过运动补偿后,场景的对比度明显提高,目标更加清晰,能清楚看到机场内的“THz”形状的角反阵、伪装网、卡车、房屋、草地以及各种目标的阴影等,这些目标有助于后续的图像解译。

    图  8  角反阵与伪装网的运动补偿前后的3帧成像结果
    Figure  8.  Imaging results of corner reflector array and camouflage mat

    为了能仔细观察成像结果差异,图9展示了第1帧内关于形如“THz”的角反阵在运动补偿前后的局部成像结果与轮廓图。这些图像的动态范围被限制到30 dB。在经过运动补偿后,每个角反射器沿方位维的散焦都得到良好的聚焦,整体形状可清晰辨别。随后,挑选了“T”字中的L1与L2,如图9(b)所示,来验证成像后角反间距与真实情况的差异。相应的距离与方位剖面如图10所示,可以发现角反之间的间距基本都为1.4 m,与实际情况吻合,有助于后续实现目标的重定位。与此同时,观察这些序列成像结果,我们能明显地辨别角反阵的成像结果基本保持一致。这是由于这3帧的成像角度间隔相近且角反阵处于静止状态,故它们的各向异性情况不明显。与此同时,可以推算角反阵的强度相比于周围水泥地高出约40 dB。

    图  9  角反阵运动补偿前后结果对比
    Figure  9.  Local zoom-in images and contour plots of corner reflector array before and after MOCO
    图  10  距离与方位剖面图
    Figure  10.  Range and azimuth profiles

    随后,图11(a)图11(b)展示了伪装网运动补偿前后的局部放大图。可以发现,未进行运动补偿前,伪装网的成像结果整体模糊,难以辨别。在经过运动补偿后,伪装网的轮廓与边缘变得清晰,图像的对比度得到明显提高。需要说明的是,伪装网的成像结果呈现为明显的面目标,这是因为伪装网上下起伏的网格(如图6(b)所示)在太赫兹频段会造成非相干散射分量增强,从而表现出“粗糙”的成像特性。也就是说,伪装网在太赫兹频段特殊的目标特性可以实现抗干扰,使其丢失在光学与部分电磁频段的“伪装”能力。需要强调的是,伪装网右边的强散射成像结果代表的是布设的狙击枪,其不属于静止无源干扰物。图11(c)形象地展示了太赫兹频段伪装网的面目标形状,进一步验证了上述的分析。值得一提的是,图像中的横条纹我们推测是机场路面的刻痕,它们能被成像也体现了太赫兹频段成像结果的特殊所在。

    图  11  伪装网在运动补偿前后的局部图以及 2.5D重构图
    Figure  11.  Zoom-in images of camouflage mat before and after MOCO

    运动无源干扰物以两个四面的旋转角反为例,将它们放置于木板上,并由电机驱动转动。实验发现,太赫兹条带ViSAR能对其进行约1.5 s的持续性监测(目标运动导致信噪比降低)。图12展示了运动补偿后旋转角反所处场景的成像结果(连续3帧)。不难发现,在未进行动目标成像补偿前,旋转角反会形成散布在场景中心的条带,如图13中局部放大图。基于此,如果布置的旋转角反数目足够多且满足一定构型,则成像结果能形成对场景的压制性成像干扰,对部分关键的目标/场景进行遮挡。因而,为了实现精准态势感知,有必要对这些散焦的成像结果进行重聚焦。

    图  12  关于旋转角反的连续3帧整体成像结果
    Figure  12.  Three consecutive frames of scene containing rotating reflector
    图  13  旋转角反的3帧局部放大图
    Figure  13.  Local zoom-in images of rotating reflectors under three frames

    在经过序列图像校准、幅度校准以及非相干相减后,我们可以检测到场景中的旋转角反。随后,以图12中第2帧为例,图14展示了提取到的感兴趣信号原始相位(黑线)和对应的解缠相位(红线)。可以发现,这两个解缠相位曲线表现出清晰的正弦形式且对称,即初相差接近于\pi ,这里2.2.2节的先验知识保持一致,验证了理论建模的正确性。此外,提取到的解缠相位并不是完全理想的正弦形状。这是因为提取到的感兴趣信号包含了处于同个距离单元的其他目标信号。尽管如此,这两个感兴趣信号的信杂比仍然是相当高的,其保证了后续重聚焦的性能。

    图  14  帧#2下两个旋转角反的感兴趣信号原始相位与解缠相位
    Figure  14.  Raw phases and unwrapped phases of signals of interests from two corner reflectors under frame #2

    基于上述步骤,最终重聚焦的旋转角反如图15所示。可以发现,长条状的散焦旋转角反被重聚焦成为两个点目标。这3帧图像的动态范围均被设置为30 dB。不难发现,第3帧中旋转角反成像结果中的散射强度较弱。这是因为随着飞机飞行,旋转角反逐渐远离雷达的波束覆盖区,导致信杂比降低。这是“掠过式”条带ViSAR的不足之处。紧接着,图16展示了第2帧角反成像结果的距离和方位剖面。可以发现,两者均形成良好的辛克形状,验证了所提方法的重聚焦性能。

    图  15  3帧下重构的旋转角反
    Figure  15.  Reconstructed rotating corner reflectors under three frames
    图  16  补偿后旋转角反的距离与方位剖面图
    Figure  16.  Range and azimuth profiles of the rotating corner reflector after compensation.

    为了进一步验证所提方法可行的潜在原因,图17展示了在连续3帧子孔径下对旋转角反进行补偿前后的时频图。显示的动态范围限制在40 dB,并且以对数形式展示。图中正弦状时频代表的是旋转角反的旋转运动,其余零频附近的时频分量代表的是场景中的静止目标。可以发现静止场景所占的时频小于2100 Hz。并且相比于静止场景的时频,旋转角反的时频展现出形状与强度上的明显差异。基于自相关处理与时频峰值,可以推算出旋转角反的旋转半径与转速分别约为0.32 m和120 r/min,与理论值吻合。因此,可计算得到旋转角反的最大多普勒约为5500 Hz,即此时没有造成多普勒模糊。随后,每帧中单个角反转动角度可计算得到约为144°。最后,对比补偿前后的时频。可以发现正弦状的时频被较好补偿,并且还原到静止目标所处的频谱区域。因而,旋转角反的成像已完成,验证了所提方法的有效性。

    图  17  旋转角反成像补偿前后的时频图
    Figure  17.  Time-frequency images of rotating corner reflectors before and after compensation

    本节首先讨论太赫兹ViSAR的高帧率与抗干扰应用的关系。对于ViSAR而言,其两个主要优势体现在于:动态的态势感知能力和慢速运动目标检测能力。而从抗干扰应用的角度来看,ViSAR的高帧率有一定的必要性,但并非帧率越高就一定越好,需要综合多方面因素来考虑。其优势在于,(1)快速识别干扰变化;高帧率意味着单位时间内能够获取更多的图像帧,对于干扰信号的变化能够更快速地捕捉和识别;(2)准确分析干扰特征;通过连续的高帧率图像帧,可以对干扰信号的特征进行更准确的分析;(3)便于区分目标和干扰;对于运动目标的追踪和识别,高帧率可以提供更丰富的目标运动信息,从而更容易将目标与干扰信号区分开来。尽管如此,高帧率也可能会带来数据处理与传输压力;在抗干扰应用中,如果数据处理和传输的速度跟不上帧率的要求,就可能导致数据的积压和丢失,影响抗干扰系统的实时性和有效性。而且,处理大量的数据也需要更强大的计算资源和更高的能耗,这对于一些资源有限的平台(如小型无人机等)来说可能是一个挑战。

    此外,在前面的成像体制中,我们都是假设其为零或小斜视情况的条带模式。针对弹载的大斜视甚至前视体制[32],太赫兹ViSAR是否能用于大斜视与前视成像,性能如何,仍然是值得探索验证的有趣问题。如若可行,其将在近炸引信等方面产生新的技术手段,值得未来着重研究。

    本文对太赫兹ViSAR下典型无源干扰物成像方法进行了探索,展示了太赫兹频段的抗干扰性,并完成了该频段下对无源干扰物的机载实验验证。基于太赫兹雷达系统,设计了太赫兹ViSAR下的孔径划分方法,确定了成像分辨率表征。随后根据运动状态,将无源干扰物分为静止与运动两类。对于诸如角反阵、伪装网等静止无源干扰物,给出其成像方法和成像特性分析,表明了太赫兹频段下部分目标的表面将从“光滑”变为“粗糙”。运动无源干扰物以旋转角反为例,首先分析压制性干扰成像特性,随后利用经过图像和幅度校准的序列图像进行图像域的目标检测,并通过特显点提取并解缠感兴趣信号相位,最后完成非参的旋转目标重聚焦。所提太赫兹ViSAR在无源干扰物的成像方法的有效性已通过太赫兹频段机载外场实验验证。对于未来工作,我们将考虑太赫兹雷达进行大斜视乃至前视的无源干扰物成像,这一工作目前也正在进行中。

  • 图  1  频率捷变波形示意图

    Figure  1.  Schematic diagram of the frequency agility waveform

    图  2  MDP的随机独立性与强化学习的优化目标

    Figure  2.  The random independence of MDP and the optimization objectives of reinforcement learning

    图  3  DQN网络参数的更新过程

    Figure  3.  The network parameter update process of DQN

    图  4  全连接神经网络结构示意图

    Figure  4.  The schematic diagram of fully connected neural network structure

    图  5  脉内侦干策略

    Figure  5.  The intra-pulse interception-jamming strategy

    图  6  脉间侦干策略

    Figure  6.  The pulse-to-pulse interception-jamming strategy

    图  7  脉内侦干策略的子脉冲频点决策训练结果

    Figure  7.  The training results of sub-pulse frequency decision for the intra-pulse interception-jamming strategy

    图  8  训练用CPI数量对脉内侦干策略下对抗成功率的影响

    Figure  8.  The impact of the number of CPI used for training on the success rate of confrontation for the intra-pulse interception-jamming strategy

    图  9  雷达与干扰对抗4个PRT的策略及对抗奖励

    Figure  9.  The strategies and rewards for radar anti-jamming during four PRT periods

    图  10  雷达执行最优策略的时频图及一维距离像

    Figure  10.  The time-frequency map and the one-dimensional High-Resolution Range Profile (HRRP) for radar executing optimal strategy

    图  11  脉间侦干策略的子脉冲频点决策训练结果

    Figure  11.  The training results of sub-pulse frequency decision for the pulse-to-pulse interception-jamming strategy

    图  12  训练用CPI数量对脉间侦干策略对抗成功率的影响

    Figure  12.  The impact of the number of CPI used for training on the success rate of confrontation for the pulse-to-pulse interception-jamming strategy

    图  13  对抗3个侦干周期的雷达策略及对抗奖励

    Figure  13.  The strategies and rewards for radar anti-jamming during three interception-jamming periods

    1  基于深度Q网络的雷达子脉冲频点决策

    1.   Radar sub-pulse frequency decision based on Deep Q-Network (DQN)

     Step 1:初始化:
      Step 1-1:使用随机参数\theta 初始化估计值{\text{Q}}网络
      Step 1-2:使用参数{\theta ^ - }{\text{=}}\theta 初始化目标值 {{\hat {\rm Q}}} 网络
      Step 1-3:初始化经验池D
      Step 1-4:初始化干扰策略,雷达子脉冲数量及频点,折扣因
      子\gamma ,学习率\alpha ,贪婪因子\varepsilon ,软间隔更新系数\tau 等参数
     Step 2:每幕:
     Step 2-1:设置初始状态 {s_1} = \left[ {{f_{{\mathrm{R}},0}},{f_{{\mathrm{J}},1}}} \right]
     Step 2-2:每个时间步:
      Step 2-2-1:使用\varepsilon -贪婪原则依据估计值网络的输出结果选择
      各子脉冲频点 {a_t} = {f_{{\mathrm{R}},t}} = \left[ {{f_{{\mathrm{sub}}1,t}},{f_{{\mathrm{sub}}2,t}}, \cdots ,{f_{{\mathrm{sub}}N,t}}} \right] ,即以
      1 - \varepsilon 概率选择估计值网络输出的最佳的频点或者以\varepsilon 概率随
      机选择频点
      Step 2-2-2:雷达发射子脉冲频率捷变波形,接收到回波后,感
      知得到下一时刻状态 {s_{t + 1}} 并根据目标检测结果和脉压后的信
      干噪比评估当前时刻奖励{r_t}
      Step 2-2-3:将\left( {{s_t},{a_t},{r_t},s{}_{t + 1}} \right)存储到经验池D中,如果经验池
      中的样本数超出预定数量,则删除早期训练样本数据,以便存
      储并使用最新样本数据
      Step 2-2-4:如果经验池D中保存数量超过起始值,则从D中选
      择批大小(batchsize)个样本作为训练集输入到估计值和目标值
      网络中,分别计算得到 Q\left( {{s_t},{a_t};\theta } \right) y = {r_t} + \gamma \max \hat Q ( {s_{t + 1}},
      a_{t + 1}';{\theta ^ - } ) ,并反向梯度求导使误差函数L\left( \theta \right) = \left[ y - Q\left( {s_t},{a_t}; \right.\right.
       \left. \left.\theta \right) \right]^2 趋近0,更新估计值网络参数\theta
      Step 2-2-5:每隔一定的时间步软更新目标值网络参数{\theta ^ - }
     Step 2-3:结束该时间步
     Step 2-4:降低贪婪概率\varepsilon
     Step 3:结束该幕
    下载: 导出CSV

    表  1  频率捷变信号参数设置

    Table  1.   The parameter settings of frequency agile signal

    参数 数值
    子脉冲调制类型 LFM
    子脉冲个数 3
    子脉冲频点 [10 MHz, 30 MHz, 50 MHz]
    子脉冲脉宽 5 μs
    子脉冲带宽 5 MHz
    信噪比 0 dB
    下载: 导出CSV

    表  2  干扰参数设置

    Table  2.   The parameter settings of jamming

    干扰类型 参数 数值
    窄带瞄频 瞄准频点 [10 MHz, 30 MHz, 50 MHz]
    带宽 10 MHz
    干噪比 35 dB
    宽带阻塞 带宽 120 MHz
    干噪比 30 dB
    下载: 导出CSV

    表  3  DQN参数设置

    Table  3.   The parameter settings of DQN

    参数 数值
    批大小 64
    学习率 0.001
    折扣因子 0.99
    缓冲区大小 10000
    起始训练样本量 64
    贪婪因子衰减系数 0.2
    32个时间步
    目标值网络更新周期 4个时间步
    目标值网络软间隔更新系数 0.01
    隐藏层数量 2
    隐藏层神经元个数 64
    归一化系数 80
    下载: 导出CSV

    表  4  脉内侦干策略的对抗成功率(%)

    Table  4.   The success rate of confrontation for the intra-pulse interception-jamming strategy (%)

    策略PRT对抗成功率CPI对抗成功率
    随机频点9.70
    PPO949
    DQN100100
    下载: 导出CSV

    表  5  脉内侦干策略下各种雷达策略对抗1000次结果(fJ=fsub1)

    Table  5.   The results of 1000 confrontations with various radar strategies for the intra-pulse interception-jamming strategy (fJ=fsub1)

    雷达频点选择 目标检测率(%) 信干噪比(dB) 平均得分
    [1,1,1] 0 –3.00
    [1,1,2] 0 11.09 –1.12
    [1,1,3] 0 12.25 –0.96
    [1,2,2] 97.6 15.20 1.09
    [1,2,3] 81.7 12.78 0.78
    [1,3,3] 99.7 16.06 1.19
    [2,1,1] 98.3 15.35 1.12
    [2,1,3] 75.6 12.47 0.64
    [2,3,3] 97.7 15.19 1.10
    [3,1,1] 99.6 16.07 1.18
    注:综合考虑噪声随机性引起的得分波动情况,加粗项为最优策略
    下载: 导出CSV

    表  6  脉间侦干策略的对抗成功率(%)

    Table  6.   The success rate of confrontation for the pulse-to-pulse interception-jamming strategy (%)

    策略 PRT对抗成功率 CPI对抗成功率
    随机频点 0.7 0
    PPO 93.6 31
    DQN 100 100
    下载: 导出CSV

    表  7  脉间侦干策略下各种雷达策略对抗1000次的结果(fJ=1)

    Table  7.   The results of 1000 confrontations with various radar strategies for the pulse-to-pulse interception-jamming strategy (fJ=1)

    雷达频点选择 目标检测率(%) 信干噪比(dB) 平均得分
    [1,1,1] 0 –3.00
    [1,2,3] 81.3 12.74 0.76
    [2,2,2] 99.7 17.08 3.17
    [3,3,3] 100 17.58 3.22
    注:加粗项表示最优策略
    下载: 导出CSV
  • [1] 李永祯, 黄大通, 邢世其, 等. 合成孔径雷达干扰技术研究综述[J]. 雷达学报, 2020, 9(5): 753–764. doi: 10.12000/JR20087.

    LI Yongzhen, HUANG Datong, XING Shiqi, et al. A review of synthetic aperture radar jamming technique[J]. Journal of Radars, 2020, 9(5): 753–764. doi: 10.12000/JR20087.
    [2] 崔国龙, 余显祥, 魏文强, 等. 认知智能雷达抗干扰技术综述与展望[J]. 雷达学报, 2022, 11(6): 974–1002. doi: 10.12000/JR22191.

    CUI Guolong, YU Xianxiang, WEI Wenqiang, et al. An overview of antijamming methods and future works on cognitive intelligent radar[J]. Journal of Radars, 2022, 11(6): 974–1002. doi: 10.12000/JR22191.
    [3] 李康. 雷达智能抗干扰策略学习方法研究[D]. [博士论文], 西安电子科技大学, 2021. doi: 10.27389/d.cnki.gxadu.2021.003098.

    LI Kang. Research on radar intelligent antijamming strategy learning method[D]. [Ph.D. dissertation], Xidian University, 2021. doi: 10.27389/d.cnki.gxadu.2021.003098.
    [4] JIANG Wangkui, LI Yan, LIAO Mengmeng, et al. An improved LPI radar waveform recognition framework with LDC-Unet and SSR-Loss[J]. IEEE Signal Processing Letters, 2022, 29: 149–153. doi: 10.1109/LSP.2021.3130797.
    [5] GARMATYUK D S and NARAYANAN R M. ECCM capabilities of an ultrawideband bandlimited random noise imaging radar[J]. IEEE Transactions on Aerospace and Electronic Systems, 2002, 38(4): 1243–1255. doi: 10.1109/TAES.2002.1145747.
    [6] GOVONI M A, LI Hongbin, and KOSINSKI J A. Low probability of interception of an advanced noise radar waveform with linear-FM[J]. IEEE Transactions on Aerospace and Electronic Systems, 2013, 49(2): 1351–1356. doi: 10.1109/TAES.2013.6494419.
    [7] CUI Guolong, JI Hongmin, CAROTENUTO V, et al. An adaptive sequential estimation algorithm for velocity jamming suppression[J]. Signal Processing, 2017, 134: 70–75. doi: 10.1016/j.sigpro.2016.11.012.
    [8] YU K B and MURROW D J. Adaptive digital beamforming for angle estimation in jamming[J]. IEEE Transactions on Aerospace and Electronic Systems, 2001, 37(2): 508–523. doi: 10.1109/7.937465.
    [9] DAI Huanyao, WANG Xuesong, LI Yongzhen, et al. Main-lobe jamming suppression method of using spatial polarization characteristics of antennas[J]. IEEE Transactions on Aerospace and Electronic Systems, 2012, 48(3): 2167–2179. doi: 10.1109/TAES.2012.6237586.
    [10] 鲍秋香. 频率随机捷变雷达抗扫频干扰性能仿真[J]. 舰船电子对抗, 2021, 44(5): 78–81. doi: 10.16426/j.cnki.jcdzdk.2021.05.017.

    BAO Qiuxiang. Simulation of anti-sweep jamming performance of frequency random agility radar[J]. Shipboard Electronic Countermeasure, 2021, 44(5): 78–81. doi: 10.16426/j.cnki.jcdzdk.2021.05.017.
    [11] 全英汇, 方文, 沙明辉, 等. 频率捷变雷达波形对抗技术现状与展望[J]. 系统工程与电子技术, 2021, 43(11): 3126–3136. doi: 10.12305/j.issn.1001-506X.2021.11.11.

    QUAN Yinghui, FANG Wen, SHA Minghui, et al. Present situation and prospects of frequency agility radar wave form countermeasures[J]. Systems Engineering and Electronics, 2021, 43(11): 3126–3136. doi: 10.12305/j.issn.1001-506X.2021.11.11.
    [12] MINSKY M. Steps toward artificial intelligence[J]. Proceedings of the IRE, 1961, 49(1): 8–30. doi: 10.1109/JRPROC.1961.287775.
    [13] ARULKUMARAN K, DEISENROTH M P, BRUNDAGE M, et al. Deep reinforcement learning: A brief survey[J]. IEEE Signal Processing Magazine, 2017, 34(6): 26–38. doi: 10.1109/MSP.2017.2743240.
    [14] JIANG Wen, REN Yihui, and WANG Yanping. Improving anti-jamming decision-making strategies for cognitive radar via multi-agent deep reinforcement learning[J]. Digital Signal Processing, 2023, 135: 103952. doi: 10.1016/j.dsp.2023.103952.
    [15] JIANG Wen, WANG Yanping, LI Yang, et al. An intelligent anti-jamming decision-making method based on deep reinforcement learning for cognitive radar[C]. 2023 26th International Conference on Computer Supported Cooperative Work in Design (CSCWD), Rio de Janeiro, Brazil, 2023: 1662–1666. doi: 10.1109/CSCWD57460.2023.10152833.
    [16] WEI Jingjing, WEI Yinsheng, YU Lei, et al. Radar anti-jamming decision-making method based on DDPG-MADDPG algorithm[J]. Remote Sensing, 2023, 15(16): 4046. doi: 10.3390/rs15164046.
    [17] AZIZ M M, MAUD A, and HABIB A. Reinforcement learning based techniques for radar anti-jamming[C]. 2021 International Bhurban Conference on Applied Sciences and Technologies (IBCAST), Islamabad, Pakistan, 2021: 1021–1025. doi: 10.1109/IBCAST51254.2021.9393209.
    [18] LI Kang, JIU Bo, LIU Hongwei, et al. Reinforcement learning based anti-jamming frequency hopping strategies design for cognitive radar[C]. 2018 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC), Qingdao, China, 2018: 1–5. doi: 10.1109/ICSPCC.2018.8567751.
    [19] LI Kang, JIU Bo, and LIU Hongwei. Deep Q-network based anti-jamming strategy design for frequency agile radar[C]. 2019 International Radar Conference (RADAR), Toulon, France, 2019: 1–5. doi: 10.1109/RADAR41533.2019.171227.
    [20] LI Kang, JIU Bo, WANG Penghui, et al. Radar active antagonism through deep reinforcement learning: A way to address the challenge of mainlobe jamming[J]. Signal Processing, 2021, 186: 108130. doi: 10.1016/j.sigpro.2021.108130.
    [21] WU Qinhao, WANG Hongqiang, LI Xiang, et al. Reinforcement learning-based anti-jamming in networked UAV radar systems[J]. Applied Sciences, 2019, 9(23): 5173. doi: 10.3390/app9235173.
    [22] AK S and BRÜGGENWIRTH S. Avoiding jammers: A reinforcement learning approach[C]. 2020 IEEE International Radar Conference (RADAR), Washington, USA, 2020: 321–326. doi: 10.1109/RADAR42522.2020.9114797.
    [23] AILIYA, YI Wei, and YUAN Ye. Reinforcement learning-based joint adaptive frequency hopping and pulse-width allocation for radar anti-jamming[C]. 2020 IEEE Radar Conference (RadarConf20), Florence, Italy, 2020: 1–6. doi: 10.1109/RadarConf2043947.2020.9266402.
    [24] ZHANG Jiaxiang and ZHOU Chao. Interrupted sampling repeater jamming suppression method based on hybrid modulated radar signal[C]. 2019 IEEE International Conference on Signal, Information and Data Processing (ICSIDP), Chongqing, China, 2019: 1–4. doi: 10.1109/ICSIDP47821.2019.9173093.
  • 加载中
图(13) / 表(8)
计量
  • 文章访问数: 1039
  • HTML全文浏览量: 302
  • PDF下载量: 321
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-10-10
  • 修回日期:  2024-01-03
  • 网络出版日期:  2024-01-11
  • 刊出日期:  2024-02-28

目录

/

返回文章
返回