Loading [MathJax]/jax/output/SVG/jax.js

伴随压制干扰与组网雷达功率分配的深度博弈研究

王跃东 顾以静 梁彦 王增福 张会霞

时晨光, 董璟, 周建江. 频谱共存下面向多目标跟踪的组网雷达功率时间联合优化算法[J]. 雷达学报, 2023, 12(3): 590–601. doi: 10.12000/JR22146
引用本文: 王跃东, 顾以静, 梁彦, 等. 伴随压制干扰与组网雷达功率分配的深度博弈研究[J]. 雷达学报, 2023, 12(3): 642–656. doi: 10.12000/JR23023
SHI Chenguang, DONG Jing, and ZHOU Jianjiang. Joint transmit power and dwell time allocation for multitarget tracking in radar networks under spectral coexistence[J]. Journal of Radars, 2023, 12(3): 590–601. doi: 10.12000/JR22146
Citation: WANG Yuedong, GU Yijing, LIANG Yan, et al. Deep game of escorting suppressive jamming and networked radar power allocation[J]. Journal of Radars, 2023, 12(3): 642–656. doi: 10.12000/JR23023

伴随压制干扰与组网雷达功率分配的深度博弈研究

DOI: 10.12000/JR23023
基金项目: 国家自然科学基金(61873205)
详细信息
    作者简介:

    王跃东,博士生,主要研究方向为传感器管理、目标跟踪、深度强化学习等

    顾以静,硕士生,主要研究方向为雷达资源调度、深度强化学习等

    梁 彦,博士,教授,主要研究方向为多源信息融合,复杂系统建模、估计与控制等

    王增福,博士,副教授,主要研究方向为天波雷达数据处理、信息融合、传感器管理等

    张会霞,博士生,主要研究方向为集群意图推理识别、智能体控制等

    通讯作者:

    梁彦 liangyan@nwpu.edu.cn

  • 责任主编:易伟 Corresponding Editor: YI Wei
  • 中图分类号: TN974

Deep Game of Escorting Suppressive Jamming and Networked Radar Power Allocation

Funds: The National Natural Science Foundation of China (61873205)
More Information
  • 摘要: 传统的组网雷达功率分配一般在干扰模型给定的情况下进行优化,而干扰机资源优化是在雷达功率分配方式给定情况下,这样的研究缺乏博弈和交互。考虑到日益严重的雷达和干扰机相互博弈的作战场景,该文提出了伴随压制干扰下组网雷达功率分配深度博弈问题,其中智能化的目标压制干扰采用深度强化学习(DRL)训练。首先在该问题中干扰机和组网雷达被映射为两个智能体,根据干扰模型和雷达检测模型建立了压制干扰下组网雷达的目标检测模型和最大化目标检测概率优化目标函数。在组网雷达智能体方面,由近端策略优化(PPO)策略网络生成雷达功率分配向量;在干扰机智能体方面,设计了混合策略网络来同时生成波束选择动作和功率分配动作;引入领域知识构建更加有效的奖励函数,目标检测模型、等功率分配策略和贪婪干扰功率分配策略3种领域知识分别用于生成组网雷达智能体和干扰机智能体的导向奖励,从而提高智能体的学习效率和性能。最后采用交替训练方法来学习两个智能体的策略网络参数。实验结果表明;当干扰机采用基于DRL的资源分配策略时,采用基于DRL的组网雷达功率分配在目标检测概率和运行速度两种指标上明显优于基于粒子群的组网雷达功率分配和基于人工鱼群的组网雷达功率分配。

     

  • 当前,空战逐渐由信息化向智能化过渡,通过多雷达协同能够提高空天目标的预警探测能力与情报保障能力,特别是能够提高复杂战场条件下对非合作特种军用目标的连续探测跟踪能力,已成为国内外研究人员的共识。与此同时,随着军事装备技术的飞速发展,多雷达协同的作战环境也变得越来越复杂,电磁频谱环境的复杂性、时变性以及难以预测性,对雷达系统提出了严峻挑战。如何让雷达系统在与通信基站共享同一工作频段的条件下,通过优化自身的射频辐射资源配置以提升其探测跟踪性能,已经成为一个热点问题[1-7]

    对于共享频谱的雷达和通信系统,需要设计有效的管理方案来减少两者间的相互干扰,从而保证彼此都能正常工作[8-18]。针对该问题,Zheng等人[9]提出了一种非合作雷达/通信共存的自适应干扰消除方法,优先考虑保护通信系统性能,并通过求解凸问题对雷达参数和通信解调误差进行估计,仿真结果验证了算法的有效性与优越性。鲁彦希[10]以雷达对通信系统的干扰能量为约束条件,对组网雷达节点选择与功率参数进行自适应优化设计。文献[11]提出了用于多雷达系统中多目标跟踪的通信感知资源调度策略,考虑在最小化雷达对通信干扰的同时,对雷达发射功率和采样间隔进行优化分配,仿真结果表明,该算法能够有效提高系统多目标跟踪性能。文献[12]针对异构雷达与通信系统之间的频谱共存问题,通过分配有限的发射功率、驻留时间和共享带宽资源,来提高组网雷达的跟踪性能,同时保持通信下行链路的吞吐量水平。文献[13]对通信系统传输协方差矩阵以及基于稀疏感知和矩阵补全的多输入多输出(Multi-Input Multi-Output, MIMO)雷达采样方案进行联合设计,旨在保持通信系统的平均容量和发射功率的同时,最大限度地降低雷达接收机处的有效干扰功率。Hessar等人[14]采用具有低复杂度的空频域隔离机制,并结合具体的雷达通信系统操作策略解决频谱共存问题。韩凯峰等人[15]提出了一种雷达通信频谱共存场景下基于块对角化的通信雷达波束设计方案,该方案以通信对雷达无干扰及通信用户间无干扰为约束,在满足功率资源约束的条件下,最大化通信系统和速率。仿真结果表明,所提算法适用于多种场景,且与现有算法相比,具有更低的计算复杂度和更好的通信性能。文献[16]针对多雷达通信一体化系统相互干扰的问题,提出了基于正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)子载波分配的雷达通信一体化系统,利用子载波间的互相正交性,消除雷达与通信用户间干扰以及通信用户之间的相互干扰。文献[17]提出了频谱共存下基于Stackelberg博弈的多基地分布式雷达功率分配算法,在满足预先设定的目标探测信干噪比阈值的情况下,最小化各雷达辐射功率,从而起到保护通信基站不受雷达射频辐射干扰。

    组网雷达具有多雷达探测资源协同运用与信息融合紧密结合的技术体制特点,且在目标检测、跟踪、识别等诸多场景中均具有显著优势[19]。射频资源管理是组网雷达目标跟踪任务中重要的一环,通过对辐射功率、驻留时间、信号带宽和辐射采样间隔等射频参数进行优化,能够有效提升雷达系统性能[20-35]。Zhang等人[20]对杂波环境下分布式MIMO雷达多目标跟踪的资源分配问题进行了研究,通过对雷达节点和功率资源进行自适应优化配置,最小化多目标跟踪误差,并提出了次优解排序方法对该优化模型进行求解。Lu等人[21]提出了一种机载雷达路径规划与辐射资源联合优化算法,该算法将机载雷达路径规划和辐射资源作为优化参数,并采用多目标跟踪误差效用函数作为优化目标,采用多步分解法和梯度投影法对该问题进行求解,仿真结果表明,该算法有效提升了雷达系统多目标跟踪性能。文献[22]提出了面向低截获概率的机载雷达功率资源分配算法,该算法以包含雷达多目标跟踪误差和截获概率的加权为目标函数,并采用两步分解法对模型进行求解。仿真结果表明,该算法能够有效降低跟踪过程中雷达被敌方无源探测系统截获的概率。文献[23]提出了一种多目标跟踪场景下的相控阵雷达最优资源分配算法,该算法以多目标跟踪性能作为约束条件,以最小化雷达资源消耗为优化目标,对雷达的功率和带宽参数进行联合优化分配。Cheng等人[24]提出了同时多波束集中式MIMO雷达自适应时空资源与波形联合优化算法,该算法采用智能优化方法对雷达采样周期、发射能量、子阵列数和多波束方向矢量等多个参数进行联合优化设计,能够自适应选择工作模式,从而在最大化目标跟踪精度的同时,达到最小化雷达资源消耗的目的。文献[25]以最小化雷达驻留时间和辐射功率资源加权和为优化目标,结合内点法和匈牙利算法对雷达节点分配方式、辐射功率和驻留时间进行优化,仿真结果表明,相较于资源均匀分配算法,该算法能够有效提升雷达系统的射频隐身性能。文献[26]对多基地雷达之间的博弈优化模型进行分析,将预先设定的信干噪比阈值作为约束条件,结合凸优化方法和博弈思想,对多基地雷达功率分配和波束形成进行联合优化,仿真结果验证了该算法对雷达间的干扰抑制能力。文献[27]提出了基于Stackelberg博弈的组网雷达功率分配算法,该算法旨在最小化功率消耗的同时最优化目标跟踪精度,仿真结果表明,该算法能够有效提高雷达系统的资源利用率。严俊坤等人[28]提出了基于机会约束的集中式MIMO雷达功率分配算法,该算法以MIMO雷达高概率满足多目标跟踪精度为约束条件,以最小化MIMO雷达的发射功率为优化目标,并采用凸优化方法对优化模型进行求解。文献[29]提出了分布式MIMO雷达多目标跟踪接收波束资源分配算法,该算法能够基于跟踪周期中的反馈信息,采用内点法实现接收波束与目标之间的最优分配。

    综上所述,上述研究成果为优化组网雷达目标跟踪性能和解决雷达通信频谱共存问题奠定了坚实的基础。然而,针对多目标跟踪场景,文献[10,11]等已有研究并未充分考虑雷达通信频谱共存环境下组网雷达功率时间资源的联合优化配置,解决该问题对于提升我方雷达探测系统的目标跟踪精度、射频资源利用率及对敌作战效能具有重要意义。因此,本文围绕多目标跟踪场景下雷达通信频谱共存和组网雷达辐射资源管理领域,研究了频谱共存下面向多目标跟踪的组网雷达射频资源联合优化分配问题。首先,由于各优化参数的约束不同,采用发射能量作为优化参数的算法复杂度较高,因此针对频谱共存环境下多目标跟踪问题,建立了组网雷达功率时间资源联合优化模型,以最小化多目标跟踪贝叶斯克拉默-拉奥下界(Bayesian Cramér-Rao Lower Bound, BCRLB)为优化目标,以给定的组网雷达射频资源和预先设定的通信基站最大可容忍干扰能量阈值为约束条件,通过联合优化雷达节点选择、发射功率和驻留时间等射频辐射参数,提升组网雷达的多目标跟踪精度。仿真结果验证了本文所提算法的可行性和稳健性。

    考虑一个由N部雷达组成的组网雷达系统,各雷达节点分散部署于二维直角坐标系中,并保持时间、空间、频率同步。第n部雷达的位置坐标可以表示为xR,n=(xR,n,yR,n), n=1,2,,N。另外,假设组网雷达系统的探测范围内存在Q个运动目标和C个通信基站。

    定义目标qk时刻的状态向量为Xqk=[xqk,yqk,vqx,k,vqy,k]T,其中,(xqk,yqk)(vqx,k,vqy,k)分别表示k时刻目标q的位置和速度。假设目标均做匀速直线运动,则其状态方程可以表示为[25]

    Xqk=FXqk1+W (1)

    式中,F=[1ΔT001]I2表示目标q的状态转移矩阵;ΔT0表示雷达采样间隔;表示克罗内克积;I2表示2阶单位矩阵;W表示高斯过程白噪声且均值为零,其协方差矩阵Uq可以表示为

    Uq=rqI2[(ΔT0)33(ΔT0)22(ΔT0)22ΔT0] (2)

    式中,rq表示过程噪声强度。

    假设各个时刻每部雷达最多可跟踪一个目标。为方便起见,定义雷达节点选择二元变量αqn,k{0,1},其中,αqn,k=1表示k时刻雷达n对目标q进行照射跟踪;αqn,k=0表示k时刻雷达n未对目标q进行照射跟踪。因此,k时刻雷达n对目标q的量测模型可以表示为[25]

    Zqn,k={H(Xqk)+Vqn,k, αqn,k=1,αqn,k=0 (3)

    式中,Zqn,k表示k时刻雷达n对目标q的量测矢量,即k时刻雷达n关于目标q距离和方位角的量测值;H(Xqk)表示非线性转移函数,可以计算为

    H(Xqk)=[Rqn.kφqn,k]=[(xqkxR,n)2+(yqkyR,n)2arctan2(yqkyR,n,xqkxR,n)] (4)

    式中,Rqn,kφqn,k分别表示k时刻目标q相对于雷达n的距离和方位角;Vqn,k表示k时刻雷达n关于目标q的量测噪声矢量,服从零均值、方差为Ωqn,k的高斯分布,其方差Ωqn,k可以表示为

    Ωqn,k=Ψn,k+[c2(4π)2β2SNRqn,k003λ2π2γ2SNRqn,k] (5)

    式中,Ψn,k=Re[2Pqn,k(Mqn,k)H(Ln)1Mqn,k]1表示通信基站对雷达n施加的量测干扰噪声协方差矩阵,其中,

    Mqn,k=[u(Rqn,k)Rqn,kv(φqn,k)u(Rqn,k)v(φqn,k)v(φqn,k)]T

    ()T表示矩阵转置运算;u(Rqn,k)表示雷达n的发射波形序列;v(φqn,k)表示雷达n的半波长导向矢量;β表示雷达发射信号带宽;λγ分别表示雷达波长和天线孔径;SNRqn,kk时刻雷达n对目标q的回波信噪比,可以计算为

    SNRqn,k=Tqn,kTrPqn,kGtGrσqnλ2GRP(4π)3kToBFr(Rqn)4exp(4ln(2)(˜αqn,k)2θ23dB) (6)

    式中,Tqn,kPqn,k分别表示k时刻雷达n跟踪目标q的驻留时间和发射功率;GtGr分别表示雷达发射天线增益和接收天线增益;σqn表示目标q相对于雷达n的雷达散射截面(Radar Cross Section, RCS);GRP表示雷达接收机处理增益;Tr表示脉冲重复周期;k为玻尔兹曼常量;To表示雷达接收机噪声温度;B表示雷达接收机匹配滤波器带宽;Fr表示雷达接收机噪声系数;˜αqn,k表示k时刻目标q的真实方位角与雷达n发射波束指向之间的角度差;θ3dB表示雷达3 dB天线波束宽度。

    通信基站在一定频带范围内持续性向外辐射电磁信号,会使雷达系统的探测跟踪性能下降。另外,在频谱共存环境下,雷达在执行目标探测跟踪任务时也会对通信基站的正常工作造成负面影响。因此,本节对雷达和通信基站两者的相互干扰进行分析。首先,考虑通信基站对雷达的干扰,此类干扰可以看作多种随机调制信号的组合。根据中心极限定理,假设信号形式可近似表示为占据一定带宽的循环对称带限的复高斯序列,该信号的功率谱密度(Power Spectral Density, PSD)在雷达的工作通带范围内表现出了均匀特性[36],即

    δm,n(f)={Nm,n,fL,m,nffU,m,n0, (7)

    式中,Nm,n表示信号PSD强度;fU,m,nfL,m,n分别表示第m个通信基站和第n部雷达共同覆盖频带的上界和下界。定义第m个通信基站对第n部雷达产生的干扰信号的时域协方差矩阵Ξm,n可以表示为[10]

    [Ξm,n]u,v=Nm,n{fU,m,nfL,m,n,u=vej2πTsfU,m,n(uv)ej2πTsfL,m,n(uv)j2πTs(uv),uv (8)

    式中,Ξm,n的第u行第v列的元素为对应信号延时的自相关函数,同时也是通信基站信号PSD的离散时间傅里叶逆变换;Ts表示信号采样周期。考虑到距离衰减等因素影响,第m个通信基站对第n部雷达施加的干扰噪声为

    em,n=χm,nˉem,nv(θnm)xC,mxR,n2 (9)

    式中,χm,n表示传输信道的强度系数;ˉem,n表示第m个通信基站在第n部雷达频带范围产生的干扰序列;θnm表示通信基站m相对于雷达n的方位角。假设各通信基站的发射信号相互正交,则所有通信基站对雷达n的干扰时域协方差矩阵可以表示为

    Ln=Mm=1(χm,n)2{Ξm,n[v(θnm)vH(θnm)]}xC,mxR,n22 (10)

    式中,xC,m表示第m个通信基站的位置。由式(8)可知,(fU,m,nfL,m,n)值越大,则通信基站对雷达的干扰能量越强;如果第m个通信基站和第n部雷达在频谱上没有覆盖,则 fU,m,nfL,m,n=0,即可认为对应的干扰强度为0。

    雷达在跟踪运动目标时对通信基站的干扰是时变的,且与目标的运动状态有关。本文使用雷达发射信号能量的联合空频域分布来表征干扰强度,可以计算为

    E(αqn,k,Pqn,k,xC,m)=Qq=1Nn=1αqn,kPqn,kGqn(xC,m)sHnΦm,nsn (11)

    式中,sn=[sn(1),sn(2),,sn(L)]T表示具有有限间隔的雷达波形序列;Gqn(xC,m)表示雷达发射信号能量的空间分布[10],即

    Gqn(xC,m)=|Aa=0e(jπa[sin(θnmθnq)sin(θnqθ0q)])|2xC,mxR,n22 (12)

    式中,θnq表示雷达n对目标q的跟踪角度;θ0q表示目标q与初始位置之间的角度。于是,Φm,n可以表示为

    [Φm,n]u,v={fU,m,nfL,m,n,u=vej2πfU,m,n(uv)ej2πfL,m,n(uv)j2πTs(uv),uv (13)

    针对频谱共存环境下多目标跟踪资源分配问题,提出一种面向多目标跟踪的组网雷达功率时间联合优化分配算法,旨在满足给定雷达系统射频资源和预先设定的通信基站最大可容忍干扰能量阈值等约束的条件下,对雷达节点选择、发射功率和驻留时间等射频参数进行自适应优化配置,从而在保证通信基站正常工作的同时,有效提升组网雷达的多目标跟踪精度。

    在建立优化模型之前,需要推导表征目标跟踪精度衡量指标的解析表达式。文献[37]中指出,在参数无偏估计的条件下,BCRLB为运动目标跟踪的均方误差提供了下界,可以用来表征组网雷达跟踪运动目标的性能衡量指标。首先,推导出k时刻目标q的预测贝叶斯信息矩阵表达式为

    J(Xqk|k1)=[Uq+FJ1(Xqk|k1)FT]1+Nn=1αqn,k(Gqn,k|k1)T(Ωqn,k|k1)1Gqn,k|k1 (14)

    式中,Gqn,k|k1=[Xqk|k1(H(Xqk|k1))T]T表示k1时刻雷达n相对于目标的雅可比矩阵预测值;Xqk|k1表示对Xqk|k1求1阶偏导;Ωqn,k|k1为雷达发射功率Pqn,k和驻留时间Tqn,k的函数。因此,对式(14)求逆,即可得到多目标状态估计误差的预测BCRLB矩阵解析表达式,并采用预测BCRLB矩阵的迹作为表征目标跟踪精度的衡量指标:

    qk(Xqk|k1,αqk,Pqk,Tqk)=trace[(J(Xqk|k1)1)] (15)

    式中,trace()表示矩阵求迹运算;αqk表示雷达节点选择参数集合,PqkTqk分别表示雷达发射功率和驻留时间集合,即

    {αqk = [αq1,k,αq2,k,,αqn,k,,αqN,k]Pqk = [Pq1,k,Pq2,k,,Pqn,k,,PqN,k]Tqk = [Tq1,k,Tq2,k,,Tqn,k,,TqN,k] (16)

    本文提出了一种频谱共存下面向多目标跟踪的组网雷达功率时间联合优化算法,通过联合优化分配雷达节点选择、发射功率和驻留时间等射频辐射参数,在满足给定的雷达射频资源和预先设定的通信基站最大可容忍干扰能量阈值的条件下,最大限度地降低组网雷达系统的多目标跟踪误差,可构建如下数学优化模型:

    minαqk,Pqk,TqkQq=1qk(Xqk|k1,αqk,Pqk,Tqk)s.t.{{TminTqn,kTmax,αqn,k=1Tqn,k=0,αqn,k=0{PminPqn,kPmax,αqn,k=1Pqn,k=0,αqn,k=0Qq=1αqn,k1,αqn,k{0,1}Nn=1αqn,kmaxE(αqn,k,Pqn,k,xC,m)EmaxNn=1Tqn,k=TtotalNn=1Pqn,k=Ptotal (17)

    式中,TmaxTmin分别表示各雷达驻留时间的上界和下界;PmaxPmin分别表示各雷达发射功率的上界和下界;TtotalPtotal分别表示照射各目标的所有雷达驻留时间和发射功率之和;Emax表示通信基站所能容忍的最大雷达干扰能量阈值;Qq=1αqn,k1表示k时刻每部雷达最多可跟踪一个目标;max表示各时刻组网雷达跟踪目标q可选择的最多雷达节点数目。

    由于αqn,k是一个二元变量,优化模型(17)为含有雷达节点选择、发射功率和驻留时间3个变量的非凸、非线性优化问题[38]。本文结合半正定规划(Semi-Definite Programming, SDP)算法和循环最小化算法,提出了一种两步分解法对组网雷达的雷达节点选择、发射功率和驻留时间等射频辐射资源进行自适应联合优化配置。由于αqn,k是一个二元变量,且各优化参数在约束和目标函数中耦合,难以寻找最优的实时解决方案,因此,本文采用两步分解法,将原问题分解为多个子凸问题,并结合循环最小化算法,得到逼近原问题最优解的射频辐射资源配置方案次优解[20]。具体求解步骤如下:

    步骤1 首先,针对运动目标q,给定各雷达发射功率ˆPqn,k和驻留时间初始值ˆTqn,k,将αqn,k凸松弛为连续变量0αqn,k1。此时,优化模型(17)可简化为如下凸问题:

    minαqkqk(Xqk|k1,αqk)s.t.{Nn=1αqn,kmaxE(αqn,k,ˆPqn,k,xC,m)EmaxQq=1αqn,k1, αqn,k[0,1] (18)

    采用SDP算法对优化模型(18)进行求解,得到各个雷达节点的权重系数,并将其降序排列,选取其中权重系数较大的若干个雷达节点进行目标跟踪,可得到共(max1)种满足约束条件Nn=1ˉαqn,kmax的雷达节点选择方案。

    步骤2 令s=1, 2, , (max1),对于雷达节点选择方案s,设定选择的雷达节点权重系数ˉαqn,k,s=1,其余的雷达节点权重系数ˉαqn,k,s=0。此时,优化模型(17)可简化为包含雷达发射功率和驻留时间两个优化变量的凸问题:

    minPqk,s,Tqk,sqk,s(Xqk|k1,Pqk,Tqk)s.t.{TminTqn,k,sTmaxNn=1Tqn,k,s=TtotalE(ˉαqn,k,s,Pqn,k,s,xC,m)EmaxPminPqn,k,sPmaxNn=1Pqn,k,s=Ptotal (19)

    同样地,设定发射功率和驻留时间两个参数的优先级相同,采用SDP算法对优化模型(19)进行求解,得到所选择雷达节点的发射功率和驻留时间分配值,进而可以得到(max1)个射频资源配置方案及其对应的多目标跟踪误差。

    步骤3 选取步骤2所有方案中最小的多目标跟踪误差与其对应的射频资源优化分配方案作为备选方案,并将该资源优化分配结果作为下一次循环的初始值。跳转至步骤1,直到连续两次得到的备选方案多目标跟踪误差差值小于某一设定的阈值时,跳出循环,并将得到的优化分配方案作为k时刻跟踪目标q的最优雷达节点选择方案和功率时间优化分配方案。

    步骤4 确定下一个跟踪的目标,移除步骤3已选取的雷达节点,跳转至步骤1,直到对所有目标的跟踪方案都完成优化,即可得到k时刻组网雷达跟踪多目标时的雷达节点选择方案和功率时间联合优化分配方案。上述算法流程如算法1所示。

    算法 1 频谱共存下面向多目标跟踪的组网雷达功率时间
    联合优化算法求解流程
    Alg. 1 Solution flow of joint transmit power and dwell time allocation for multitarget tracking in radar networks
    under spectral coexistence
     初始化:(0)为给定常数,定义发射功率和驻留时间初始值
         ˆPqn,k, ˆTqn,k
     步骤1 选定运动目标q,求解SDP问题(18),求出k时刻雷达权重
     矢量αqk,获得(max1)种雷达节点选择备选方案。
     步骤2 对于 s=1,2,,(max1)
      1. 设定方案s选择的雷达节点权重系数ˉαqn,k,s=1,其余节点
        权重系数均初始化为0;
      2.求解SDP问题(19),得到雷达节点选择αqk,s、发射功率
        Pqk,s、驻留时间Tqk,s以及目标跟踪误差qk,s
     步骤3 选取步骤2所有方案中的最小跟踪误差qk及其对应雷达节
     点选择方案和资源分配方案作为备选方案;
      如果|qk(0)|εqk<(0):选取qk和其对应的雷达
      节点权重集合、发射功率集合和驻留时间集合作为k时刻跟踪
      目标q的资源分配方案;
      否则:(0)=min((0),qk),并保存其对应的雷达节点选
      择和资源分配方案,跳转至步骤1;
     步骤4 输出原问题(17)的最终雷达节点选择、发射功率、驻留时
     间结果αqk, Pqk, Tqk,并确定下一个跟踪目标,跳转至步骤1,直
     到所有的运动目标跟踪方案都完成优化。
    下载: 导出CSV 
    | 显示表格

    为了验证频谱共存下面向多目标跟踪的组网雷达功率时间联合优化算法的可行性与有效性,本节进行了如下仿真:假设组网雷达系统由N=6部位置固定且已知的雷达组成,各部雷达的系统参数均相同。组网雷达系统在k 时刻需要同时跟踪Q=2个目标,目标1的初始位置为[70,0] km,以速度[900, 400] m/s匀速飞行;目标2的初始位置为[70, 80] km,以速度[900,400] m/s匀速飞行。在组网雷达探测区域中存在C=2个通信基站,如图1所示,两个通信基站位置分别为[50, 50] km和[–40, 50] km。雷达采样间隔为ΔT=3 s,跟踪持续过程时间为150 s,共50帧。k时刻跟踪某一目标的雷达节点数目最大值max=3,通信基站最大可容忍干扰能量阈值为Emax=4.2 J。其中,组网雷达仿真参数设置如表1所示。本文针对RCS不变、RCS变化和Emax阈值变化3种仿真场景分别进行仿真。

    图  1  组网雷达布阵及多目标运动轨迹图
    Figure  1.  Deployment of radar networks and trajectories of multiple targets
    表  1  仿真参数设置
    Table  1.  Simulation parameter settings
    参数数值参数数值
    Gt36 dBβ1 MHz
    Gr35 dBFr3 dB
    GRP45k1.38×1023J/JKK
    Pmin100 WPmax600 W
    Tmin0.01 sTmax0.08 s
    Ptotal700 WTtotal0.1 s
    下载: 导出CSV 
    | 显示表格

    在该仿真场景中,假设雷达节点观测运动目标的RCS均为1 m2,组网雷达布阵及多目标运动轨迹如图1所示。

    图2给出了组网雷达跟踪目标1和目标2的节点选择和功率时间资源优化分配结果,黑色部分表示该雷达节点在相应帧未被赋予目标跟踪任务,即αqn,k=0;反之,则表示该雷达节点在相应帧被赋予目标跟踪任务,即αqn,k=1。从图2可以看出,组网雷达系统会优先选择距离目标较近的雷达节点进行跟踪,且各部雷达的发射功率和驻留时间分配情况均随着目标运动状态变化自适应进行调整。例如,前28帧组网雷达系统均选择了距离目标1更近的雷达1和雷达2进行跟踪,随着目标1逐渐远离雷达1而靠近雷达2,分配给雷达1的射频资源也在不断增加;对于目标2,前8帧组网雷达系统选择了距离目标2更近的雷达5和雷达6进行跟踪,并向与目标2距离变大的雷达6分配更多的射频资源。

    图  2  雷达节点选择与功率时间资源优化分配结果
    Figure  2.  Radar node selection and allocation results of power and dwell time resources

    同时,组网雷达系统的节点选择结果也受到通信基站最大可容忍干扰能量阈值的影响。例如,从第40帧开始,目标1与通信基站距离小,雷达对通信基站的干扰能量接近通信基站最大可容忍干扰能量阈值,导致每一帧都会选择不同的雷达节点对目标1进行跟踪。同样地,对于目标2,从第9帧开始,组网雷达系统选择对通信基站干扰较弱的雷达3替代雷达5对目标2进行跟踪。

    为了进一步验证本文所提算法的优越性,将所提算法的多目标跟踪误差与其他4种对比算法进行比较。

    (1) 无通信干扰算法。该算法不考虑通信基站与组网雷达之间的相互干扰,采用本文所提两步分解求解方法对组网雷达节点选择、发射功率和驻留时间等射频辐射参数进行优化配置。

    (2) 随机节点选择算法。该算法对各时刻跟踪目标的雷达节点进行随机选择,并采用本文所提求解方法对选择的雷达进行发射功率和驻留时间优化配置。

    (3) 均匀时间分配算法。该算法固定各雷达驻留时间,仅优化雷达节点选择和发射功率分配。

    (4) 均匀功率时间分配算法。该算法固定各雷达的发射功率和驻留时间,仅优化雷达节点选择。

    定义k时刻目标跟踪的平均均方根误差(Average Root Mean Square Error, ARMSE)为

    ARMSE=1NMCNMCn=11Nqk(n)Nqk(n)k=1{[xqkˆxqn,k|k]2+[yqkˆyqn,k|k]2} (20)

    式中,NMC为蒙特卡罗实验次数;(ˆxqn,k|k,ˆyqn,k|k)为第n次蒙特卡罗实验得到的目标位置估计,本文设定NMC=100。本文所提算法和上述4种算法的ARMSE对比结果如图3所示。从图3可以看出,本文所提算法相较于有固定资源分配算法和随机节点选择算法具有更低的多目标跟踪误差,这说明雷达节点选择和射频资源优化分配对提升多目标跟踪精度有较大影响,而且优化的射频资源越多,各目标跟踪精度也越好。由于无通信干扰算法中不存在通信基站,即不考虑雷达与通信基站间的相互干扰,其所得多目标跟踪误差低于本文所提算法,这也进一步说明了通信基站的存在对组网雷达多目标跟踪性能有一定影响。总的来说,本文所提算法能够在给定组网雷达射频资源条件和预先设定的通信基站最大可容忍干扰能量阈值下,通过联合优化雷达节点选择以及辐射功率与驻留时间等射频资源配置,获得相较于其他对比算法更优的多目标跟踪精度。

    图  3  RCS不变场景下ARMSE对比结果
    Figure  3.  Comparison results of ARMSE with same RCS

    在该仿真场景中,主要研究目标RCS的变化对组网雷达射频资源配置与多目标跟踪精度的影响。目标1和目标2相对于雷达3和雷达4的RCS模型为Swerling I型,其中,各目标RCS变化情况如图4所示,目标相对于其他雷达节点的RCS值仍固定为1 m2

    图  4  各目标RCS数值
    Figure  4.  RCS values of each target

    图5给出了RCS变化情况下组网雷达跟踪目标1和目标2的雷达节点选择和功率时间资源优化分配结果。从图5可以看出,由于目标回波信噪比与其RCS值呈正比关系,组网雷达系统倾向于选择相对目标RCS值较大的雷达节点来完成跟踪任务。例如,各目标相对于雷达3和雷达4的RCS值在大多数跟踪时刻均高于其他雷达,相较于RCS不变条件下的节点选择方案,由于目标1和目标2相对于雷达3和雷达4的RCS值在多数时刻均高于RCS不变场景下的RCS设定值,因此组网雷达选择雷达3和雷达4来跟踪目标1和目标2的时刻显著增多;同时,为了获得更好的目标跟踪精度,本文所提算法更多选择3部雷达对目标进行跟踪。

    图  5  RCS变化场景下雷达节点选择与功率时间资源优化分配结果
    Figure  5.  Radar node selection and allocation results of power and dwell time resources with various RCS

    同样地,RCS变化情况下本文所提算法与其他对比算法的ARMSE对比结果如图6所示。由于雷达节点选择受到目标RCS变化的影响,组网雷达的跟踪性能略差于RCS不变情况下的跟踪性能,但仍优于同一场景下的其他对比算法,体现了本文所提算法的稳健性。

    图  6  RCS变化场景下ARMSE对比结果
    Figure  6.  Comparison results of ARMSE with various RCS

    在该仿真场景中,主要研究通信基站最大可容忍干扰能量阈值,即Emax变化对组网雷达多目标跟踪精度的影响。图7给出了Emax=3 J时组网雷达跟踪目标1和目标2的节点选择和功率时间资源优化分配结果。从图7可以看出,相较于第1种仿真场景,由于Emax值变小,通信基站对雷达干扰能量的可容忍度降低,此时,组网雷达选择了满足约束条件下的最优雷达射频资源分配方案;类似地,组网雷达更多地选择3部雷达对多目标进行跟踪。

    图  7  Emax=3 J时雷达节点选择与功率时间资源优化分配结果
    Figure  7.  Radar node selection and allocation results of power and dwell time resources with Emax=3 J

    同样地,图8显示不同Emax条件下本文所提算法与其他4种算法的ARMSE对比结果。从图中可以看出,随着Emax值不断增加,通信基站对雷达干扰能量的可容忍度不断提升,使得可供组网雷达配置的射频辐射资源增多,于是,系统能够得到更低的多目标跟踪误差,所得ARMSE值也更逼近无通信干扰条件下的跟踪误差。

    图  8  不同Emax条件下ARMSE对比结果
    Figure  8.  Comparison results of ARMSE under different Emax conditions

    本文考虑了频谱共存环境下通信基站对组网雷达多目标跟踪性能的影响,提出了一种面向多目标跟踪的组网雷达功率时间联合优化算法,以满足组网雷达射频资源和预先设定的通信基站最大可容忍干扰能量阈值为约束条件,以最小化多目标跟踪BCRLB为优化目标,通过联合优化分配雷达节点选择、发射功率和驻留时间等参数,提高了组网雷达的多目标跟踪精度。仿真结果表明,多目标跟踪精度不仅与组网雷达和各目标的空间位置关系及目标散射特性有关,而且还受通信基站最大可容忍干扰能量阈值的影响;另外,与现有算法相比,本文所提算法能够在保证通信基站正常工作的条件下,有效提升多目标跟踪性能。下一步将围绕频谱共存环境下组网雷达射频辐射参数与飞行路径联合优化问题进行研究。

  • 图  1  压制干扰机掩护目标穿越组网雷达防区的示例

    Figure  1.  An example of a suppression jammer protecting a target through the networked radar defense area

    图  2  干扰机智能体和组网雷达智能体的博弈流程图

    Figure  2.  The game closed-loop process of the jammer agent and the networked radar agent

    图  3  干扰机、雷达和目标的相对空间位置

    Figure  3.  The relative spatial position of the jammer, radar and target

    图  4  组网雷达智能体与环境交互图

    Figure  4.  The networked radar agent and environment interaction diagram

    图  5  知识辅助的组网雷达智能体奖励模块

    Figure  5.  The knowledge-assisted reward module for the networked radar agent

    图  6  组网雷达智能体的策略网络

    Figure  6.  The policy network of the networked radar agent

    图  7  干扰机智能体与环境交互图

    Figure  7.  The jammer agent and environment interaction diagram

    图  8  知识辅助的干扰机智能体奖励函数模块

    Figure  8.  The knowledge-assisted reward function module for the jammer agent

    图  9  干扰机智能体的混合策略网络

    Figure  9.  The hybrid policy network of the jammer agent

    图  10  组网雷达部署和目标编队轨迹

    Figure  10.  The deployment of the networked radar and the trajectory of the target formation

    图  11  奖励变化曲线

    Figure  11.  The rewards convergence curve

    图  12  干扰资源分配结果

    Figure  12.  The interference resource allocation result

    图  13  3种组网雷达功率分配策略的目标检测概率

    Figure  13.  The target detection probability of three networked radar power allocation strategies

    图  14  不同干扰模式下基于DRL组网雷达功率分配策略的目标检测概率

    Figure  14.  The target detection probability of the DRL-based networked radar power allocation strategy under different interference models

    图  15  组网雷达功率分配结果

    Figure  15.  The networked radar power allocation results

    图  16  各雷达节点受压制干扰情况

    Figure  16.  The indication that each radar node is interfered

    图  17  干扰机和组网雷达的距离变化

    Figure  17.  The distance variation of the jammer and the networked radar

    表  1  雷达工作参数

    Table  1.   The working parameters of the radars

    参数数值参数数值
    发射总功率Ptotalr10 mW工作频率100 GHz

    最小发射功率Pminr0最大发射功率Pmaxr2 mW
    天线增益Gr45 dB虚警概率Pf10–6
    下载: 导出CSV

    表  2  干扰机工作参数

    Table  2.   The working parameters of the jammer

    参数数值参数数值
    干扰总功率Ptotalj60 W干扰天线增益Gj10 dB
    最小发射功率Pminj0最大发射功率Pmaxj60 W
    干扰波束个数L3天线波瓣宽度θ0.5
    工作频率100 GHz极化失配损失γj0.5
    下载: 导出CSV

    表  3  算法参数设置

    Table  3.   The algorithm parameters setting

    参数取值参数取值
    离散Actor的NN层数/节点数3/128离散Actor网络学习率3e–3
    连续Actor的NN层数/节点数3/128连续Actor网络学习率3e–3
    批量训练样本大小128经验回放区大小1024
    Critic网络学习率3e–3执行性奖励权重0.15
    PPO裁剪参数0.2检测概率奖励权重0.85
    折扣因子0.998优化器Adam
    衰减因子β0.9999导向奖励参数b1,b20.5, 0.1
    下载: 导出CSV

    表  4  各策略的资源调度运行时间

    Table  4.   The resource scheduling running time of each strategy

    调度策略资源调度运行时间(s)
    基于DRL的分配策略0.009237
    基于PSO的分配策略5.227107
    基于AFSA的分配策略67.365983
    下载: 导出CSV
  • [1] 郝宇航, 蒋威, 王增福, 等. 分布式MIMO体制天波超视距雷达仿真系统[J/OL]. 系统工程与电子技术. https://kns.cnki.net/kcms/detail/11.2422.TN.20220625.1328.008.html, 2022.

    HAO Yuhang, JIANG Wei, WANG Zengfu, et al. A distributed MIMO sky-wave over-the-horizon-radar simulation system[J/OL]. Systems Engineering and Electronics. https://kns.cnki.net/kcms/detail/11.2422.TN.20220625.1328.008.html, 2022.
    [2] 潘泉, 王增福, 梁彦, 等. 信息融合理论的基本方法与进展(II)[J]. 控制理论与应用, 2012, 29(10): 1233–1244. doi: 10.7641/j.issn.1000-8152.2012.10.CCTA111336

    PAN Quan, WANG Zengfu, LIANG Yan, et al. Basic methods and progress of information fusion (II)[J]. Control Theory &Applications, 2012, 29(10): 1233–1244. doi: 10.7641/j.issn.1000-8152.2012.10.CCTA111336
    [3] WANG Yuedong, LIANG Yan, ZHANG Huixia, et al. Domain knowledge-assisted deep reinforcement learning power allocation for MIMO radar detection[J]. IEEE Sensors Journal, 2022, 22(23): 23117–23128. doi: 10.1109/JSEN.2022.3211606
    [4] 闫实, 贺静, 王跃东, 等. 基于强化学习的多机协同传感器管理[J]. 系统工程与电子技术, 2020, 42(8): 1726–1733. doi: 10.3969/j.issn.1001-506X.2020.08.12

    YAN Shi, HE Jing, WANG Yuedong et al. Multi-airborne cooperative sensor management based on reinforcement learning[J]. Systems Engineering and Electronics, 2020, 42(8): 1726–1733. doi: 10.3969/j.issn.1001-506X.2020.08.12
    [5] YAN Junkun, JIAO Hao, PU Wenqiang, et al. Radar sensor network resource allocation for fused target tracking: a brief review[J]. Information Fusion, 2022, 86/87: 104–115. doi: 10.1016/j.inffus.2022.06.009
    [6] 严俊坤, 陈林, 刘宏伟, 等. 基于机会约束的MIMO雷达多波束稳健功率分配算法[J]. 电子学报, 2019, 47(6): 1230–1235. doi: 10.3969/j.issn.0372-2112.2019.06.007

    YAN Junkun, CHEN Lin, LIU Hongwei, et al. Chance constrained based robust multibeam power allocation algorithm for MIMO radar[J]. Acta Electronica Sinica, 2019, 47(6): 1230–1235. doi: 10.3969/j.issn.0372-2112.2019.06.007
    [7] 时晨光, 董璟, 周建江. 频谱共存下面向多目标跟踪的组网雷达功率时间联合优化算法[J]. 雷达学报, 2023, 12(3): 590–601. doi: 10.12000/JR22146

    SHI Chenguang, DONG Jing, and ZHOU Jianjiang. Joint transmit power and dwell time allocation for multitarget tracking in radar networks under spectral coexistence[J]. Journal of Radars, 2023, 12(3): 590–601. doi: 10.12000/JR22146
    [8] 程婷, 恒思宇, 李中柱. 基于脉冲交错的分布式雷达组网系统波束驻留调度[J]. 雷达学报, 2023, 12(3): 616–628. doi: 10.12000/JR22211

    CHENG Ting, HENG Siyu, and LI Zhongzhu. Real-time dwell scheduling algorithm for distributed phased array radar network based on pulse interleaving[J]. Journal of Radars, 2023, 12(3): 616–628. doi: 10.12000/JR22211
    [9] 孙俊, 张大琳, 易伟. 多机协同干扰组网雷达的资源调度方法[J]. 雷达科学与技术, 2022, 20(3): 237–244, 254. doi: 10.3969/j.issn.1672-2337.2022.03.001

    SUN Jun, ZHANG Dalin, and YI Wei. Resource allocation for multi-Jammer cooperatively jamming netted radar systems[J]. Radar Science and Technology, 2022, 20(3): 237–244, 254. doi: 10.3969/j.issn.1672-2337.2022.03.001
    [10] 张大琳, 易伟, 孔令讲. 面向组网雷达干扰任务的多干扰机资源联合优化分配方法[J]. 雷达学报, 2021, 10(4): 595–606. doi: 10.12000/JR21071

    ZHANG Dalin, YI Wei, and KONG Lingjiang. Optimal joint allocation of multijammer resources for jamming netted radar system[J]. Journal of Radars, 2021, 10(4): 595–606. doi: 10.12000/JR21071
    [11] 黄星源, 李岩屹. 基于双Q学习算法的干扰资源分配策略[J]. 系统仿真学报, 2021, 33(8): 1801–1808. doi: 10.16182/j.issn1004731x.joss.20-0253

    HUANG Xingyuan and LI Yanyi. The allocation of jamming resources based on double Q-learning algorithm[J]. Journal of System Simulation, 2021, 33(8): 1801–1808. doi: 10.16182/j.issn1004731x.joss.20-0253
    [12] 段燕辉. 雷达智能抗干扰决策方法研究[D]. [硕士论文], 西安电子科技大学, 2021.

    DUAN Yanhui. Research on radar intelligent anti-jamming decision method[D]. [Master dissertation], Xidian University, 2021.
    [13] 宋佰霖, 许华, 齐子森, 等. 一种基于深度强化学习的协同通信干扰决策算法[J]. 电子学报, 2022, 50(6): 1301–1309. doi: 10.12263/DZXB.20210814

    SONG Bailin, XU Hua, QI Zisen, et al. A collaborative communication jamming decision algorithm based on deep reinforcement learning[J]. Acta Electronica Sinica, 2022, 50(6): 1301–1309. doi: 10.12263/DZXB.20210814
    [14] 肖悦, 张贞凯, 杜聪. 基于改进麻雀搜索算法的雷达功率与带宽联合分配算法[J]. 战术导弹技术, 2022(5): 38–43, 92. doi: 10.16358/j.issn.1009-1300.20220077

    XIAO Yue, ZHANG Zhenkai, and DU Cong. Joint power and bandwidth allocation of radar based on improved sparrow search algorithm[J]. Tactical Missile Technology, 2022(5): 38–43, 92. doi: 10.16358/j.issn.1009-1300.20220077
    [15] 靳标, 邝晓飞, 彭宇, 等. 基于合作博弈的组网雷达分布式功率分配方法[J]. 航空学报, 2022, 43(1): 324776. doi: 10.7527/S1000-6893.2020.24776

    JIN Biao, KUANG Xiaofei, PENG Yu, et al. Distributed power allocation method for netted radar based on cooperative game theory[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(1): 324776. doi: 10.7527/S1000-6893.2020.24776
    [16] SHI Chenguang, WANG Fei, SELLATHURAI M, et al. Non-cooperative game-theoretic distributed power control technique for radar network based on low probability of intercept[J]. IET Signal Processing, 2018, 12(8): 983–991. doi: 10.1049/iet-spr.2017.0355
    [17] 李伟, 王泓霖, 郑家毅, 等. 博弈条件下雷达波形设计策略研究[J]. 电子与信息学报, 2019, 41(11): 2654–2660. doi: 10.11999/JEIT190114

    LI Wei, WANG Honglin, ZHENG Jiayi, et al. Research on radar waveform design strategy under game condition[J]. Journal of Electronics &Information Technology, 2019, 41(11): 2654–2660. doi: 10.11999/JEIT190114
    [18] HE Jin, WANG Yuedong, LIANG Yan, et al. Learning-based airborne sensor task assignment in unknown dynamic environments[J]. Engineering Applications of Artificial Intelligence, 2022, 111: 104747. doi: 10.1016/j.engappai.2022.104747
    [19] MU Xingchi, ZHAO Xiaohui, and LIANG Hui. Power allocation based on reinforcement learning for MIMO system with energy harvesting[J]. IEEE Transactions on Vehicular Technology, 2020, 69(7): 7622–7633. doi: 10.1109/TVT.2020.2993275
    [20] RUMMERY G A and NIRANJAN M. On-Line Q-learning Using Connectionist Systems[M]. Cambridge, UK: Cambridge University, 1994: 6–7.
    [21] LI Jun and SHEN Xiaofeng. Robust jamming resource allocation for cooperatively suppressing multi-station radar systems in multi-jammer systems[C]. 2022 25th International Conference on Information Fusion (FUSION), Linköping, Sweden, 2022: 1–8.
    [22] YAO Zekun, TANG Chuanbin, WANG Chao, et al. Cooperative jamming resource allocation model and algorithm for netted radar[J]. Electronics Letters, 2022, 58(22): 834–836. doi: 10.1049/ell2.12611
    [23] ZHANG Dalin, SUN Jun, YI Wei, et al. Joint jamming beam and power scheduling for suppressing netted radar system[C]. 2021 IEEE Radar Conference (RadarConf21), Atlanta, GA, USA, 2021: 1–6.
    [24] 夏成龙, 李祥, 刘辰烨, 等. 基于深度强化学习的智能干扰方法研究[J]. 电声技术, 2022, 46(5): 144–149. doi: 10.16311/j.audioe.2022.05.035

    XIA Chenglong, LI Xiang, LIU Chenye, et al. Reserch of intelligent interference methods based on deep reinforcement learning[J]. Audio Engineering, 2022, 46(5): 144–149. doi: 10.16311/j.audioe.2022.05.035
    [25] LIU Weijian, WANG Yongliang, LIU Jun, et al. Performance analysis of adaptive detectors for point targets in subspace interference and Gaussian noise[J]. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(1): 429–441. doi: 10.1109/TAES.2017.2760718
    [26] 王国良, 申绪涧, 汪连栋, 等. 基于秩K融合规则的组网雷达系统干扰效果评估[J]. 系统仿真学报, 2009, 21(23): 7678–7680. doi: 10.16182/j.cnki.joss.2009.23.017

    WANG Guoliang, SHEN Xujian, WANG Liandong, et al. Effect evaluation for noise blanket jamming against netted radars Based on Rank-K information fusion rules[J]. Journal of System Simulation, 2009, 21(23): 7678–7680. doi: 10.16182/j.cnki.joss.2009.23.017
    [27] SUTTON R S and BARTO A G. Reinforcement Learning: An Introduction[M]. Cambridge: MIT Press, 2018: 327–331.
    [28] SCHULMAN J, WOLSKI F, DHARIWAL P, et al. Proximal policy optimization algorithms[EB/OL]. https://arxiv.53yu.com/abs/1707.06347, 2017.
    [29] WU Zhaodong, HU Shengliang, LUO Yasong, et al. Optimal distributed cooperative jamming resource allocation for multi-missile threat scenario[J]. IET Radar, Sonar & Navigation, 2022, 16(1): 113–128. doi: 10.1049/rsn2.12168
    [30] BARTON D K. Radar System Analysis and Modeling[M]. Boston: Artech House, 2004: 88–89.
  • 期刊类型引用(4)

    1. 廖晓容,孙国皓,钟苏川,余显祥,李明. 面向多任务动态场景的雷达与干扰空时协同波束联合优化方法. 雷达学报. 2024(03): 613-628 . 本站查看
    2. 石兆,时晨光,汪飞,周建江. 针对多目标跟踪的组网雷达检测门限与功率分配联合优化算法. 电子与信息学报. 2024(05): 2065-2075 . 百度学术
    3. 张磊,罗迎,张群. 雷达组网系统对抗有源干扰方法综述. 信息对抗技术. 2023(06): 1-16 . 百度学术
    4. 朱鸿宇,何丽丽,刘峥,谢荣,冉磊. 基于多臂赌博机的频率捷变雷达在线决策方法. 雷达学报. 2023(06): 1263-1274 . 本站查看

    其他类型引用(2)

  • 加载中
图(17) / 表(4)
计量
  • 文章访问数: 1186
  • HTML全文浏览量: 358
  • PDF下载量: 273
  • 被引次数: 6
出版历程
  • 收稿日期:  2023-02-17
  • 修回日期:  2023-03-29
  • 网络出版日期:  2023-04-18
  • 刊出日期:  2023-06-28

目录

/

返回文章
返回