-
摘要: 雷达通信一体化通过资源共享机制,在提高系统频谱利用率的同时实现了轻量化设计,广泛应用于空中交通管制、医疗监测、自动驾驶等领域。传统的雷达通信一体化算法通常依赖于精确的数学建模和信道估计,无法适应难以刻画的动态复杂环境。人工智能凭借其强大的学习能力直接从大量数据中自动学习特征,无需对数据进行显式建模,促进了雷达通信的深度融合。该文围绕人工智能驱动的雷达通信一体化研究展开系统的综述。具体而言,首先阐述了雷达通信一体化系统模型与核心问题。在此基础上,从雷达通信共存和双功能雷达通信一体化两个方面梳理了人工智能驱动的雷达通信一体化最新研究进展。最后,总结全文并对该领域潜在的技术挑战和未来的研究方向进行了展望。Abstract: Joint radar communication leverages resource-sharing mechanisms to improve system spectrum utilization and achieve lightweight design. It has wide applications in air traffic control, healthcare monitoring, and autonomous vehicles. Traditional joint radar communication algorithms often rely on precise mathematical modeling and channel estimation and cannot adapt to dynamic and complex environments that are difficult to describe. Artificial Intelligence (AI), with its powerful learning ability, automatically learns features from large amounts of data without the need for explicit modeling, thereby promoting the deep fusion of radar communication. This article provides a systematic review of the research on AI-driven joint radar communication. Specifically, the model and challenges of the joint radar communication system are first elaborated. On this basis, the latest research progress on AI-driven joint radar communication is summarized from two aspects: radar communication coexistence and dual-functional radar communication. Finally, the article is summarized, and the potential technical challenges and future research directions in this field are described.
-
1. 引言
随着新一代无线通信技术的迅速发展,各种通信设备数量出现爆发式增长,频谱环境日益拥挤[1]。与此同时,为实现协同作战,雷达、通信等各种电子系统逐步被集成到同一装备平台中[2]。在传统的集成模式下,各种电子系统以分立方式进行设计和部署,导致装备体积大、作战效率低[3]。为高效利用频谱资源,并克服分立实现的缺点,各领域对雷达通信一体化(Joint Radar Communication, JRC)设计展开了广而深入的研究[4,5]。20世纪90年代,美国开展了雷达通信一体化研究,启动了“宝石柱”与“宝石台”计划[6],通过对战机、战舰等机载系统的信号接收、数据处理等硬件部分进行集成设计,实现了机载电子系统的综合一体化。JRC技术不仅可以借助现有的通信网络降低雷达部署成本,提升雷达环境感知精度,也能够通过雷达预测信道环境,进一步优化通信系统性能[7]。在技术创新与功能融合的推动下,未来的JRC系统将突破传统功能界限,朝着更加智能化、高效化的方向发展。
在雷达通信一体化领域,当前存在两条研究主线:雷达通信共存(Radar Communication Coexistence, RCC)方案和双功能雷达通信一体化(Dual-functional Radar Communication, DFRC)方案[8]。
在RCC系统中,雷达与通信系统以独立方式部署,通过时分或者频分的方式相互协作实现频谱共享,从而同时进行目标检测和信息传输。由于雷达和通信使用各自独立的波形,两者在时域或者频域易出现重叠,进而引发资源冲突,影响系统性能。因此,如何设计针对频谱共享的干扰管控策略消除两个子系统的相互干扰是实现RCC的关键。传统的干扰管控方法,例如认知频谱技术[9],基于概率模型对共享频谱进行规则化分配,以此缓解两个子系统间的相互干扰。然而,频谱共享状态往往呈现动态特性,难以通过单一的概率模型来精准刻画,从而限制了认知频谱技术在RCC复杂场景中的适用。
与RCC不同,DFRC系统将雷达与通信集成到一个共享硬件平台,通过共用发射波形同时实现雷达感知和无线通信,降低了硬件成本和重量,实现了轻量化设计[10]。其实现方式主要包括以通信为中心的设计方案、以雷达为中心的设计方案以及联合设计方案[11,12]。基于不同应用场景和差异化任务需求,动态协调雷达通信性能是DFRC设计的关键。然而,传统的基于单一功能优化的波形设计难以权衡雷达和通信性能,而联合设计的方法则依赖于信道状态估计。为了突破传统方法的局限性,近年来,研究者探索了基于数据驱动的人工智能(Artificial Intelligence, AI)算法,例如基于AI的干扰管控机制[13]、共用波形设计[14−16]等,以应对动态复杂的环境,实现雷达与通信性能权衡。
相较于传统算法,AI赋予了JRC无需完全了解外部因素的情况下即可学习的能力[17],能够根据环境变化实时调整策略[18]。AI算法主要包括机器学习(Machine Learning, ML)、深度学习(Deep Learning, DL)以及深度强化学习(Deep Reinforcement Learning, DRL)。机器学习是AI算法的重要组成部分,根据学习方式和任务类型,又分为监督学习(Supervised Learning, SL)、无监督学习(Unsupervised Learning, UL)和强化学习(Reinforcement Learning, RL)[19]。强化学习是一种智能体在与未知环境交互中学习策略的代表性机器学习方法[20],适用于动态的RCC频谱环境,可以在不确定干扰情况下,实现最佳频谱选择。深度学习是机器学习的一个子领域,基于神经网络的结构,模拟人脑的工作方式,通过多层神经网络从数据中提取复杂特征进行学习和推理[21]。在DFRC系统中,深度学习摆脱了对信道状态信息估计的依赖,直接从原始数据中学习训练,根据差异化场景需求实现雷达与通信性能的动态权衡。深度强化学习将神经网络和强化学习相结合[22],能够应对非常复杂的频谱决策问题。在RCC系统中,深度强化学习能够根据信道状态信息,快速学习频谱动态,优化频谱分配策略,缓解系统间的相互干扰。总体而言,AI赋能的JRC系统为干扰缓解与性能权衡提供了新的解决方案,并已广泛应用于各类电子装备中,如图1所示。
另外,基于AI的JRC系统通过整合任务规划[23]、电磁兼容设计[24]及干扰应对决策[25]等知识库,推动舰载、机载、车载等综合射频系统实现智能决策能力的提升。
舰载JRC系统作为现代舰艇不可或缺的关键技术,为飞机、舰艇和潜艇的监视与预警提供核心支持。在此基础上,AI驱动的舰载JRC系统采用多智能体协作模型与基于AI的目标意图分析技术,实现环境自主感知与决策重构,推动系统效能的自适应进化[23]。同时针对协同任务对开放式紧密耦合协作架构的需求,舰载JRC借助分布式AI特征识别、异构多源信息融合以及数据智能分析技术,构建多维环境感知体系,实现动态资源配置[26]。
机载系统与舰载系统相比,更注重模块化、轻量化设计,便于快速适应动态的任务环境。近年来,AI技术的引入加速推动了机载JRC系统朝着更智能化、模块化方向发展。JRC系统通过机器学习与深度学习技术,提升对复杂态势的自主感知与智能决策能力,同时依托开放式架构与标准化模块设计,促进多平台协同作战,实现资源共享与动态调配[6]。此外,在雷达目标分类中引入残差网络(Residual Network, ResNet)架构,显著提升了对隐身飞机和舰艇的探测能力[27]。
车载JRC系统可以搭载在地面载具上以同时具备雷达和通信功能[24]。针对车载JRC系统共用信号处理单元等硬件导致的资源调度冲突,基于深度强化学习的动态调度策略可优化资源管理,根据不同任务需求调整频谱资源分配策略,确保关键任务的顺利执行。此外,该系统的告警模块可能因电磁泄露及强目标反射遭受电磁干扰。为此,车载JRC系统结合深度学习驱动的信号检测接收技术,有效抑制信道干扰,确保告警模块稳定运行[25]。因此,基于AI的差异化信号频段选择技术能够更好地适应地面恶劣的任务环境。
在民用方面,基于AI的JRC系统在支持智能检测与控制市场方面有着广泛的应用前景,典型的应用包括空中交通管制[28]、医疗保健和监测[29]以及自动驾驶汽车[10]等。
随着空中交通流量的爆炸式增长,传统雷达监视系统在精度及可靠性方面难以满足现代航空需求。为此,Mode S作为下一代信标雷达系统,通过构建深度学习模型,识别不同方位的干扰,在高密度交通区域提供了精确的监视[30]。此外,Mode S借助基于深度学习的自编码器去除冗余数据,为飞机状态监控等航空业务提供可靠的数据传输[31]。自动相关监视广播(Automatic Dependent Surveillance-Broadcast, ADS-B)是与Mode S相关的另一项关键技术[32]。针对ADS-B易受伪造信号和干扰攻击问题,深度学习驱动的异常检测技术通过自动学习深层非线性网络结构,实现了ADS-B数据的安全接收[33]。
为了监测患者的健康情况,AI赋能的JRC系统将无线医疗遥测服务频段用于医疗监测领域,以测量人体状态[34]。多任务学习驱动的雷达变换器,通过结合基于Transformer的注意力机制,提升了身份识别精度[35]。神经网络与集成学习技术进一步优化了调频连续波雷达,提升了跌倒检测精度,而基于机器学习的雷达系统在非接触跌倒检测中的应用进一步增强了监测稳定性[36]。
基于AI的JRC技术因其在提升交通安全方面的优势,被广泛应用于自动驾驶汽车。基于深度强化学习的双功能雷达通信系统可在不确定环境下动态切换雷达与通信模式,实现了数据可靠传输与碰撞风险规避[10]。深度学习驱动的通感一体化网络结合卷积长短期记忆网络(Long Short-Term Memory, LSTM),在优化通信速率的同时增强干扰规避能力,提高系统鲁棒性[15]。为了适应动态不确定的交通环境,基于马尔可夫决策过程的智能优化框架进一步引入深度强化学习算法,无需先验信息即可优化雷达通信模式选择策略[37]。此外,基于深度强化学习的通信安全反窃听技术,优化了系统保密性,为自动驾驶场景下的通信安全提供了解决方案[38]。
因此,本文对人工智能驱动的雷达通信一体化研究进行综述。首先概述雷达通信一体化并引出核心问题,其次围绕雷达通信共存和双功能雷达通信一体化两方面对基于AI的雷达通信一体化技术的最新研究展开梳理,最后介绍技术挑战与未来研究方向。
2. 雷达通信一体化概述
雷达通信一体化通过在同一频段内融合雷达感知与无线通信功能,提高了频谱资源利用率,实现了雷达与通信的优势互补[39]。一方面,通过现有的无线通信设备增强了雷达系统的探测能力[40];另一方面,利用雷达探测信息可以辅助通信系统实现频谱资源的高效利用[41]。本节将从雷达通信共存和双功能雷达通信一体化两方面来阐述JRC的系统模型以及核心问题。
2.1 雷达通信共存系统方案
2.1.1 系统模型
在雷达通信共存中,雷达系统和通信系统通过时分或者频分的方式相互协作,使两个单独部署的系统同时完成目标检测和信息传输功能[7]。RCC的一般通用模型如图2所示。在这一场景中,通信和雷达系统独立部署。为了便于解释两个系统的复杂关系,用波束表示雷达探测,用虚线表示通信信息传输,用红线表示干扰。对于多目标等复杂场景,只需将发射信号和信道增益进行相应扩展即可。
为实现频谱资源共享,基于时分复用的资源划分方式通过雷达和通信子系统的交替工作,确保二者在时域维度上互不重叠[42]。在这一频谱共享模式下,系统在雷达工作时隙仅发射MIMO雷达信号,而在通信工作时隙仅发射MIMO通信信号,从而实现时域上的正交分离。将通信信号表示为xNtc(t),雷达信号表示为xNkr(t),则通信基站处的发射信号xcom(t)可以表示为
xcom(t)=RαT(t)xNtc(t) (1) 雷达发射机处的发射信号xradar(t)可以表示为
xradar(t)=R(1−α)T(t−αT)xNkr(t) (2) 其中,RT(t)为矩形窗函数。基于时分复用方案的优势在于其实现的简便性和部署的高效性。通过引入简单的开关,无需对雷达和通信波形进行重新设计,即可将两项功能集成至现有系统中。然而,该方案亦存在一定局限性。即便系统采用两副独立天线分别承载雷达与通信功能,若二者在相同频率下同时工作,仍会产生严重干扰。
基于频分复用的资源共享方案同样是一种工程上易于实现的参考方案[43],通过将雷达与通信系统的频谱资源划分为互不重叠的独立子带,使两者能够在各自的频段内独立运行。此时通信基站处的发射信号xcom(t)可以表示为
xcom(t)=RT(t)xNtc(t) (3) 雷达发射机处的发射信号xradar(t)可以表示为
xradar(t)=RT(t)xNkr(t) (4) 在该模式下,系统将分别为其分配独立的天线,并在不同频率上进行传输,实现频域正交。因此,MIMO雷达系统与MIMO通信系统可以分别独立设计其发射信号,以满足各自的系统需求。然而,该方案要求系统配备独立的天线和频段,在频谱资源有限的情况下,可能会导致较高的实现成本。
因此,在RCC系统中,通信接收机接收到的信号可以表示为
rcom(t)=xcom(t)hc(t)+xradar(t)hrc(t)+xradar(t)hrtc(t)+n(t) (5) 其中,xcom(t)hc(t)为通信有用信号,xradar(t)hrc(t)+xradar(t)hrtc(t)为雷达信号干扰,n(t)为接收端噪声,通常建模为高斯白噪声。hc(t)表示通信信道增益。hrc(t)表示雷达与通信系统之间的信道增益。一般而言,为了提高目标探测精度,雷达系统通常采用高方向性的波束或天线。然而,其可能存在的旁瓣泄露会对通信系统造成干扰。hrtc(t)表示雷达信号检测到目标后散射至通信接收端的信道增益。
雷达接收机接收到的信号可以表示为
rradar(t)=xradar(t)hr(t)+xcom(t)hcr(t)+xcom(t)hctr(t)+n(t) (6) 其中,xradar(t)hr(t)为目标雷达回波信号,xcom(t)hcr(t)为通信信号干扰,xcom(t)hctr(t)为目标通信回波,n(t)为接收端噪声。hr(t)表示雷达目标回波的信道增益,在RCC系统中,雷达系统作为独立的感知单元,通常维持常规工作模式,其信道一般建模为正常工作的视距(Line of Sight, LOS)信道。然而,在机载下视雷达等特定应用场景中,信道特性可能转变为非视距(Non Line of Sight, NLOS)信道。在此情况下,除直达路径外,由地表散射效应引发的多径反射分量在雷达信号处理理论中同样被定义为杂波干扰。
hcr(t)表示通信与雷达系统间的信道增益,通信基站所处的电磁传播环境通常较为复杂,其辐射方向图难以维持类似雷达系统的高增益窄波束特性。因此,通信信号的能量在非目标空域中形成弥散分布,这在频谱共享架构下可能成为雷达接收端的潜在干扰源。hctr(t)表示通信信号在传播至目标后,经目标散射至雷达的信道增益。
2.1.2 核心问题
从上述场景分析和建模可知,雷达和通信子系统独立运作且面临相互干扰。以通信接收端为例,通信接收机所受到的干扰主要包括雷达发射信号和雷达目标回波[44]。随着场景拓展到多用户环境,通信系统间也会产生相互干扰。这些干扰会导致雷达目标探测性能下降和通信数据丢失,常见的干扰类型有频谱重叠、多径效应、功率干扰、带宽竞争等。因此,如何设计干扰管控策略消除两个子系统间的相互干扰是实现RCC的关键。现有的干扰抑制方法主要集中于资源分配和接收端干扰抑制。
(1) 面向干扰抑制的资源分配。基于资源分配的干扰管控方法通过时分、频分、空间分离以及功率控制的方式,协调两个子系统的工作以缓解相互干扰。该类方法依据场景需求将资源规划给雷达或通信,以满足雷达探测精度或者通信速率需求。然而,传统的基于概率模型的资源分配方法通过规则静态的调度方式规避相互干扰,难以应对复杂多变的实际应用场景[9]。因此,如何应对未知的动态环境是资源分配领域的研究难题。值得注意的是,AI是一种在与未知环境交互中学习策略的智能算法,具备良好的自适应能力[45]。AI不仅能够适应动态的实际场景,还可以在多种未知干扰条件下优化通信速率与雷达估计性能,因而在资源分配领域得到广泛应用[46]。
(2) 接收端干扰检测处理。基于接收端信号处理的干扰抑制方法借助精确的信道状态信息估计和噪声建模,通过在接收端去除杂波干扰对信号的影响,提取目标数据信息,从而实现信号检测。例如在上述模型中,通过预测雷达目标回波,可在通信接收端有效减轻雷达干扰对通信性能的影响。然而,传统的检测器往往具有较高的计算复杂度,且在信道环境不稳定的情况下,干扰抑制效果有限,甚至可能放大干扰,严重影响接收信号的质量[47]。因此,如何在不确定信道状态信息的情况下,降低计算复杂度的同时提高检测精度是RCC接收器亟需解决的技术难题。相较于传统检测器,AI驱动的检测器能够不借助具体数学模型直接从原始数据中学习训练,为面向干扰抑制的信号检测提供了新的解决方案[48]。
2.2 双功能雷达通信一体化系统方案
2.2.1 系统模型
双功能雷达通信一体化系统通过一体化设计,实现了雷达与通信的深度融合。图3提供了DFRC的一般化场景,其中雷达与通信功能被集成至同一硬件系统中。该系统既可作为雷达执行目标探测任务,又可作为通信基站向单个或多个用户传输通信信息。DFRC的实现主要包括3种设计范式:以通信为中心、以雷达为中心以及联合设计[11]。不同设计方法在系统性能方面各有优劣,因此,针对不同应用场景选择合适的设计方案已成为当前研究的重点。
以通信为中心的设计方案优先考虑通信性能,将雷达感知嵌入通信系统,并利用通信波形提取目标检测信息。在这一设计中,通信性能几乎不受影响,而雷达性能则会受到特性场景限制并且调优难度较大。其中,最常见的以通信为中心的方法是基于正交频分多址(Orthogonal Frequency Division Multiplexing, OFDM)技术[49]。考虑一个采用OFDM波形的雷达,其一体化发射信号可表示为
XOFDM(t)=M∑m=1N∑n=1Cm,nRT(t−mTT)ej2π(fc+fn)t (7) 其中,M和N分别表示子载波和脉冲的数量,{Cm,n}表示为载波fn上的第m个码元。OFDM的优势在于容易和MIMO雷达相结合,可以充分利用现有通信基础设施实现雷达感知,具备高频谱利用率,并且能够很好兼容5G/6G通信标准。然而,其雷达分辨率受制于子载波分配策略,在特定应用场景下可能影响目标探测精度。
以雷达为中心的设计方案通过调制雷达波形引入通信信号,在最大程度保持雷达探测性能的前提下提供通信能力。最常见的方法是基于线性调频脉冲(Linear Frequency Modulated, LFM)的一体化波形设计[50],即在雷达常用的LFM信号基础上,通过相位调制或频率调制嵌入通信信息,从而兼顾雷达探测与通信功能。LFM一体化波形表达式为
XLFM(t)=AM−1∑m=0ejπkt2ejφmRT(t−mTT) (8) 其中,φm为通信信号调制的相位。LFM波形具有良好的恒模特性,兼容传统雷达信号,使双功能雷达系统的硬件设计更为简化且易于实现。然而,其信息传输速率较低,难以满足现代通信业务需求,同时需要权衡雷达旁瓣抑制与通信误码率,增加了系统设计复杂度。
联合设计方案在系统架构与波形设计层面进行全面联合设计与优化,通过统筹雷达与通信的目标及约束,实现高效的一体化设计,具备较高的灵活性[51]。在这一体制下,系统利用接收端接收到的信号Y=HWX+n和波束响应yθ=aT(θ)WX来设计一体化发射信号X以满足雷达或者通信子系统的性能需求。然而,该方案的实施需要重新定义标准与技术框架,并且涉及较高的开发复杂度,对系统设计和工程实现提出了更高的要求。
此外,预编码合成波形通过分别设计雷达信号和通信信号的预编码矩阵,在发射端合成共用波形,以同时满足雷达探测和通信传输需求[52]。其一体化发射信号可表示为
X(n)=WrXr(n)+WcXc(n) (9) 其中,Xc(n)表示时隙n的通信向量,Xr(n)表示雷达发射波形,Wr为MIMO雷达预编码矩阵。Wc为MIMO通信预编码矩阵。预编码合成波形的优势在于利用空间分离减少雷达与通信之间的干扰,同时支持多用户通信,提升系统的频谱效率。然而,该方案的实现依赖于复杂的预编码优化算法,在计算复杂度和实时性方面面临较大的挑战。
因此,DFRC系统的一体化发射波形可以统一表示为
XDFRC(t)=RT(t)XNtdual(t) (10) DFRC系统通过多天线单元阵列的发射设计,在同一信号框架下集成雷达探测与通信传输,利用单一的共用波形实现频谱资源共享,从而避免了雷达与通信系统的频谱竞争。
在雷达探测任务中,目标回波信号受到反射损耗和双向传播损耗的影响,使得雷达信号的传输功率通常高于通信信号[53]。然而,在JRC系统中,过高的雷达传输功率可能引入干扰,影响通信系统的可靠性。因此,通信性能与雷达性能之间存在权衡问题。为了权衡雷达和通信性能,可构建以下优化问题:
maxW,P,L α SNRm+β1KK∑k=1rk, s.t.(C1):SNRm≥˜η,∀m∈M(C2):1KK∑k=1rk≥η(C3): ∑k∥Wk∥2≤pt(C4): 0≤L≤1 (11) 其中,SNRm表示基于目标信噪比的雷达性能指标,用于评估衡量一体化波形的探测能力与检测精度。1K∑Kk=1rk表示基于平均用户可达速率的通信性能指标,其中,可达速率可表示为rk=log2(1+SINRk),SINRk表示通信用户的信干噪比,综合考虑了雷达对通信的干扰影响。W表示波束赋形矩阵,通过优化波束赋形矩阵,将主瓣对准目标方向,零点对准干扰方向,提高雷达检测精度并降低干扰影响。P表示功率分配矩阵。α, β表示权重系数,可以根据实际应用场景控制雷达与通信性能的优先级。L表示资源分配因子,通过动态优化资源分配策略,实现雷达通信性能的动态权衡。
2.2.2 核心问题
从上述场景分析和建模可知,DFRC在实现了雷达探测的同时完成了通信信息传输。然而,雷达波形设计通常要求良好的时间分辨率和频率分辨率,以实现对目标的精准定位与检测;通信波形则要求较宽的带宽和较低的功率损耗,以确保数据传输速率和抗干扰性能。这种性能需求上的差异导致在满足雷达探测精度的同时不影响通信速率成为一个极具挑战性的难题。此外,在扩展场景中,由于存在多个雷达检测目标和多个通信用户,雷达与通信性能之间会引起相互影响,亟需对两者的功能进行协调,以兼顾目标检测精度和数据传输效率。因此,如何权衡雷达和通信性能是DFRC系统设计的关键。现有的权衡性能的方法主要包括基于波形的方法以及基于资源分配的方法。
(1) 基于波形的方法。早期基于雷达的一体化波形设计方法通过将通信嵌入雷达系统,实现了雷达探测与数据传输的同步运行[50]。然而,受限于次优的自相关特性和有限的动态范围,这些通信波形在雷达传感中固有地导致性能妥协[51]。因此,基于单一功能优化的方法无法有效权衡雷达与通信的性能。基于联合设计的DFRC波形可以在一定程度上同时优化雷达和通信性能,但是常将复杂的非凸优化问题与非凸常模约束结合,难以求解出全局最优解。因此,如何解决非凸优化问题实现雷达通信性能折中是基于波形方法的研究难点。相比之下,AI能够直接从数据中挖掘特性,通过神经网络解决非凸优化问题,实现对波束赋形矩阵的实时预测[54]。凭借其优异的特征学习能力和泛化能力,AI已在雷达通信领域得到广泛应用。
(2) 基于资源分配的方法。传统的资源分配方法主要围绕以通信为中心和以雷达为中心两方面展开[55]。例如,在设定的雷达性能约束下,通过合理分配资源以最大化通信性能。此类方法能够实现雷达通信性能的静态平衡,但难以应对动态变化的复杂场景。此外,传统的资源分配方法需要在调度前对信道状态进行估计,而在复杂场景中,不可避免的信道估计误差会影响后续资源分配的性能[56]。DFRC系统中通信与雷达之间的耦合进一步复杂化了信道状态信息估计和资源分配算法设计。因此,如何突破信道估计误差的限制实现资源自适应调度以动态权衡雷达通信性能是基于资源分配方法的研究难点。值得注意的是,AI赋能的资源分配算法可以在没有任何先验信道信息的情况下,自适应不同的环境条件[13]。例如在智能驾驶场景中,AI通过与路况、天气、周围移动物体状态等环境交互,实时动态调整资源分配策略,在雷达模式和通信模式间灵活切换,从而实现雷达通信性能动态权衡[10]。
3. 人工智能驱动的雷达通信共存
本节围绕雷达通信共存系统中的核心问题,首先从基于资源分配的干扰管控与接收端信号检测处理两方面,梳理了AI在RCC中的应用进展。随后,对不同AI算法在核心问题中的性能表现进行了比较分析,并探讨了各类算法的适用场景。
3.1 基于资源分配的智能干扰管控策略
在雷达通信共存系统中,频谱共享引发的相互干扰推动了面向干扰抑制的资源分配技术研究。雷达和通信子系统因频谱共享而存在相互干扰[57]。干扰管理对RCC系统的性能起着关键作用。不同于现有无线通信系统主要集中于通信传输之间的干扰抑制,RCC系统的目标是同时降低雷达和通信子系统间的交叉干扰[44]。早期研究提出了认知频谱分配方法,假设雷达和通信的频谱共享遵循一定的概率规律,通过规则的频率分配策略来缓解两个子系统的相互干扰[9]。在RCC系统中,共享频谱往往呈现动态特性,难以用单一的概率模型来描述。为了应对上述挑战,研究者逐步引入机器学习算法,利用其数据驱动的学习能力,对频谱资源进行动态调度,以此降低雷达与通信间的交叉干扰[45]。基于资源分配的智能干扰管控策略如图4所示。
强化学习作为一种与未知环境交互中学习策略的代表性机器学习方法,能够适应频谱状态的快速变化,应对不确定的干扰问题,逐渐成为RCC干扰管控研究中的热点。强化学习通过智能体与环境的交互,学习优化策略以最大化累计奖励。在每一轮交互中,智能体根据环境状态选择动作,环境根据动作反馈奖励,智能体通过试错学习和奖励反馈信号逐步优化策略。常见的算法有Q学习(Q-Learning)、深度Q网络(Deep Q-Network, DQN)、近端策略优化(Proximal Policy Optimization, PPO)等。文献[46]的仿真结果显示,强化学习优化的雷达通信共存系统可以在快速变化的动态环境中,同时满足雷达和通信的性能需求。作者创新性地将注水算法和强化学习相结合,利用注水算法最大化通信速率,利用强化学习算法优化雷达估计性能和通信速率,并将连续干扰抑制技术应用于雷达通信混合子频段,实现干扰缓解。然而,为了将强化学习应用于实际的抗干扰场景,需要进一步探索如何缓解由RL与环境大量交互带来的高昂成本问题。
为实现对干扰环境变化的快速响应,研究者提出了在线学习算法。在线学习算法每次只处理一个小批样本以即时更新模型,通过持续学习有效缓解频谱冲突,能够快速响应不确定的干扰环境。文献[58]提出了一种基于模型的在线学习框架,用于非合作共享频谱下的频率资源分配。该方法以最大化雷达和通信性能、减少频谱冲突为优化目标,利用在线学习预测模型,在不确定干扰情况下,实现了最佳信道选择。并模拟了包括马尔可夫干扰和对抗性干扰的干扰环境,验证了所提算法的抗干扰性能。然而,在线学习算法在每一步模型更新过程中仅依赖单个样本,缺乏对全局信息的有效利用,难以保证模型的稳定性。
在强化学习的基础上,深度强化学习算法进一步融合神经网络架构,从高维状态空间中抽取特征,能够应对非常复杂的非线性资源决策问题,适用于干扰环境复杂且状态和动作空间维度较高的RCC场景。文献[59]针对雷达系统与通信系统的动态非合作问题,通过深度强化学习利用非线性值函数近似来优化雷达性能。在此基础上,文献[60]动态调整雷达波形的带宽和中心频率,降低通信系统引起的干扰。并基于深度强化学习进行了扩展,引入双深度Q学习(Double Deep Q-Learning, DDQN)和长短期记忆网络架构,建立了双深度循环Q网络(Double Deep Recurrent Q-Network, DDRQN),增强了学习稳定性并摆脱了对长时间序列的依赖。在软件定义雷达系统上验证了所提方案的实用性,仿真场景模拟了确定性频率跳跃干扰、马尔可夫链干扰和真实记录的无线频谱干扰。仿真结果显示,与文献[59]提出的马尔可夫策略迭代方法相比,所提方法改善了拥挤频谱环境下的通信干扰。文献[61]也通过雷达波形选择和频谱共享优化了拥挤频谱环境下的雷达性能。进一步地,详细评估了面向雷达波形选择的多种人工智能算法,包括深度Q学习、双深度Q学习和深度循环Q学习,并通过实验分析了这些算法在目标检测性能、频谱共享能力以及算法收敛性等方面的优势与不足。
在雷达侧通过智能资源调度抑制通信干扰的同时,通信侧的雷达干扰抑制技术也同步发展。传统方法依赖系统硬件重构导致复杂性较高,而数据驱动的深度强化学习算法,通过分层网络架构,实现了通信端的干扰规避与功率优化。文献[62]在一个非协作场景中设计了一种迭代联合干扰抑制方法,分析了雷达干扰的结构特性,降低了通信接收端的干扰。文献[63]则通过设计波束赋形算法实现了干扰抑制。这些方案通过抑制雷达干扰有效提高了通信系统的频谱效率,但需要对通信系统的接收端进行重新设计,增加了系统的复杂性。针对这一问题,文献[64]探讨了深度强化学习算法在受雷达系统干扰的通信系统中的应用。为了应对恶意干扰,文献[38]分析了分布式卡尔曼滤波(Distributed Kalman Filtering, DKF)与深度强化学习技术在提升通信抗干扰方面的应用。针对干扰模型的不确定性和动态性,建立了分层深度Q网络框架,联合设计了抗干扰功率控制和信道选择策略。仿真结果显示,当有干扰者接近时,系统能通过分层深度Q网络快速切换信道以规避干扰。
近年来也有不少研究聚焦于深度强化学习算法的改进。传统DRL算法通常假设智能体在每一时刻都能够完全观测当前环境状态,并据此做出最优决策。然而,在实际RCC系统中,环境状态往往不可完全观测,限制了DRL的适用性。因此,部分可观测马尔可夫决策过程被引入,以应对环境观测受限的情况。文献[65]提出了一种迭代选择技术和PPO算法相结合的迭代选择近端策略优化算法(Iterative Selection Proximal Policy Optimization, ISPPO)来解决部分可观测马尔可夫决策问题,相比于现有的深度强化学习方法,更进一步降低了通信用户的干扰。此外,元学习是一种旨在提升模型学习效率的AI算法,其核心思想是“学习如何学习”。该算法通过在多个相关任务中进行训练,使模型具备提取跨任务通用知识的能力,为新任务的快速适应奠定基础。针对资源调度与干扰管控场景,在DRL的基础上引入元学习进行预训练,能够缩短模型训练时间,并以更快的速度获取频谱资源调度策略[65]。
基于上述分析可知,在RCC中,针对频谱共享带来的干扰,传统的资源分配方法难以有效应对动态变化的频谱环境。为了解决这一问题,基于AI的资源调度方法应运而生。强化学习通过智能体与环境的交互,能够动态优化雷达与通信系统的性能,在降低干扰的同时提升系统效率。此外,在线学习算法和深度强化学习算法可以有效应对频谱共享中的不确定性干扰问题。在此基础上,引入元学习和LSTM网络对DRL进行扩展,进一步提高了学习效率和系统稳定性。整体而言,基于AI的资源调度策略为RCC系统中的干扰缓解提供了创新性的解决方案。然而,如何进一步提升AI在大规模动态环境中的泛化性和实时性仍是该领域亟需解决的关键问题。
3.2 AI驱动的信号检测处理
信号检测处理在雷达通信共存系统中发挥着关键作用,其目标是从一组受噪声和干扰影响的接收信号中提取出所需数据。传统的信号检测方法,例如最大似然检测器和迫零检测器,在干扰检测过程中高度依赖于信道状态信息估计。然而,信道状态信息的估计误差会严重影响传统检测器的信号检测精度。相比之下,深度学习能够在不借助信道状态信息估计的情况下,直接从原始数据中学习训练,已在自然语言处理[66]和信号检测[47]等领域获得广泛应用,AI驱动的信号检测处理如图5所示。
深度学习基于神经网络的结构,通过多层神经网络直接从数据中提取复杂特征进行学习和推理,避免了对信道状态信息的依赖,适用于低信噪比的RCC场景。文献[48]证明了深度神经网络在不确定信道状态信息情况下具有较好的鲁棒性。此外,文献[67]评估了基于学习的检测器在不同信道环境下的检测性能。上述工作都证明了基于学习的信号检测器可以适用于各种信道条件。在深度学习中,依据网络结构,神经网络主要分为卷积神经网络(Convolution Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN)和人工神经网络(Artificial Neural Network, ANN)[47]。
卷积神经网络是一种基于卷积操作的深度学习模型,广泛应用于图像和视频处理任务,其结构包括卷积层、池化层和全连接层。卷积层通过卷积操作提取输入数据的关键特征,池化层用于降维和减少计算复杂度,而全连接层则将提取的特征映射到具体分类任务中。在干扰检测场景中,卷积神经网络集成了残差连接和注意力机制,提高了对信号空间结构的特征学习能力,适用于基于雷达回波图像的目标分类场景。文献[68]提出了一种基于卷积神经网络的雷达通信信号识别方法。采用平滑伪Wigner-Ville分布(Smooth Pseudo Wigner-Ville Distribution, SPWVD)对接收信号进行时频分析,并将生成的时间频率图像作为卷积神经网络的输入,提高了特征学习效率。通过仿真验证了基于CNN的方法相比基于模糊支持向量(Fuzzy Support Vector Machine, Fuzzy SVM)的方法具有更高的精准度。但是,CNN在捕获长时间序列的依赖关系方面存在一定的局限性。此外,目前针对CNN的干扰检测研究大都集中于单一信号的识别,尚未充分考虑多信号重叠的情况。
循环神经网络是一种专为处理序列数据和捕获时间依赖关系而设计的深度学习模型。与传统的前馈神经网络不同,RNN通过引入循环连接,使得当前时刻的输出能够与过去的信息相关联,从而实现对时间序列数据的高效建模。然而,RNN在长序列建模中受到了梯度消失和梯度爆炸等问题的影响,从而限制了对长期依赖特征的学习能力。为解决上述问题,研究者提出了长短期记忆网络,通过引入门控机制,实现对关键信息的选择性保留和更新,缓解了梯度消失与梯度爆炸问题。文献[69]提出了基于长短期记忆网络的深度学习方法,将信号检测问题建模为多分类问题,并使用监督学习的方法进行模型训练。LSTM采用基于循环神经网络的扩展模型,处理时间相关失真问题。仿真结果显示,相较于传统的迫零检测器,LSTM具有较低的误符号率。然而,由于模型计算量大、训练时间长,LSTM难以满足对实时性要求高的RCC系统,比如超低时延的目标探测与实时跟踪。
全连接神经网络(Fully Connected Deep Neural Network, FCDNN)属于人工神经网络的一种,通过引入多隐藏层和非线性激活函数以拟合复杂的非线性关系,可处理多种类型的输入数据,提升信号分类性能。由于其网络结构相对简单,适合在计算资源受限的RCC设备中部署。文献[69]提出了基于全连接神经网络的深度学习方法,并将其直接用于通信子系统中的信号检测器,无需进行信道估计。其中,FCDNN采用了主成分分析的预处理方法,提升了分类性能。仿真结果显示,相较于传统的迫零检测器,FCDNN具有较低的误符号率。然而,当信号干扰比(Signal-to-Interference Ratio, SIR)较低时,FCDNN存在检测准确率瓶颈。
针对低信号干扰比场景下深度学习检测器的性能瓶颈,近期研究通过模型驱动的模块化网络设计与多网络协作架构,在复杂信道条件下实现了接近理论极限的检测精度,同时显著降低了训练复杂度。为了提高检测精度,文献[70]提出了一种模型驱动的深度学习网络,通过被动感知模块、信号检测模块和信道重建模块,对信号进行逐层处理。基于模块化的设计同时也降低了训练复杂度。在不同信噪比条件下,基于模型驱动的深度学习网络的误比特率和符号错误率接近理论最佳性能。文献[71]设计了感知神经网络和通信神经网络来进行接收端的信号处理。感知神经网络利用了多输入-平均输出结构,通过多路参考信号并行输入生成初始预测,并引入平均输出层实现高鲁棒性参数估计。相较于多重信号分类算法,基于深度学习的感知神经网络提高了感知分辨率,实现了毫米级的目标距离估计和精确的速度估计。通信神经网络包括了用于提取信道信息的一级网络和用于完成数据恢复的二级网络。在存在多普勒效应和相位噪声的情况下,通信神经网络的误码率少于现有的深度学习方法。
基于上述分析可知,传统信号检测方法高度依赖于信道状态信息估计,而信道估计误差会显著降低其检测性能。相比之下,深度学习凭借其强大的数据处理能力,在无需准确信道估计的情况下,直接从原始数据中提取特征,为面向干扰抑制的信号检测提供了新的解决方案。全连接神经网络和长短期记忆网络在干扰环境中仍然具有较低的误符号率。基于模型驱动的深度学习网络,通过逐层处理信号和信道信息,进一步提升了信号检测性能。尽管人工智能方法在一定程度上克服了传统方法的局限性,但在处理多信号和动态干扰方面仍需进一步深入研究。
3.3 讨论
本节围绕雷达通信共存系统中的干扰抑制问题,分别从基于资源分配的干扰管控与接收端信号检测处理两方面,梳理了不同AI算法在RCC中的应用进展。对于每一类AI算法,本文都对其设计方法以及优缺点进行了介绍,如表1所示。由于这些算法在计算复杂度、收敛速度与模型稳定性等方面表现不一,因此下面将从干扰管控与信号检测两方面对不同AI算法在核心问题中的性能表现与适用场景进行简要评述。
表 1 人工智能驱动的雷达通信共存算法比较Table 1. Comparison of AI-driven radar communication coexistence algorithms算法类型 适用的核心问题 优点 缺点 文献 强化学习 基于资源分配的干扰管控 通过与环境交互,适应频谱状态的快速变化,
能处理不确定的干扰问题RL与环境大量交互带来了
高昂的成本问题[46] 在线学习 基于资源分配的干扰管控 通过持续学习以缓解频谱冲突,且每步训练
的计算复杂度较低易错失全局最优解 [58] 深度强化学习 基于资源分配的干扰管控 通过强化学习适应频谱状态的快速变化,
利用深度学习处理高维状态空间计算复杂度较高 [38,59,60,61,64] 元学习 基于资源分配的干扰管控 缩短模型训练时间,快速获取干扰抑制决策 当新任务与训练任务差异较大时,
效果不佳[65] 深度学习 信号检测处理 直接从原始数据中学习特征,
避免了对信道状态信息的依赖计算资源需求大 [48,67−69] 模型驱动的
深度学习信号检测处理 将雷达通信的物理底层原理与深度学习
框架相结合,更易于模型训练模型的表达能力受制于理论假设 [70] (1) 基于资源分配的智能干扰管控策略。在干扰管控场景中,基于强化学习的资源分配方法通过与环境交互,适应频谱状态的快速变化,能处理不确定的干扰问题,适用于实时控制和在线决策的RCC场景,例如无人驾驶、沉浸式游戏等。为了将强化学习应用于实际的抗干扰场景,需要进一步探索如何缓解由RL与环境大量交互带来的高昂成本问题。基于在线学习的资源分配的优点是模型可以快速响应干扰环境变化。比如每次只处理一个小批样本以即时更新模型,通过持续学习适应环境动态变化,有效缓解频谱冲突,同时每步训练的计算复杂度较低。然而,由于每步仅依赖单个样本,在线学习算法缺乏全局视野,模型稳定性难以保证且易陷入局部最优。基于深度强化学习的资源分配方法进一步融合神经网络架构,能够从高维状态空间中抽取特征,处理复杂的非线性资源分配问题,适用于干扰环境复杂且状态和动作空间维度较高的RCC场景。然而,DRL模型的训练对计算资源的要求较高,不利于在资源受限的RCC设备中部署。
(2) AI驱动的信号检测处理。在信号检测场景中,深度学习驱动的信号检测方法的优点是通过多层次的非线性变换直接从原始数据中进行训练,避免了对信道状态信息的依赖,适用于低信噪比的RCC场景。例如,卷积神经网络集成了残差连接和注意力机制,提高了对信号空间结构的特征学习能力,适用于基于雷达回波图像的目标分类等场景。然而,在捕获长时间序列的依赖关系方面存在一定局限性。长短期记忆网络通过门控机制缓解了梯度消失与梯度爆炸问题,并引入记忆单元捕获长期序列中的依赖关系,适用于在小规模RCC场景中对持续时间长、特征明显的干扰信号进行检测与识别。由于模型计算量大、训练时间长,LSTM难以满足对实时性要求高的RCC系统,比如超低时延的目标探测与实时跟踪。全连接神经网络通过引入多隐藏层和非线性激活函数以拟合复杂的非线性关系,可处理多种类型的输入数据,提升了信号分类性能。同时其网络结构相对简单,适合在计算资源受限的RCC设备中部署。然而全连接神经网络的每个神经元都与前后层所有神经元相连接,导致参数规模大、易过拟合、泛化能力弱。模型驱动的深度学习将雷达通信现有的信号检测等物理底层原理与深度学习框架相结合,更易于模型训练,降低了对数据的要求,适用于数据获取困难、标注成本较高的RCC场景。但是,其模型的表达能力受制于理论假设。
4. 基于人工智能的双功能雷达通信一体化
本节围绕双功能雷达通信一体化系统中的核心问题,首先从基于学习的波束赋形优化与面向动态需求的智能资源管控策略两方面,梳理了AI在DFRC中的应用进展。随后,对不同AI算法在核心问题中的性能表现进行了比较分析,并探讨了各类算法的适用场景。
4.1 基于学习的波束赋形优化
早期对双功能一体化波形的研究主要聚焦于利用线性调频脉冲作为雷达和通信融合的载体[50]。LFM波形具有良好的恒模特性,可以简化双功能雷达系统的硬件设计,降低系统复杂性。然而,从通信的角度看,基于LFM的一体化波形只能以较低的速率传输信息,不能满足现代通信业务需求。为了克服这一局限,研究者提出了基于正交频分多址的一体化波形解决方案[52]。OFDM波形允许多个频谱部分重叠的正交子载波信号并行传输数据,还具有抗多径衰落能力强、易于同步以及灵活性高等优点。此外还有一种新兴的调制技术,被称为正交时频空间(Orthogonal Time Frequency Space, OTFS)调制[72]。OTFS是OFDM的推广,目前已被成功应用于5G通信系统中,并被视为未来6G通信系统的潜在关键技术之一[53]。
上述一体化设计方案通常侧重于满足雷达或通信中的某一个性能需求,难以兼顾雷达和通信的整体性能。为此,联合设计的理念被提出[51]。基于联合设计的雷达通信一体化系统通过开发新的性能指标、设计不同的天线部署方式以及采用联合预编码等技术,在资源分配过程中动态调整雷达与通信的优先级,从而实现两者性能的折中处理。然而,这一方法通常依赖于精确的信道估计,且由于问题的非凸性,所获得的方案难以达到全局最优。
近年来,研究者开始探索基于AI的方法,以优化DFRC的系统设计。其中,神经网络因其强大的特征学习能力以及非线性建模能力被视为该领域的重要使能技术[54]。典型的神经网络由输入层、隐藏层和输出层3层组成[73]。输入层接收输入数据,每个节点对应一个特征。隐藏层包含一个或多个层,每一层神经元与前一层的输出连接,通过加权求和和激活函数实现非线性特征转换。隐藏层越多,网络越深、模型的表达能力越强。输出层生成最终预测的结果,如分类标签或回归值。神经网络的一些应用已包括了面向波束赋形的深度学习[14]、面向可重构智能表面(Reconfigurable Intelligent Surface, RIS)波束赋形的无监督学习[74]以及面向多输入多输出(Multiple Input Multiple Output, MIMO)系统的在线学习网络[75]。基于学习的联合波束赋形优化如图6所示,雷达和通信神经网络通过端到端优化,直接从输入特征输出波束赋形矩阵,能够在保证雷达探测性能的同时,最大限度地提高通信质量。
基于监督学习的深度学习使用带有标签的数据对模型进行训练,利用已有的波形性能数据训练波束选择模型,将波束赋形的非凸优化问题转化为分类问题,适用于DFRC中的高精度目标探测任务。文献[76]针对联合天线选择和混合波束赋形设计问题,设计了两个卷积神经网络。天线选择卷积网络将信道矩阵作为输入,将最优天线子阵列作为输出。波束赋形卷积网络将选择的信道子矩阵作为输入,将波束赋形矩阵作为输出。通过将非凸优化问题转化为分类问题,借助监督学习训练,得出天线选择和波束赋形策略,提升了雷达检测精度。然而,监督学习所依赖的标签数据标注成本高、耗时长,限制了模型的部署效率。
基于无监督学习的深度学习通过挖掘数据结构进行模型训练,基于所处的环境自适应生成波束赋形矩阵,避免了对标签的使用,减少了计算开销,适用于DFRC中未知干扰源的自适应识别与波束规避。文献[77]提出了一种基于无监督学习的深度交替网络(Deep Alternating Network, DAN),包括3个子网络,分别用于生成通信波束赋形矩阵、生成雷达波束赋形矩阵以及学习通信与雷达间的功率分配策略。深度交替网络通过端到端优化,从输入特征直接生成雷达通信波束赋形矩阵,有效避免了常规方法中多步骤误差累积问题。但是,由于缺少标签数据,无监督学习的模型优化目标不明确,易陷入局部最优。
此外,在线学习算法通过捕捉环境变化,动态优化波束指向,适用于通信和雷达环境不断变化的DFRC场景。为求解非凸优化问题,文献[78]提出了一种基于在线学习网络的共用发射波形与波束赋形联合设计方案,以最小化通信多用户干扰能量和雷达输出信噪比倒数的加权组合为优化目标,利用在线学习网络的方法求解非凸优化问题,并采用自适应矩估计(Adaptive Moment Estimation, Adam)优化器实现了训练的快速收敛。通过优化波束图,使波束在目标方向形成主瓣、在干扰方向形成零点,提高了目标检测精度。在通信性能方面,仿真结果显示,在高信噪比的条件下,所提出的方法大幅提高了系统的总吞吐量。此外,为了满足雷达的特定性能需求,在在线学习中引入相似性约束(Similarity Constraint, SC),通过控制设计波形与参考波形之间的偏差,可实现在线学习网络的修正优化。然而,当应用于MIMO雷达通信系统时,基于在线学习的方法具有较高的计算开销,不适用于高维度的优化问题。
为了突破在高维度优化中的局限性,文献[79]针对MIMO雷达通信一体化系统,研究了基于深度学习的波束赋形优化方法。为了消除信道估计误差的影响,该方法设计了端到端的深度学习框架,直接将导频信号映射到发射波束矩阵和接收波束矩阵。在信道状态信息不完美的情况下,相比传统的加权最小均方差(Weighted Minimum Mean Squared Error, WMMSE)算法,同时提升了通信速率和雷达检测精度。在多用户场景下,不同波束间的旁瓣泄露会引起信号干扰。不同于文献[80]简单忽视了干扰,文献[81]利用深度学习出色的特征提取能力,隐式学习历史估计信道的特征,预测下一时隙使用的波束赋形矩阵,建立了基于历史信道驱动的深度学习网络,缓解了车载雷达通信系统中的多用户干扰问题。与此同时,文献[82]借助强化学习,将DFRC的波束方向选择和功率分配联合建模为一个部分可观测马尔可夫决策过程,在保证目标检测概率的前提下动态调整功率分配以实现干扰管控。
基于上述分析可知,早期基于LFM的波形设计方案主要侧重单一性能的优化,未能实现雷达与通信整体性能的平衡。联合设计方法通过引入新的性能指标,实现了雷达与通信性能的折中处理,但依赖于精确的信道估计。近年来,AI技术的引入,为雷达通信性能权衡提供了新的解决方案。AI赋能的波束赋形算法在不依赖精确信道估计的条件下,优化波束赋形并有效缓解多用户干扰,进一步提高了DFRC系统的整体性能。然而,针对高维度复杂环境的自适应优化及大规模系统处理仍是一个开放性问题。
4.2 面向动态需求的智能资源管控策略
双功能雷达通信一体化通过单个硬件设备整合雷达和通信功能,实现天线、频谱等系统资源的共享[1]。在不同应用场景及多样化任务需求下,如何动态分配共享资源以实现性能权衡是DFRC设计的关键。文献[55]采用了基于通信标准的资源共享方法,将IEEE 802.11 ad帧的前导块用于雷达探测,数据块用来通信传输。文献[56]则采用了基于时分的方法,将时间周期分配给雷达模式和通信模式,实现了雷达估计速率和通信速率的优化。文献[83]引入了毫米波通信技术,结合波束对准机制,实现了高带宽原始传感数据的实时传输。然而,上述方法均是基于静态的调度方案,难以适应动态性和不确定性较高的复杂场景,无法满足自动驾驶等实际应用需求。
AI赋能的资源管控算法能够在未知的周围环境中,动态切换通信模式与雷达模式,使DFRC系统能够同时执行雷达感知和无线通信任务,面向动态需求的智能资源管控策略如图7所示。文献[84]进一步考虑了动态干扰,提出了基于模型的在线学习算法,采用在线凸优化学习预测频谱模型,按需动态分配雷达和通信所需的子频段,建立了频谱分配和功率控制联合优化方法,有效缓解了因时频空间的快速变化引起的动态干扰。
在资源管控场景中,深度强化学习通常采用部分可观测的马尔可夫决策过程,状态包括数据队列状态、通信信道状态以及路况、天气、周围移动物体状态等环境信息,动作空间为通信模式和雷达模式,奖励函数综合考虑数据传输和漏检概率。DRL利用神经网络处理高维度资源分配问题,通过与环境交互自适应调整分配策略,克服了静态方案的局限性,实现了雷达通信性能的动态权衡。文献[10]聚焦于双功能模式的切换,以最大化通信数据吞吐量、最小化意外事件的漏检概率、权衡雷达与通信资源分配为优化目标,提出了一种基于深度强化学习的资源实时动态分配方案,在没有任何环境先验信息的条件下,辅助自动驾驶汽车快速做出最优模式选择。然而,DRL的算法性能高度依赖于超参数设置。超参数直接影响训练的收敛性和稳定性。因此,如何实现超参数的合理配置是该类算法亟需解决的关键难题。
近年来,多智能体深度强化学习也逐渐成为资源分配领域的研究热点[85]。在DFRC系统中,多智能体DRL主要关注以下4个方面。一是有限的先验信息:每个智能体学习如何在环境先验信息最少的情况下实现雷达通信。二是空间感知能力:智能体判断其数据队列中的数据包对其他智能体的价值。三是去中心化执行:训练完成后,每个智能体具备独立决策能力。四是协同能力:通过共享控制信道实现智能体间消息的交换与协作,以提高雷达通信系统的协同能力。
文献[86]提出了一种基于多智能体深度强化学习的资源分配方法,将单智能体问题建模为部分可观测马尔可夫决策过程,利用深度强化学习算法优化决策,将多智能体问题建模为部分可观测马尔可夫博弈,采用图神经网络(Graph Neural Network, GNN)来实现智能体间的消息传递和协作,有效协调了多智能体之间的频谱资源分配。相较于传统集中式的资源分配方案,在环境先验信息最小条件下,多智能体深度强化学习为系统提供了更高的通信效率。然而,为了将基于GNN的DRL部署于实际自动驾驶场景,需要进一步考虑动态场景中因图结构快速变化引起的模型泛化能力下降问题。
针对动态环境的适应性问题,基于双深度Q网络的资源分配方案被提出,用于在环境变化时优化资源调度策略。文献[13]在资源有限的情况下,提出了深度Q网络和决斗深度Q网络两种深度强化学习算法,在奖励函数中引入互信息、通信速率和资源冲突,提高了对动态环境的适应性。文献[37]进一步探索了双深度Q网络的可扩展性,引入了迁移学习方法,并结合优先级经验回放技术和多步时间差分学习技术,加速了切换到新环境下的训练过程,相较于传统的深度强化学习算法能够更快地获得最优资源分配策略。基于迁移学习的DRL通过将预先训练好的资源分配策略转移到新的任务中,加速了策略的收敛速度,提升了模型的泛化性能,降低了训练成本,适用于计算资源有限的真实DFRC场景。然而,当源任务与目标任务的差异较大时,迁移学习易出现负迁移现象,导致目标任务的学习性能下降。
基于上述分析可知,针对传统的静态资源调度方法难以适应复杂动态场景,基于深度强化学习的方法通过动态调整雷达和通信模式,在缺乏先验信息情况下优化资源分配策略,实现了雷达探测与通信传输间的动态权衡。多智能体深度强化学习结合图神经网络,显著提升了智能体间的协作与信息共享效率。迁移学习加速了在新环境中的训练过程。总体而言,AI为DFRC系统在动态环境中的资源调度、干扰管理和性能优化提供了坚实的技术支撑。未来,AI赋能的DFRC系统将在自动驾驶以及5G/6G通信领域中发挥重要作用。
4.3 讨论
本节围绕双功能雷达通信一体化系统中的性能权衡问题,分别从基于学习的波束赋形优化与面向动态需求的智能资源管控策略两方面,梳理了不同AI算法在DFRC中的应用进展。对于每一类AI算法,本文都对其设计方法以及优缺点进行了介绍,如表2所示。由于这些算法在计算复杂度、收敛速度与模型稳定性等方面表现不一,因此下面将从波束赋形与资源分配两方面对不同AI算法在核心问题中的性能表现与适用场景进行简要评述。
表 2 基于人工智能的双功能雷达通信一体化算法比较Table 2. Comparison of dual-functional radar communication algorithms based on AI算法类型 适用的核心问题 优点 缺点 文献 深度学习 波束赋形优化 通过损失函数设计实现性能折中,
可解决复杂的非凸优化问题模型易过拟合,泛化能力不足 [76,77,79,81] 在线学习 波束赋形优化、面向动态
需求的资源管控通过处理小批样本,实时捕捉环境变化,
可动态优化波束指向与管控策略难以处理高维度优化问题 [78,84] 强化学习 波束赋形优化 具备较强的全局优化能力,可用于时
变信道下的波束赋形数据采样效率较低 [82] 深度强化学习学习 面向动态需求的资源管控 利用神经网络处理高维度状态空间,
通过强化学习动态调整分配策略算法收敛速度较慢 [10,13] 多智能体深度强化学习 面向动态需求的资源管控 引入GNN的结构信息捕获能力,
可协调多智能体间的资源分配图结构快速变化会引起模型的
泛化能力下降[86] 迁移学习 面向动态需求的资源管控 加快了切换到新环境中的策略收敛速度 负迁移会导致学习性能下降 [37] (1) 基于学习的波束赋形优化。在波束赋形优化场景中,基于深度学习的波束赋形算法采用端到端的结构从数据中挖掘特征,将含有雷达性能约束和通信性能约束的优化问题转为无约束问题,并基于无约束问题指导损失函数设计以实现雷达通信性能折中,适用于解决复杂的非凸优化问题。基于监督学习的深度学习使用带有标签的数据对模型进行训练,利用已有的波形性能数据训练波束选择模型,将波束赋形的非凸优化问题转化为分类问题,适用于小规模DFRC中的高精度目标探测任务。然而,监督学习所依赖的标签数据标注成本高、耗时长,限制了模型的部署效率。基于无监督学习的深度学习通过挖掘数据结构进行模型训练,基于所处的环境自适应生成波束赋形矩阵,避免了对标签的使用,减少了计算开销,适用于大规模DFRC中未知干扰源的自适应识别与波束规避。但是,由于缺少标签数据,无监督学习的模型优化目标不明确,易陷入局部最优。基于在线学习的波束赋形算法的优势在于实时捕捉环境变化并动态优化波束指向,适用于通信和雷达环境不断变化的DFRC场景。同时该算法只存储最新的数据特征与模型参数,降低了存储成本。然而,其模型长期在线更新,可能导致模型偏差累积,进而影响模型精度。而强化学习具备较强的全局优化能力,适用于时变信道下的波束赋形。
(2) 面向动态需求的智能资源管控策略。在智能资源管控场景中,基于在线学习的资源管控算法的优势在于实时响应雷达通信对资源的需求变化,适用于时频空间快速变化的DFRC场景。然而,由通信链路异常引起的噪声数据容易导致资源分配决策波动较大。基于深度强化学习管控算法的优势在于借助神经网络处理高维度资源分配问题,通过与环境交互自适应调整分配策略,实现了雷达通信性能的动态权衡,适用于大规模MIMO场景。在此基础上,基于图神经网络的DRL将GNN的结构信息捕获能力与DRL的动态决策能力相结合,有效协调了多智能体间的资源分配,适用于多车辆协作下的自动驾驶系统。为了将基于GNN的DRL部署于实际自动驾驶场景,需要进一步考虑动态场景中因图结构快速变化引起的模型泛化能力下降问题。基于迁移学习的DRL通过将预先训练好的资源分配策略转移到新的任务中,加快了策略的收敛速度,提升了模型的泛化性能,降低了训练成本,适用于计算资源有限的真实DFRC场景。然而,当源任务与目标任务的差异较大时,迁移学习易出现负迁移现象,导致目标任务的学习性能下降。
5. 总结与展望
本文围绕雷达通信一体化和人工智能进行了较为系统的综述。首先介绍了JRC的系统模型和主要核心问题,其次针对雷达通信共存和双功能雷达通信一体化梳理了人工智能驱动的雷达通信一体化最新研究进展。除上述之外,基于AI的JRC系统还存在一些新的挑战与未来研究方向。
5.1 技术挑战
(1) 如何进一步提高数据集质量。数据集的质量对AI算法的性能至关重要。在JRC频谱共享系统中,由于个人健康数据和雷达位置信息等数据的敏感性与隐私性,数据的采集与获取受限,导致数据集不完整或存在偏差。这一限制使得构建高精度、具备良好泛化能力的模型变得极具挑战性,同时也增加了模型受选择性偏差影响的风险。此外,由于雷达通信间的相互干扰,易导致数据传输损失或引入数据误差,从而影响AI模型对真实系统行为的表征能力。因此,在数据应用于AI算法之前需要设计系统化的预处理算法,通过寻找数据之间的相关性或对高维数据进行降维处理,实现异常值剔除、缺失值填补及数据归一化,从而为AI算法提供可靠的数据集。
(2) 如何增强AI模型的训练精度。AI模型通常采用数据驱动的方法,依靠神经网络进行端到端训练,无法充分利用雷达通信系统的物理约束与信号处理等底层规律。因此,如何将数据驱动的方法与物理底层知识相结合,从而实现二者的优势互补是尚未解决的挑战之一。同时在JRC网络场景中,不同雷达的时钟差异会导致数据采集与传输过程出现时序失准问题。此类时钟偏差不仅降低了数据集的精确性与一致性,更直接影响了雷达网络的协同探测性能。面对未来智能应用对超低时延的严苛要求,亟需开展基于时间戳的同步机制、分布式共识算法以及参考信号传播等技术研究,实现雷达网络内部的高效时钟同步,以提升AI模型的训练精度。
(3) 如何实现隐私保护与安全防护。在JRC系统中,AI固有的复杂性以及对海量数据集和复杂算法的依赖,使其面临潜在的安全风险。例如潜在窃听者可能伪装成雷达目标,致使敏感信息遭受未经授权访问;恶意干扰者可能借助AI算法的去中心化架构注入恶意数据以干扰模型训练过程。因此,如何在AI算法中引入身份验证与加密技术以构建多层次安全防护机制,从而确保模型训练过程中的隐私性与完整性是实现隐私保护与安全防护的关键。此外,目前大多数面向JRC系统的隐私保护算法主要在小规模分布式网络中进行研究和实验。在大规模网络场景下,额外的通信和计算负担会给安全JRC系统带来新的挑战。
5.2 未来展望
(1) AI驱动的多目标雷达检测。在实际应用中,雷达感知区域通常存在多个移动目标,目标数量随时间动态变化,目标状态具有波动性,导致单目标检测不适配实际场景[87]。针对这一难题,未来需要进一步探索基于AI的多目标检测技术,以在有限的时间内实现对监测区域的全方位扫描,精准识别和跟踪动态环境中的多重目标。例如,文献[16]提出了基于强化学习的多目标检测方法,设计了一种改进的动作和奖励机制,实现了未知环境下的多目标检测。通过在动作中增加了全向检测脉冲,扩大了目标检测覆盖区域;在奖励中优化目标数量匹配项,赋能了RL框架自适应学习目标数量及分布的能力,提高了检测精度。因此,AI驱动的多目标检测技术将为决策系统提供全面的实时态势信息,从而有效提升JRC系统的智能决策能力。
(2) 安全雷达通信一体化。由于无线信道固有的开放特性,JRC系统易遭受到干扰、窃听等多种安全性威胁。现有的防御方法通常针对单一类型的攻击,如专门防御窃听攻击或单独应对干扰攻击,难以提供有效的安全保障。针对这一问题,未来需要进一步探索基于联邦学习(Federated Learning, FL)的安全防护机制,以提升系统的隐私保护能力。联邦学习允许每个参与者利用本地JRC数据更新本地AI模型,并仅上传模型参数至中央服务器更新全局模型,避免了原始数据的直接共享,从根本上减少了隐私泄露的风险。例如,文献[88]将基于联邦学习的隐私保护机制用于6G网络中的集成感知通信与供能(Integrated Sensing, Communications, and Powering, ISACP)系统。中央服务器利用联邦平均(Federated Averaging, FedAvg)算法聚合用户上传的模型参数,并将更新后的全局模型分发至各用户设备,以实现分布式学习的高效协作,保护了用户敏感数据的同时优化了系统的通信性能。
(3) 基于AI的可重构智能表面辅助JRC。RIS是由大量无源电磁元件组成的二维平面阵列,每个无源电磁元件都能独立调节入射电磁波的相位、振幅、极化等特性,实现对信号传播路径的重构。由于RIS能够以节能的方式重塑电磁环境,被视为未来雷达通信一体化的重要使能技术。智能RIS的部署不仅能够提升雷达系统的目标探测精度,同时为通信系统引入了额外的优化自由度(Degree of Freedom, DoF),并且可以为位于单盲区、阴影区域或小区边缘的用户建立虚拟视距(Line of Sight, LoS)链路。例如,文献[74]在保证回波信号信噪比和用户速率约束的条件下,采用深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法,通过联合优化发射波束赋形和接收滤波器设计,最大限度提高了用户的长期平均安全率。此外,在RCC中,基于AI的RIS通过智能调控传播环境,增强目标信号并抑制杂波信号,从而实现雷达与通信性能的协同优化,为解决干扰管控问题提供了新的解决方案。在DFRC中,RIS通过深度学习的复杂特征提取能力与强化学习的动态决策机制,为双功能波形设计提供了额外的DoF,使得系统能够在多样化应用场景下实现雷达与通信系统的性能权衡。
(4) 无人机支撑的智能雷达通信一体化。传统的雷达通信一体化系统受限于固定的位置部署和有限的覆盖范围,其雷达感知容易受到环境障碍物的影响,导致视距链路中断,从而引起性能下降。为了应对这一难题,未来需要进一步探索AI赋能的无人机JRC系统。无人机支撑的智能雷达通信一体化可通过将环境状态等感知信息集成到AI算法,实现对未来网络状态的预测,在线调整无人机轨迹,避免了传统优化算法的耗时迭代过程,提高了对高度动态场景的适应能力。同时,无人机可借助边缘计算和云计算技术,向基站发送特定的智能请求,边缘计算节点依据请求选取适当的模型来优化全局AI模型,使其适配无人机的特定数据集,同时实现轻量化部署。例如,采用深度迁移学习方法,基于预训练模型和少量数据对AI模型进行微调,提高模型适应性,增强无人机的实时处理与智能决策能力[89]。
-
表 1 人工智能驱动的雷达通信共存算法比较
Table 1. Comparison of AI-driven radar communication coexistence algorithms
算法类型 适用的核心问题 优点 缺点 文献 强化学习 基于资源分配的干扰管控 通过与环境交互,适应频谱状态的快速变化,
能处理不确定的干扰问题RL与环境大量交互带来了
高昂的成本问题[46] 在线学习 基于资源分配的干扰管控 通过持续学习以缓解频谱冲突,且每步训练
的计算复杂度较低易错失全局最优解 [58] 深度强化学习 基于资源分配的干扰管控 通过强化学习适应频谱状态的快速变化,
利用深度学习处理高维状态空间计算复杂度较高 [38,59,60,61,64] 元学习 基于资源分配的干扰管控 缩短模型训练时间,快速获取干扰抑制决策 当新任务与训练任务差异较大时,
效果不佳[65] 深度学习 信号检测处理 直接从原始数据中学习特征,
避免了对信道状态信息的依赖计算资源需求大 [48,67−69] 模型驱动的
深度学习信号检测处理 将雷达通信的物理底层原理与深度学习
框架相结合,更易于模型训练模型的表达能力受制于理论假设 [70] 表 2 基于人工智能的双功能雷达通信一体化算法比较
Table 2. Comparison of dual-functional radar communication algorithms based on AI
算法类型 适用的核心问题 优点 缺点 文献 深度学习 波束赋形优化 通过损失函数设计实现性能折中,
可解决复杂的非凸优化问题模型易过拟合,泛化能力不足 [76,77,79,81] 在线学习 波束赋形优化、面向动态
需求的资源管控通过处理小批样本,实时捕捉环境变化,
可动态优化波束指向与管控策略难以处理高维度优化问题 [78,84] 强化学习 波束赋形优化 具备较强的全局优化能力,可用于时
变信道下的波束赋形数据采样效率较低 [82] 深度强化学习学习 面向动态需求的资源管控 利用神经网络处理高维度状态空间,
通过强化学习动态调整分配策略算法收敛速度较慢 [10,13] 多智能体深度强化学习 面向动态需求的资源管控 引入GNN的结构信息捕获能力,
可协调多智能体间的资源分配图结构快速变化会引起模型的
泛化能力下降[86] 迁移学习 面向动态需求的资源管控 加快了切换到新环境中的策略收敛速度 负迁移会导致学习性能下降 [37] -
[1] YANG Ping, XIAO Yue, XIAO Ming, et al. 6G wireless communications: Vision and potential techniques[J]. IEEE Network, 2019, 33(4): 70–75. doi: 10.1109/MNET.2019.1800418. [2] LIU Fan, CUI Yuanhao, MASOUROS C, et al. Integrated sensing and communications: Toward dual-functional wireless networks for 6G and beyond[J]. IEEE Journal on Selected Areas in Communications, 2022, 40(6): 1728–1767. doi: 10.1109/JSAC.2022.3156632. [3] ZHANG J A, RAHMAN M L, WU Kai, et al. Enabling joint communication and radar sensing in mobile networks-a survey[J]. IEEE Communications Surveys & Tutorials, 2022, 24(1): 306–345. doi: 10.1109/COMST.2021.3122519. [4] LIU An, HUANG Zhe, LI Min, et al. A survey on fundamental limits of integrated sensing and communication[J]. IEEE Communications Surveys & Tutorials, 2022, 24(2): 994–1034. doi: 10.1109/COMST.2022.3149272. [5] XIAO Zhiqiang and ZENG Yong. An overview on integrated localization and communication towards 6G[J]. Science China Information Sciences, 2022, 65(3): 131301. doi: 10.1007/s11432-020-3218-8. [6] 霍曼, 邓中卫. 国外军用飞机航空电子系统发展趋势[J]. 航空电子技术, 2004, 35(4): 5–10. doi: 10.3969/j.issn.1006-141X.2004.04.002.HUO Man and DENG Zhongwei. Development trend of foreign military avionics[J]. Avionics Technology, 2004, 35(4): 5–10. doi: 10.3969/j.issn.1006-141X.2004.04.002. [7] QUAN Siji, QIAN Weiping, GUO J, et al. Radar-communication integration: An overview[C]. The 7th IEEE/International Conference on Advanced Infocomm Technology, Fuzhou, China, 2014: 98–103. doi: 10.1109/ICAIT.2014.7019537. [8] FENG Zhiyong, FANG Zixi, WEI Zhiqing, et al. Joint radar and communication: A survey[J]. China Communications, 2020, 17(1): 1–27. doi: 10.23919/JCC.2020.01.001. [9] LIU Keqin and ZHAO Qing. Indexability of restless bandit problems and optimality of whittle index for dynamic multichannel access[J]. IEEE Transactions on Information Theory, 2010, 56(11): 5547–5567. doi: 10.1109/TIT.2010.2068950. [10] HIEU N Q, HOANG D T, LUONG N C, et al. iRDRC: An intelligent real-time dual-functional radar-communication system for automotive vehicles[J]. IEEE Wireless Communications Letters, 2020, 9(12): 2140–2143. doi: 10.1109/LWC.2020.3014972. [11] ZHANG J A, LIU Fan, MASOUROS C, et al. An overview of signal processing techniques for joint communication and radar sensing[J]. IEEE Journal of Selected Topics in Signal Processing, 2021, 15(6): 1295–1315. doi: 10.1109/JSTSP.2021.3113120. [12] LIU Fan, MASOUROS C, PETROPULU A P, et al. Joint radar and communication design: Applications, state-of-the-art, and the road ahead[J]. IEEE Transactions on Communications, 2020, 68(6): 3834–3862. doi: 10.1109/TCOMM.2020.2973976. [13] WANG Min, CHEN Peng, CHEN Zhimin, et al. Reinforcement learning-based UAVs resource allocation for radar-communication integrated system[C]. 2021 IEEE International Conference on Radar, Haikou, Hainan, China, 2021: 2212–2215. doi: 10.1109/Radar53847.2021.10028618. [14] MU Junsheng, GONG Yi, ZHANG Fangpei, et al. Integrated sensing and communication-enabled predictive beamforming with deep learning in vehicular networks[J]. IEEE Communications Letters, 2021, 25(10): 3301–3304. doi: 10.1109/LCOMM.2021.3098748. [15] YANG Liu, WEI Yifei, FENG Zhiyong, et al. Deep reinforcement learning-based resource allocation for integrated sensing, communication, and computation in vehicular network[J]. IEEE Transactions on Wireless Communications, 2024, 23(12): 18608–18622. doi: 10.1109/TWC.2024.3470873. [16] ZHAI Weitong, WANG Xiangrong, CAO Xianbin, et al. Reinforcement learning based dual-functional massive MIMO systems for multi-target detection and communications[J]. IEEE Transactions on Signal Processing, 2023, 71: 741–755. doi: 10.1109/TSP.2023.3252885. [17] FRI C and ELOUAHBI R. Machine learning and deep learning applications in e-learning systems: A literature survey using topic modeling approach[C]. 2020 6th IEEE Congress on Information Science and Technology, Agadir-Essaouira, Morocco, 2020: 267–273. doi: 10.1109/CiSt49399.2021.9357253. [18] THOMAS R N and GUPTA R. A survey on machine learning approaches and its techniques[C]. 2020 IEEE International Students' Conference on Electrical, Electronics and Computer Science, Bhopal, India, 2020: 1–6. doi: 10.1109/SCEECS48394.2020.190. [19] JANIESCH C, ZSCHECH P, and HEINRICH K. Machine learning and deep learning[J]. Electronic Markets, 2021, 31(3): 685–695. doi: 10.1007/s12525-021-00475-2. [20] JAGANNATH J, POLOSKY N, JAGANNATH A, et al. Machine learning for wireless communications in the Internet of things: A comprehensive survey[J]. Ad Hoc Networks, 2019, 93: 101913. doi: 10.1016/j.adhoc.2019.101913. [21] XIE Junfeng, YU F R, HUANG Tao, et al. A survey of machine learning techniques applied to software defined networking (SDN): Research issues and challenges[J]. IEEE Communications Surveys & Tutorials, 2019, 21(1): 393–430. doi: 10.1109/COMST.2018.2866942. [22] FENG Xu, NGUYEN K A, and LUO Zhiyuan. A survey of deep learning approaches for WiFi-based indoor positioning[J]. Journal of Information and Telecommunication, 2022, 6(2): 163–216. doi: 10.1080/24751839.2021.1975425. [23] TAVIK G C, HILTERBRICK C L, EVINS J B, et al. The advanced multifunction RF concept[J]. IEEE Transactions on Microwave Theory and Techniques, 2005, 53(3): 1009–1020. doi: 10.1109/TMTT.2005.843485. [24] 刘闯, 杜自成, 王伟. 多功能综合射频技术在地面无人战车上的应用[J]. 火控雷达技术, 2020, 49(4): 23–26. doi: 10.19472/j.cnki.1008-8652.2020.04.005.LIU Chuang, DU Zicheng, and WANG Wei. Application of multifunctional integrated RF technology on ground unmanned combat vehicles[J]. Fire Control Radar Technology, 2020, 49(4): 23–26. doi: 10.19472/j.cnki.1008-8652.2020.04.005. [25] CIFTLER B S, ALWARAFY A, and ABDALLAH M. Distributed DRL-based downlink power allocation for hybrid RF/VLC networks[J]. IEEE Photonics Journal, 2022, 14(3): 8632510. doi: 10.1109/JPHOT.2021.3139678. [26] 朱伟强, 王克让, 许华健, 等. 多功能综合一体化技术发展综述[J]. 航天电子对抗, 2020, 36(3): 1–10. doi: 10.16328/j.htdz8511.2020.03.001.ZHU Weiqiang, WANG Kerang, XU Huajian, et al. Development of multifunctional integration technology[J]. Aerospace Electronic Warfare, 2020, 36(3): 1–10. doi: 10.16328/j.htdz8511.2020.03.001. [27] GUPTA D, KIRICHENKO D E, DOTSENKO V V, et al. Modular, multi-function digital-RF receiver systems[J]. IEEE Transactions on Applied Superconductivity, 2011, 21(3): 883–890. doi: 10.1109/TASC.2010.2095399. [28] FILIP A and SHUTIN D. Cramér–Rao bounds for L‐band digital aeronautical communication system type 1 based passive multiple‐input multiple‐output radar[J]. IET Radar, Sonar & Navigation, 2016, 10(2): 348–358. doi: 10.1049/iet-rsn.2015.0202. [29] FIORANELLI F, LE KERNEC J, and SHAH S A. Radar for health care: Recognizing human activities and monitoring vital signs[J]. IEEE Potentials, 2019, 38(4): 16–23. doi: 10.1109/MPOT.2019.2906977. [30] ORLANDO V A. The mode S beacon radar system[J]. The Lincoln Laboratory Journal, 1989, 2(3): 345–362. [31] HUANG Yuhong. Challenges and opportunities of sub-6 GHz integrated sensing and communications for 5G-Advanced and beyond[J]. Chinese Journal of Electronics, 2024, 33(2): 323–325. doi: 10.23919/cje.2023.00.251. [32] STROHMEIER M, SCHÄFER M, LENDERS V, et al. Realities and challenges of nextgen air traffic management: The case of ADS-B[J]. IEEE Communications Magazine, 2014, 52(5): 111–118. doi: 10.1109/MCOM.2014.6815901. [33] 王飞, 于超鹏, 熊伟. 面向机载综合监视系统的ADS-B技术综述[J]. 航空工程进展, 2024, 15(2): 142–151. doi: 10.16615/j.cnki.1674-8190.2024.02.16.WANG Fei, YU Chaopeng, and XIONG Wei. ADS-B technology overview for the airborne integrated surveillance system[J]. Advances in Aeronautical Science and Engineering, 2024, 15(2): 142–151. doi: 10.16615/j.cnki.1674-8190.2024.02.16. [34] FORTINO G and PATHAN M. Integration of cloud computing and body sensor networks[J]. Future Generation Computer Systems, 2014, 35: 57–61. doi: 10.1016/j.future.2014.02.001. [35] JIANG Xikang, ZHANG Lin, and LI Lei. Multi-task learning radar transformer (MLRT): A personal identification and fall detection network based on IR-UWB radar[J]. Sensors, 2023, 23(12): 5632. doi: 10.3390/s23125632. [36] SLIZOV V and ANISHCHENKO L. Evaluating the effectiveness of using the 4-radar system for the contactless fall detection[C]. 2022 Ural-Siberian Conference on Biomedical Engineering, Radioelectronics and Information Technology, Yekaterinburg, Russian Federation, 2022: 048–051. doi: 10.1109/USBEREIT56278.2022.9923404. [37] HIEU N Q, HOANG D T, NIYATO D, et al. Transferable deep reinforcement learning framework for autonomous vehicles with joint radar-data communications[J]. IEEE Transactions on Communications, 2022, 70(8): 5164–5180. doi: 10.1109/TCOMM.2022.3182034. [38] YAO Yu, ZHAO Junhui, LI Zeqing, et al. Jamming and eavesdropping defense scheme based on deep reinforcement learning in autonomous vehicle networks[J]. IEEE Transactions on Information Forensics and Security, 2023, 18: 1211–1224. doi: 10.1109/TIFS.2023.3236788. [39] KHAWAR A, ABDELHADI A, and CLANCY C. Target detection performance of spectrum sharing MIMO radars[J]. IEEE Sensors Journal, 2015, 15(9): 4928–4940. doi: 10.1109/JSEN.2015.2424393. [40] XIAO Zhiqiang and ZENG Yong. Waveform design and performance analysis for full-duplex integrated sensing and communication[J]. IEEE Journal on Selected Areas in Communications, 2022, 40(6): 1823–1837. doi: 10.1109/JSAC.2022.3155509. [41] 刘凡, 袁伟杰, 原进宏, 等. 雷达通信频谱共享及一体化: 综述与展望[J]. 雷达学报, 2021, 10(3): 467–484. doi: 10.12000/JR20113.LIU Fan, YUAN Weijie, YUAN Jinhong, et al. Radar-communication spectrum sharing and integration: Overview and prospect[J]. Journal of Radars, 2021, 10(3): 467–484. doi: 10.12000/JR20113. [42] GUERRA A, GUIDI F, DARDARI D, et al. Reinforcement learning for UAV autonomous navigation, mapping and target detection[C]. 2020 IEEE/ION Position, Location and Navigation Symposium, Portland, USA, 2020: 1004–1013. doi: 10.1109/PLANS46316.2020.9110163. [43] LUONG N C, LU Xiao, HOANG D T, et al. Radio resource management in joint radar and communication: A comprehensive survey[J]. IEEE Communications Surveys & Tutorials, 2021, 23(2): 780–814. doi: 10.1109/COMST.2021.3070399. [44] QIAN Junhui, LOPS M, ZHENG Le, et al. Joint system design for coexistence of MIMO radar and MIMO communication[J]. IEEE Transactions on Signal Processing, 2018, 66(13): 3504–3519. doi: 10.1109/TSP.2018.2831624. [45] GRIFFITHS H, COHEN L, WATTS S, et al. Radar spectrum engineering and management: Technical and regulatory issues[J]. Proceedings of the IEEE, 2015, 103(1): 85–102. doi: 10.1109/JPROC.2014.2365517. [46] MA O, CHIRIYATH A R, HERSCHFELT A, et al. Cooperative radar and communications coexistence using reinforcement learning[C]. 2018 52nd Asilomar Conference on Signals, Systems, and Computers, Pacific Grove, USA, 2018: 947–951. doi: 10.1109/ACSSC.2018.8645080. [47] FARSAD N and GOLDSMITH A. Neural network detection of data sequences in communication systems[J]. IEEE Transactions on Signal Processing, 2018, 66(21): 5663–5678. doi: 10.1109/TSP.2018.2868322. [48] HE Hengtao, WEN Chaokai, JIN Shi, et al. A model-driven deep learning network for MIMO detection[C]. 2018 IEEE Global Conference on Signal and Information Processing, Anaheim, USA, 2018: 584–588. doi: 10.1109/GlobalSIP.2018.8646357. [49] GUO Xianzhen, SHI Qin, LIU Liang, et al. User-assisted networked sensing in OFDM cellular network with erroneous anchor position information[C]. 2024 IEEE International Conference on Acoustics, Speech and Signal Processing, Seoul, Korea, 2024: 8556–8560. doi: 10.1109/ICASSP48485.2024.10445920. [50] ROBERTON M and BROWN E R. Integrated radar and communications based on chirped spread-spectrum techniques[C]. IEEE MTT-S International Microwave Symposium Digest, Philadelphia, USA, 2003: 611–614. doi: 10.1109/MWSYM.2003.1211013. [51] HASSANIEN A, HIMED B, and RIGLING B D. A dual-function MIMO radar-communications system using frequency-hopping waveforms[C]. 2017 IEEE Radar Conference, Seattle, USA, 2017: 1721–1725. doi: 10.1109/RADAR.2017.7944485. [52] LV Xin, WANG Jinqi, JIANG Zhisheng, et al. A joint radar-communication system based on OCDM-OFDM scheme[C]. 2018 International Conference on Microwave and Millimeter Wave Technology, Chengdu, China, 2018: 1–3. doi: 10.1109/ICMMT.2018.8563361. [53] GAUDIO L, KOBAYASHI M, BISSINGER B, et al. Performance analysis of joint radar and communication using OFDM and OTFS[C]. 2019 IEEE International Conference on Communications Workshops, Shanghai, China, 2019: 1–6. doi: 10.1109/ICCW.2019.8757044. [54] WEN C K, SHIH W T, and JIN Shi. Deep learning for massive MIMO CSI feedback[J]. IEEE Wireless Communications Letters, 2018, 7(5): 748–751. doi: 10.1109/LWC.2018.2818160. [55] KUMARI P, GONZALEZ-PRELCIC N, and HEATH R W. Investigating the IEEE 802.11 ad standard for millimeter wave automotive radar[C]. 2015 IEEE 82nd Vehicular Technology Conference, Boston, USA, 2015: 1–5. doi: 10.1109/VTCFall.2015.7390996. [56] CHIRIYATH A R, PAUL B, and BLISS D W. Radar-communications convergence: Coexistence, cooperation, and co-design[J]. IEEE Transactions on Cognitive Communications and Networking, 2017, 3(1): 1–12. doi: 10.1109/TCCN.2017.2666266. [57] LI Bo, PETROPULU A P, and TRAPPE W. Optimum co-design for spectrum sharing between matrix completion based MIMO radars and a MIMO communication system[J]. IEEE Transactions on Signal Processing, 2016, 64(17): 4562–4575. doi: 10.1109/TSP.2016.2569479. [58] PULKKINEN P and KOIVUNEN V. Model-based online learning for resource sharing in joint radar-communication systems[C]. 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, Singapore, Singapore, 2022: 4103–4107. doi: 10.1109/ICASSP43922.2022.9747269. [59] SELVI E, BUEHRER R M, MARTONE A, et al. Reinforcement learning for adaptable bandwidth tracking radars[J]. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(5): 3904–3921. doi: 10.1109/TAES.2020.2987443. [60] THORNTON C E, KOZY M A, BUEHRER R M, et al. Deep reinforcement learning control for radar detection and tracking in congested spectral environments[J]. IEEE Transactions on Cognitive Communications and Networking, 2020, 6(4): 1335–1349. doi: 10.1109/TCCN.2020.3019605. [61] THORNTON C E, BUEHRER R M, MARTONE A F, et al. Experimental analysis of reinforcement learning techniques for spectrum sharing radar[C]. 2020 IEEE International Radar Conference, Washington, USA, 2020: 67–72. doi: 10.1109/RADAR42522.2020.9114698. [62] ZHENG Le, LOPS M, and WANG Xiaodong. Adaptive interference removal for uncoordinated radar/communication coexistence[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 45–60. doi: 10.1109/JSTSP.2017.2785783. [63] LIU Fan, MASOUROS C, LI Ang, et al. MIMO radar and cellular coexistence: A power-efficient approach enabled by interference exploitation[J]. IEEE Transactions on Signal Processing, 2018, 66(14): 3681–3695. doi: 10.1109/TSP.2018.2833813. [64] VAN HUYNH N, NGUYEN D N, HOANG D T, et al. “Jam me if you can:” Defeating jammer with deep dueling neural network architecture and ambient backscattering augmented communications[J]. IEEE Journal on Selected Areas in Communications, 2019, 37(11): 2603–2620. doi: 10.1109/JSAC.2019.2933889. [65] SHAN Zhao, LIU Pengfei, WANG Lei, et al. A cognitive multi-carrier radar for communication interference avoidance via deep reinforcement learning[J]. IEEE Transactions on Cognitive Communications and Networking, 2023, 9(6): 1561–1578. doi: 10.1109/TCCN.2023.3306854. [66] OTTER D W, MEDINA J R, and KALITA J K. A survey of the usages of deep learning for natural language processing[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(2): 604–624. doi: 10.1109/TNNLS.2020.2979670. [67] HE Hengtao, WEN Chaokai, JIN Shi, et al. Model-driven deep learning for MIMO detection[J]. IEEE Transactions on Signal Processing, 2020, 68: 1702–1715. doi: 10.1109/TSP.2020.2976585. [68] HUYNH-THE T, PHAM Q V, NGUYEN T V, et al. Deep learning for coexistence radar-communication waveform recognition[C]. 2021 International Conference on Information and Communication Technology Convergence, Jeju Island, Korea, 2021: 1725–1727. doi: 10.1109/ICTC52510.2021.9620950. [69] LIU Chenguang, CHEN Yunfei, and YANG Shuanghua. Deep learning based detection for communications systems with radar interference[J]. IEEE Transactions on Vehicular Technology, 2022, 71(6): 6245–6254. doi: 10.1109/TVT.2022.3158692. [70] JIANG Wangjun, MA Dingyou, WEI Zhiqing, et al. ISAC-NET: Model-driven deep learning for integrated passive sensing and communication[J]. IEEE Transactions on Communications, 2024, 72(8): 4692–4707. doi: 10.1109/TCOMM.2024.3375818. [71] WU Yongzhi, LEMIC F, HAN Chong, et al. Sensing integrated DFT-spread OFDM waveform and deep learning-powered receiver design for terahertz integrated sensing and communication systems[J]. IEEE Transactions on Communications, 2023, 71(1): 595–610. doi: 10.1109/TCOMM.2022.3225920. [72] RAVITEJA P, HONG Y, VITERBO E, et al. Effective diversity of OTFS modulation[J]. IEEE Wireless Communications Letters, 2020, 9(2): 249–253. doi: 10.1109/LWC.2019.2951758. [73] O’SHEA T and HOYDIS J. An introduction to deep learning for the physical layer[J]. IEEE Transactions on Cognitive Communications and Networking, 2017, 3(4): 563–575. doi: 10.1109/TCCN.2017.2758370. [74] ZHU Zhengyu, GONG Mengfei, SUN Gangcan, et al. AI-enabled STAR-RIS aided MISO ISAC secure communications[J]. Tsinghua Science and Technology, 2025, 30(3): 998–1011. doi: 10.26599/TST.2024.9010086. [75] XU Jiarui, JERE S, SONG Yifei, et al. Learning at the speed of wireless: Online real-time learning for AI-enabled MIMO in NextG[J]. IEEE Communications Magazine, 2025, 63(1): 92–98. doi: 10.1109/MCOM.001.2300529. [76] ELBIR A M and MISHRA K V. Deep learning design for joint antenna selection and hybrid beamforming in massive MIMO[C]. 2019 IEEE International Symposium on Antennas and Propagation and USNC-URSI Radio Science Meeting, Atlanta, USA, 2019: 1585–1586. doi: 10.1109/APUSNCURSINRSM.2019.8888753. [77] YANG Ruming, ZHU Zhiming, ZHANG Jiexin, et al. Deep learning-based joint transmit beamforming for dual-functional radar-communication system[J]. IEEE Transactions on Wireless Communications, 2024, 23(10): 15198–15211. doi: 10.1109/TWC.2024.3427368. [78] LIANG Jiachao and HUANG Yongwei. Online learning network methods for a joint transmit waveform and receive beamforming design for a DFRC system[C]. 2023 IEEE Statistical Signal Processing Workshop, Hanoi, Vietnam, 2023: 482–486. doi: 10.1109/SSP53291.2023.10207956. [79] ZHAO Yifei, WANG Zixin, WANG Zhibin, et al. Learning to beamform for dual-functional MIMO radar-communication systems[C]. IEEE International Conference on Communications, Rome, Italy, 2023: 3572–3577. doi: 10.1109/ICC45041.2023.10279159. [80] YUAN Weijie, LIU Fan, MASOUROS C, et al. Bayesian predictive beamforming for vehicular networks: A low-overhead joint radar-communication approach[J]. IEEE Transactions on Wireless Communications, 2021, 20(3): 1442–1456. doi: 10.1109/TWC.2020.3033776. [81] LIU Chang, YUAN Weijie, LI Shuangyang, et al. Learning-based predictive beamforming for integrated sensing and communication in vehicular networks[J]. IEEE Journal on Selected Areas in Communications, 2022, 40(8): 2317–2334. doi: 10.1109/JSAC.2022.3180803. [82] ZHAO Chonghao, WU Gang, and XIONG Wenhui. Decentralized multiagent reinforcement learning-based cooperative perception with dual-functional radar-communication V2V links[C]. 2023 IEEE International Conference on Communications Workshops, Rome, Italy, 2023: 1100–1105. doi: 10.1109/ICCWorkshops57953.2023.10283653. [83] CHOI J, VA V, GONZALEZ-PRELCIC N, et al. Millimeter-wave vehicular communication to support massive automotive sensing[J]. IEEE Communications Magazine, 2016, 54(12): 160–167. doi: 10.1109/MCOM.2016.1600071CM. [84] PULKKINEN P and KOIVUNEN V. Model-based online learning for joint radar-communication systems operating in dynamic interference[C]. The 30th European Signal Processing Conference, Belgrade, Serbia, 2022: 992–996. doi: 10.23919/EUSIPCO55093.2022.9909601. [85] GRONAUER S and DIEPOLD K. Multi-agent deep reinforcement learning: A survey[J]. Artificial Intelligence Review, 2022, 55(2): 895–943. doi: 10.1007/s10462-021-09996-w. [86] LEE J, CHENG Yanyu, NIYATO D, et al. Intelligent resource allocation in joint radar-communication with graph neural networks[J]. IEEE Transactions on Vehicular Technology, 2022, 71(10): 11120–11135. doi: 10.1109/TVT.2022.3187377. [87] SELVI E, BUEHRER R M, MARTONE A, et al. On the use of Markov decision processes in cognitive radar: An application to target tracking[C]. 2018 IEEE Radar Conference, Oklahoma City, USA, 2018: 537–542. doi: 10.1109/RADAR.2018.8378616. [88] ZHANG Xi and ZHU Qixuan. Federated learning based integrated sensing, communications, and powering over 6G massive-MIMO mobile networks[C]. IEEE Conference on Computer Communications Workshops, Vancouver, Canada, 2024: 1–6. doi: 10.1109/INFOCOMWKSHPS61880.2024.10620738. [89] CHU N H, HOANG D T, NGUYEN D N, et al. Joint speed control and energy replenishment optimization for UAV-assisted IoT data collection with deep reinforcement transfer learning[J]. IEEE Internet of Things Journal, 2023, 10(7): 5778–5793. doi: 10.1109/JIOT.2022.3151201. -