HRT-Net: A Cell-free Cooperative Sensing Method Based on Attention-weighted Hierarchical Network
-
摘要: 该文针对雷达通信一体化系统中多站协作感知的问题,提出了一种基于无蜂窝网络架构的智能框架HRT-Net,用于实现准确且资源高效的位置估计。具体而言,该文首先将感知区域划分为多个子区域,并基于深度可分离卷积设计了一个轻量级的区域选择网络,以识别目标所属的子区域,从而减少计算负担并实现广域覆盖。其次,考虑到多站数据差异性的隐式问题,该文设计了一种分通道单维注意力机制,旨在有效聚合多站的感知数据并增强特征的提取和表示能力,从而生成注意力权重图以加权修正原始特征。最后,基于多尺度和多重残差连接设计了一个目标定位网络,该网络能够提取更加全面和深层的特征并实现多级特征融合,进而可靠地将其映射到目标的位置坐标。仿真及实测实验结果表明,相比于现有方法,HRT-Net在较低计算复杂度和存储开销下,能够实现厘米级的目标定位。Abstract: This paper proposes an intelligent framework based on a cell-free network architecture, called HRT-Net. HRT-Net is designed to enhance multi-station collaborative sensing problems for joint radar and communication systems, offering accurate and resource-efficient target location estimation. First, the sensing area is divided into sub-regions and a lightweight region selection network employing depthwise separable convolution; this approach coarsely identifies the target’s sub-region, reducing computational demands and enabling extensive area coverage. To tackle interstation data disparity, we propose a channel-wise unidimensional attention mechanism. This mechanism aggregates multi-station sensing data effectively, enhancing feature extraction and representation by generating attention weight maps that refine the original features. Finally, we design a target localization network featuring multi-scale and multi-residual connections. This network extracts comprehensive, deep features and achieves multi-level feature fusion, allowing for reliable mapping of data to the target coordinates. Extensive simulations and real-world experiments validate the effectiveness and robustness of our scheme. The results show that compared with the existing methods, HRT-Net achieves centimeter-level target localization with low computational complexity and minimal storage overhead.
-
1. 引言
随着物联网和智能交通的蓬勃发展,自动驾驶、无人机等许多应用对通信和雷达感知提出了更高的要求。传统的通信和雷达系统往往是分立的,难以满足这些新兴场景对高效、精确感知和通信的双重需求[1,2]。因此,作为一种关键的使能技术,雷达通信一体化应运而生,成为学术界和工业界关注的焦点[3,4]。然而,传统蜂窝网络中单站覆盖范围受限,难以获取站内目标的多视角信息,且存在邻区干扰,不利于感知功能的实现[5]。此外,实现小区间协作通常需要额外的方案设计和资源消耗。多节点网络化协作是移动网络的发展趋势,同时也为感知带来了新的可能性。通过协调移动网络中多节点进行感知信号的联合收发,可以避免单节点感知所引起的自干扰[6]。此外,通过联合处理多节点感知信息,可以实现类似于通信中空间分集的接收处理增益,提升感知精度并扩大感知范围[7,8]。作为网络化协作的一种具体实现方式,无蜂窝大规模多输入多输出(Cell-Free Massive Multiple-Input Multiple-Output, CF-mMIMO)技术[9]已成为研究热点之一。首先,通过灵活的多节点调度方案,CF-mMIMO可以根据实际需求为用户或目标形成专门的簇,从而获得更加全面的感知信息,有助于实现以目标为中心的感知任务[10]。其次,CF-mMIMO没有传统意义上的小区概念,有效避免了邻区干扰和跨区切换等问题,使得干扰管控更加精简。此外,由于其高频谱效率和广域覆盖等优点,CF-mMIMO被视为未来物联网系统的重要技术支撑[11,12]。因此,研究如何在CF-mMIMO雷达一体化系统中实现协作感知具有前瞻性与必要性。
多节点协作感知的实现通常基于蕴含目标位置信息的参数交汇定位体制[13],例如到达时间(Time of Arrival, ToA)[14−16]、到达时间差(Time Difference of Arrival, TDOA)[17,18]和到达角(Angle of Arrival, AoA)[19,20]。文献[21]设计了一个协作式CF-mMIMO雷达通信一体化系统,并提出了一种联合AoA和飞行时间(Time of Flight, ToF)的多站定位方法。文献[22]提出了一种联合接收信号强度(Received Signal Strength, RSS)和AoA的协作感知方法。考虑到所估计的参数中可能存在异常值,文献[23]提出了一种基于最大似然的目标定位方法。该方法可以有效剔除误差较大的病态估计值,从而实现高精度的目标定位。文献[24]提出了一种协作冗余校验方法,旨在检测异常值。该方法有效地保证了多节点参数的可靠融合,提高了目标定位的精度。此外,文献[25]提出了一种基于蒙特卡罗重要性抽样的迭代算法,用于获得各节点关于ToA和AoA似然函数的最优融合权重,有效提高了定位精度。进一步地,文献[26]针对CF-mMIMO系统中的移动目标定位问题,提出了一种时间-序列协作感知框架。该框架通过联合已估计的AoA和目标运动方程,在时变环境下实现了高精度定位。基于多节点参数级融合的目标定位方法计算复杂度较低,但在密集的多径环境下,其定位精度较差。此外,参数间的关联性处理也面临较大的挑战。
基于信号级融合的协作感知方案不需要各节点独立进行参数估计,可以高度保留原始信号中有效的感知信息,从而提高感知精度并扩大感知范围[27]。文献[28]提出了一种基于正交时频空(Orthogonal Time Frequency Space, OTFS)技术的雷达通信一体化方案,并推导了一个协作的最大似然架构。该架构能够直接利用各节点的接收信号来实现目标位置估计。考虑到功率、前传容量等实际约束,文献[29]基于帕累托优化机制构建了以信号级协作感知为中心的优化问题,并提出了一种基于连续凸逼近的算法,用于近似求解最优的帕累托边界,即实现精确的目标定位。然而,高精度的时钟同步和空间同步要求限制了这类方案的应用。为此,文献[30]提出了一种基于波束宽度可调的空间配准算法,用于实现感知区域的空间同步,从而进一步增强信号间的融合程度,提升感知能力。此外,文献[31]引入了一种分层的同步算法,成功实现了多站信号的相位同步,显著提高了感知精度。
尽管已有文献试图应对目标定位中存在的现实挑战,但诸如不完美的时间同步[32]、接入点(Access Point, AP)位置扰动和多通道接收机中的增益-相位不匹配[33,34]等限制因素,仍阻碍了定位精度的进一步提高。深度学习凭借其强大的非线性拟合能力,为高精度定位提供了新的解决范式[35]。文献[36]提出了一种基于多层感知机的定位模型,通过输入多节点的测距相关曲线获得雷达通信一体化系统中目标的精确位置。进一步,针对信号遮挡的问题,文献[37]提出了一种基于教师-学生贝叶斯神经网络的定位方法,能够实现目标的实时定位。此外,针对非理想信道状态信息,文献[38]推导出了CF-mMIMO雷达通信一体化系统中定位误差率的闭式表达式,并提出了一种基于深度Q网络的优化算法,以实现准确的目标定位。进一步考虑定位效率,文献[39]提出了一种用于表征定位精度和效率的感知效用函数,并通过基于变分自编码器的优化算法,获得了最优的目标位置。然而,深度学习类算法需要在离线阶段对大规模数据进行预训练,这导致在广泛感知区域应用时需要复杂的数据收集和承担巨大的计算负担。此外,在实现多节点协作感知时,现有文献缺乏对站间数据差异性的建模,不同站对目标定位的贡献应有所不同[40]。
针对上述问题,本文基于深度学习设计了一种两阶段的多节点协作感知网络框架HRT-Net。该框架先执行区域选择,再进行目标定位。在前一个阶段,首先将整个感知区域划分为多个子区域,并基于深度可分离卷积设计了一个轻量级的区域选择网络,以实现目标的子区域识别。该网络在实现高识别精度的同时,降低资源消耗,为后续的目标定位任务奠定基础。在后一阶段,针对多站数据差异性的隐式问题,本文首先设计了分通道单维注意力机制。该机制首先通过最大池化和平均池化有效聚合多站的感知数据,以提取重要特征并增强表示能力[41]。随后将所得特征描述符转发至由标准卷积和Sigmoid激活函数构成的共享网络,以生成多站的注意力权重图。最终与原始特征进行元素级相乘。这一过程有效利用了多站感知数据中蕴藏的隐层特征,使得加权修正后的特征在隐空间具有较好的一致性。然后,构建了一个精细化的目标定位网络,以实现准确且资源高效的位置估计。该网络基于多尺度卷积和多残差连接,灵活提取多维度、深层次的丰富特征,同时有效缓解网络退化问题,增强了网络的鲁棒性。最后,基于大量的仿真和实测实验评估了HRT-Net的有效性和合理性。结果表明,本文方法能够在CF-mMIMO雷达通信一体化系统中有效实现多节点协作感知,获得优于对比方案的定位精度和效率。
2. 系统模型
考虑一个由U个单天线用户设备(User Equipment, UE)和N个随机分布的AP组成的CF-mMIMO雷达通信一体化系统,如图1所示,其中每个AP配备一个每行Mx天线和每列My天线的均匀平面阵列(Uniform Planar Array, UPA),则每个AP的天线总数为M=MxMy。考虑目标随机分布在环境中,假设T个AP发送感知信号,R个AP同时接收感知信号和来自UE的通信信号,以实现雷达通信一体化。所有AP共享频谱资源,并通过回程链路与中央处理器(Central Processing Unit, CPU)建立连接。
2.1 信号模型
在CF-mMIMO雷达通信一体化系统中,采用正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)波形,由间隔为Δf Hz的K个子载波组成,载波频率记为fc。一个相干处理间隔(Coherent Processing Interval, CPI)内传输L个符号,每Tp秒传输一个符号。因此,第r个接收AP在第k个子载波和第l个符号的接收信号yr(k,l)∈CM可以表示为
yr(k,l)=U∑u=1husu(k,l)⏟通信信号+T∑t=1Hr,t(k,l)xt(k,l)⏟感知信号+n(k,l) (1) 其中,hu∈CM表示第u个UE的通信信道,Hr,t(k,l)∈CM×M表示从第t个发送AP到第r个接收AP的感知信道,su(k,l)和xt(k,l)∈CM分别表示由第u个UE发送的通信信号和由第t个发送AP发送的感知信号。n(k,l)∈CM表示服从复高斯分布CN(0,σ2IM)的加性噪声,其中,IM表示M×M阶的单位矩阵。
感知信号用于实现目标定位。为此,将接收AP的通信信号和感知信号分离是重要的。Temiz等人[42]设计了一种先进的接收机架构通过干扰消除技术来实现这一目的。在实际系统中,通信信号和感知信号的分离通常使用分时技术。因此,可以合理地假设,在进行目标定位时,接收AP只收到感知信号。此外,正交导频信号应用在感知链路中,使得接收AP可以区分来自不同发送AP的感知信号。同时,为了增强接收信号的方向性,在接收AP上采用接收波束成形器w∈CM。因此,第r个接收AP接收到来自第t个发送AP的接收感知信号˜yr,t(k,l)可以表示为
˜yr,t(k,l)=wHHr,t(k,l)xt(k,l)+˜n(k,l) (2) 其中,˜n(k,l)∈CN(0,σ2)为加性复高斯白噪声,上标(⋅)H表示共轭转置操作。
2.2 混合远近场信道模型
对于CF-mMIMO雷达通信一体化系统而言,整个系统可以等效为一个分布式孔径阵列。这使得结合不同AP进行目标定位成为可能。由于不同AP之间的距离相对较大,系统整体符合近场信道模型。不同AP的信号相位差需要用距离来表示。图2具体描述了单AP场景和无蜂窝场景下的近场范围半径。以30 GHz为例,当单AP天线孔径为0.08 m时,近场范围半径为1.28 m。然而,针对无蜂窝场景,当整个分布式阵列孔径为10 m时,近场范围达到了20 km。此外,对于单个AP而言,其天线之间的相位差用角度表示,即AoA和离开角(Angle of Departure, AoD)。基于上述分析,CF-mMIMO雷达通信一体化系统的感知信道成为近场模型和远场模型的混合。
第t个发送AP与第r个接收AP之间的混合远近场信道模型可以表示为
Hr,t(k,l)=αr,te−j2π(kΔfc+1λ)dr,te−j2πlTpfdaraHt (3) 其中,αr,t表示从第t个发送AP到第r个接收AP的衰减,c为光速,fd为多普勒频移。λ为载波波长,等于λ=c/fc。j=√−1是虚数单位。dr,t表示第t个发送AP与第r个接收AP之间的双基距离,这导致了它们之间的相位差。基于图1所示的几何散射模型,dr,t可以表示为dr,t=dr+dt,其中dr和dt分别表示目标与第r个接收AP和第t个发送AP之间的距离。
dr=√(xq−xr)2+(yq−yr)2 (4) dt=√(xq−xt)2+(yq−yt)2 (5) 其中,(xq,yq), (xr,yr)和(xt,yt)分别表示目标、第r个接收AP和第t个发送AP的坐标。ar∈CM和at∈CM分别表示第r个接收AP和第t个发送AP的阵列导向矢量。
ar=ar,y⊗ar,x (6) at=at,y⊗at,x (7) 同时有
ar,y=[1 e−j2πλdsinθr ⋯ e−j2πλ(My−1)dsinθr]T (8) ar,x=[1 e−j2πλdsinφrcosθr ⋯ e−j2πλ(Mx−1)dsinφrcosθr]T (9) at,y=[1 e−j2πλdsinθt ⋯ e−j2πλ(My−1)dsinθt]T (10) at,x=[1 e−j2πλdsinφtcosθt ⋯ e−j2πλ(Mx−1)dsinφtcosθt]T (11) 其中,符号⊗表示克罗内克积,上标(⋅)T表示转置操作。d, φr, θr, φt和θt分别表示UPA的天线间距、第r个接收AP的方位角、第r个接收AP的俯仰角、第t个发送AP的方位角和第t个发送AP的俯仰角。
3. HRT-Net的设计
为利用多站接收到的回波信号实现协作目标定位,本文设计了HRT-Net,整体架构如图3所示,包括数据预处理、区域选择网络、分通道单维注意力机制和目标定位网络。
3.1 数据预处理
在CF-mMIMO雷达通信一体化系统中,CPU通过回程链路接收来自所有接收AP的上传信号。将第t个发送AP与第r个接收AP的接收信号记为˜ytr。然后将它们堆叠形成接收信号矩阵˜Y=[˜y1 ˜y2 ⋯ ˜yTR]∈CKL×TR,其中KL由子载波数和符号数相乘所得,TR由发送AP数和接收AP数相乘所得。接收信号矩阵˜Y为复数矩阵,而深度学习算法是实数运算。为此,将接收信号矩阵˜Y的实部和虚部进行拆分,作为输入特征的两个通道,表示为˜Yin∈RKL×TR×2,如图3的数据预处理部分所示。
3.2 区域选择网络
随着复杂场景对精确感知需求的不断提升,在大范围区域内直接实现目标定位往往需要消耗大量内存并延长响应时间。因此,在目标定位之前,将整个区域划分为各个子区域,优先进行目标的子区域选择是一种更高效的策略。结合深度可分离卷积[43,44],本文设计了一种轻量级的区域选择网络,用于实现目标的子区域识别,具体包括基本卷积模块、轻量级卷积模块和回归模块,如图3的区域选择网络部分所示。
3.2.1 基本卷积模块
由于直接对原始输入实施轻量级卷积操作可能导致模型所捕获的特征缺乏丰富性和精确性,在此之前,首先通过基本卷积模块提取˜Yin的基础特征,同时为了减小计算负担和确保区域选择网络的轻量级特性,其只由一个基本卷积单元构成,包括标准卷积、批归一化、修正线性单元(Rectified Linear Unit, ReLU)激活函数和最大池化。标准卷积具有强大的特征提取能力,使其在深度学习中得到了广泛的应用,批归一化则用于加速收敛速度和防止过拟合。此外,为了解决训练中可能出现的梯度消失问题,选择ReLU激活函数,同时使用最大池化实现下采样进行特征压缩。
3.2.2 轻量级卷积模块
为了降低区域选择网络的计算复杂度和存储开销,本文引入了深度可分离卷积的概念。深度可分离卷积将标准卷积划分为两个子运算,分别为深度(Depthwise, DW)卷积和逐点(Pointwise, PW)卷积,也称为1×1卷积。相比于标准卷积在单一步骤中进行滤波并将输入合并到新的输出集,深度可分离卷积将其划分为两层,如图4所示。DW卷积通过对每个输入通道应用单个滤波器实现轻量级滤波,以获取空间维度的特征,然后通过应用PW卷积进行通道间的信息组合,有效地解决了不同通道间信息流不足的问题。最终,深度可分离卷积能够生成与标准卷积大小相同的特征图,但参数量和计算量大大减小。从数学的角度定量分析,假设输入特征图和输出特征图均为正方形且具有相同的空间维度Wfeature,输入通道和输出通道分别为Cin和Cout,卷积核为正方形,空间维度记为Wkernel。因此,对于标准卷积而言,计算量为
Coststd=Wkernel⋅Wkernel⋅Cin⋅Cout⋅Wfeature⋅Wfeature (12) 由于深度卷积是分通道单独进行滤波且逐点卷积的卷积核尺寸为1×1,深度可分离卷积的计算量为
Costdws=Wkernel⋅Wkernel⋅Cin⋅Wfeature⋅Wfeature+Cin⋅Cout⋅Wfeature⋅Wfeature (13) 因此,以Costdws与Coststd的比值来表征计算量的减少,即
CostdwsCoststd=Wkernel⋅Wkernel⋅Cin⋅Wfeature⋅Wfeature+Cin⋅Cout⋅Wfeature⋅WfeatureWkernel⋅Wkernel⋅Cin⋅Cout⋅Wfeature⋅Wfeature=1Cout+1(Wkernel)2 (14) 除了采用深度可分离卷积替代标准卷积之外,轻量级卷积单元还引入了残差连接,具体实现细节如图3的区域选择网络部分所示。该单元的主路径依次为DW卷积、批归一化、ReLU激活函数、PW卷积以及再次的批归一化,然后主路径的输出特征与经过PW卷积的辅助路径的输出特征进行元素级相加,最终通过ReLU激活函数。值得注意的是,为保证主路径和辅助路径的输出特征能够进行元素级相加,二者在空间维度和通道维度上必须保持一致,这就导致DW卷积和PW卷积的参数需要合理设置。假设主路径和辅助路径的PW卷积参数一致,同时输入特征、输出特征和卷积核满足上述假设,根据二维卷积的尺寸计算公式[45]可以得到
Wfeature=Wfeature−Wkernel+2×paddingstride+1 (15) 其中,padding和stride分别代表卷积的填充量和步长,等式右边分子的Wfeature代表输入特征图的空间维度,而等式左边的Wfeature代表输出特征图的空间维度。具体的参数值将在4.1节给出。综上所述,轻量级卷积单元的引入显著降低了区域选择网络的响应时延并减少了内存占用,有效地节省了计算资源。此外,残差连接的应用缓解了网络退化问题,使得网络可以堆叠更多的层次结构,进而提取更深层且更高级的特征,以提升目标子区域识别的精度。然而,增加网络层数必然会增加训练成本,这与轻量化设计的目标相悖。因此,本文采用6层轻量级卷积单元构成轻量级卷积模块,以平衡模型复杂性与计算效率。
3.2.3 回归模块
回归模块用于输出目标所属的子区域,包括一个全局平均池化和一个全连接层。全局平均池化将特征图的空间维度降低为1,并保留每个通道的平均值。通过这种方式,可以有效降低特征图的维度,从而降低模型的参数量和计算复杂度。与传统的使用多个全连接层的方法相比,提高了模型的泛化能力,防止了过拟合。最后,将全局平均池化的输出作为全连接层的输入,得到输出标签RI∈RS,其中,S代表子区域个数,目标所属子区域对应的索引位置设置为1,其余位置设置为0。
3.3 分通道单维注意力机制
在区域选择网络之后,精确的目标定位将在各个子区域内实现。然而,需要指出的是,在此之前仍然存在一个挑战,即尽管不同的AP共享相同的资源,但由于传播路径和衰减程度的不同,它们对目标定位的贡献也各不相同[46]。换言之,多站感知数据之间潜藏着隐性差异,这种差异可能会影响目标定位的准确性。为了应对这一问题,本文将输入特征˜Yin视为传统的图像数据,并设计了一种新颖的、可解释的分通道单维注意力机制以识别其关键区域,进而通过加权修正使其在隐空间具有较好的一致性,从而提升目标定位的精度。
图3的分通道单维注意力机制部分展示了其具体流程。考虑到输入特征˜Yin通道间的独立性,首先将其沿通道维度划分成˜Yrealin∈RKL×TR和˜Yimagin∈RKL×TR,然后各自经过注意力单元生成注意力权重矩阵Areal∈RKL×TR和Aimag∈RKL×TR,将其分别与原始特征进行元素级相乘,最终通过concat函数,将二者沿通道维度拼接,形成加权后的特征˜Yw∈RKL×TR×2。
注意力单元是分通道单维注意力机制的核心部件,其由最大池化、平均池化、标准卷积和sigmoid激活函数组成。需要强调的是,对于˜Yrealin和˜Yimagin而言,在空间维度上,关注的应该是发送和接收AP对的不同,而非子载波和符号的不同,因此最大池化和平均池化在单维度得以应用,其输出分别表示为
awchmax(tr)=max (16) {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{ch}}}({\mathrm{tr}}) = \frac{1}{{{\mathrm{KL}}}}\sum\limits_{{\mathrm{kl}} = 1}^{{\mathrm{KL}}} {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}}({\mathrm{kl}},{\mathrm{tr}})} ,{\text{ }}{\mathrm{tr}} = 1,2, \cdots ,{\mathrm{TR}} (17) 其中,上标ch取实部或虚部,表明是 \tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{real}}} 或 \tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{imag}}} 通过池化操作得到的, \max 函数表示对向量取最大值。利用concat函数沿通道维度将二者拼接,随后通过输入通道为2且输出通道为1的标准卷积进行加权求和,充分表征了由于发送和接收AP对的差异所引起的特征多样性。最终,利用sigmoid激活函数得到范围在0到1之间的注意力权重向量。值得注意的是,此时的注意力权重向量维度为TR,需要将其扩展成维度为 {\mathrm{KL}} \times {\mathrm{TR}} 的注意力权重矩阵。基于此,成功地应对了上述挑战,为在CF-mMIMO雷达通信一体化系统中实现多个AP协作目标定位提供了有力支撑。算法1总结了分通道单维注意力机制。
1 分通道单维注意力机制的计算流程1. Calculation process of sub-channel single dimensional attention mechanism输入:输入特征 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 输出:加权特征 {\tilde {\boldsymbol{Y}}_{\mathrm{w}}} 初始化参数: {\bf{aw}}_{\max}^{{\mathrm{real}}} , {\bf{aw}}_{\max}^{{\mathrm{imag}}} , {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{real}}} , {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{imag}}} , {{\boldsymbol{A}}^{{\mathrm{real}}}} , {{\boldsymbol{A}}^{{\mathrm{imag}}}} ,
\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{real}}} , \tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{imag}}}1. for {\mathrm{ch}} = 1,2 //1和2分别代表实部和虚部 2. for {\mathrm{tr}} = 1,2, \cdots ,{\mathrm{TR}} 3. {\bf{aw}}_{\max}^{{\mathrm{ch}}}({\mathrm{tr}}) = \max\left( {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}}(1:{\mathrm{KL}},{\mathrm{tr}})} \right) 4. {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{ch}}}({\mathrm{tr}}) = \dfrac{1}{{{\mathrm{KL}}}}\displaystyle\sum\limits_{{\mathrm{kl}} = 1}^{{\mathrm{KL}}} {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}}({\mathrm{kl}},{\mathrm{tr}})} 5. end 6. // {\mathrm{conv}} 函数和 {\mathrm{expand}} 函数分别代表标准卷积操作和扩展维
度操作7. {{\boldsymbol{A}}^{{\mathrm{ch}}}} = {\mathrm{expand}}({\mathrm{sigmoid}}({\mathrm{conv}}({\mathrm{concat}}({\bf{aw}}_{\max }^{{\mathrm{ch}}},{\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{ch}}})))) 8. \tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{ch}}} = {A^{{\mathrm{ch}}}} \odot \tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}} //符号 \odot 代表元素级相乘 9. end 10. {\tilde {\boldsymbol{Y}}_{\mathrm{w}}} = {\mathrm{concat}}(\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{real}}},\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{imag}}}) 3.4 目标定位网络
目标定位网络是HRT-Net的核心部分,如图3的目标定位网络部分所示,其由多尺度卷积模块、精细化卷积模块和回归模块组成,以输出高准确率的目标位置。接下来,将详细介绍每个模块的组成和具体功能。
3.4.1 多尺度卷积模块
考虑到不同的目标定位场景可能导致 {\tilde {\boldsymbol{Y}}_{\mathrm{w}}} 的特征信息的稀疏性发生变化,若其相对密集,则特征粒度会更细,此时具有较小的核尺寸的卷积能够更有效地提取精细的特征,相反,较大的卷积核更适用于稀疏的情况。因此,单一尺度的卷积神经网络可能难以有效适应特征粒度的变化,从而导致网络性能和鲁棒性的下降[47]。为了解决这个问题,本文提出了一种并行化的多尺度卷积模块以融合不同尺度的特征,进而增强网络的特征提取能力和适应性。具体来说,首先通过1个多尺度(Multi-scale, MS)卷积,也就是3个并行的标准卷积,其核尺寸分别为 3 \times 3 , 5 \times 5 和 9 \times 9 。然后利用concat函数沿通道维度将三者的输出进行拼接,需要指出的是,三者的输出特征在空间维度上必须保持一致,具体的参数值将在4.1节给出。紧接着,使用 1 \times 1 卷积将不同尺度的特征进行通道间的信息融合。最后,依次通过批归一化、ReLU激活函数和最大池化,从而实现加速收敛、防止梯度消失以及下采样的目的。需要指出的是,与3.4.2节中讨论的精细化卷积模块相比,多尺度卷积模块旨在提取较为浅层的特征,因此仅使用1层多尺度卷积单元,具体的层数可以根据定位场景或任务需求进行调整。
3.4.2 精细化卷积模块
精细化卷积模块的设计旨在提取更深层、更抽象且更高级的特征,浅层网络往往难以满足这一要求,而盲目堆叠网络层数不仅会延长训练时间,还可能导致网络性能的退化。换言之,随着网络深度的增加,模型的性能逐渐趋于饱和,甚至可能急剧下降[48]。因此,本文引入了残差网络以解决上述问题。尽管传统设计中的残差网络通常包含数十甚至更多的网络层,但在目标定位任务中,几层残差网络已能够显著提高定位精度。此外,在残差网络内部增添了自残连接以更好地实现原始特征和中间特征的融合,促进特征信息的流动。
具体来说,精细化卷积模块由3层自残残差卷积单元构成。除了具体的网络参数值存在差异,每个自残残差卷积单元具有相同的网络结构。如图3的目标定位网络部分所示,自残残差卷积单元包含1个主路径和2个辅助路径,为便于区分,将实线和虚线的辅助路径分别称为跳跃连接和自残连接。首先,该单元的主路径依次为标准卷积和批归一化,随后主路径的输出特征与经过PW卷积的自残连接的输出特征进行元素级相加,然后再经过ReLU激活函数、另一个标准卷积和批归一化。接着,该输出特征再与经过PW卷积的跳跃连接的输出特征进行元素级相加,最终通过ReLU激活函数。值得注意的是,自残连接和跳跃连接中的PW卷积旨在确保其输出特征与主路径的输出特征在空间维度和通道维度上保持一致,具体的参数值将在4.1节给出。
尽管HRT-Net的精细化卷积模块由3层自残残差卷积单元构成,但其具备可扩展性,能够适应复杂任务。同时,残差网络的引入缓解了因过度增加网络层数而可能导致的退化问题,这一特性在实际应用中具有显著吸引力。对于那些具有高精度定位需求的复杂任务,网络层数可以在离线阶段灵活堆叠,同时低级特征可以通过残差连接直接映射至高级特征,从而跳过部分不必要的网络层,使网络深度能够自适应地满足任务需求。
3.4.3 回归模块
回归模块用于输出估计的目标位置坐标 ({{x}_{q}},{{y}_{q}}) 。在网络架构方面,它与区域选择网络的回归模块相同。
3.5 实现过程
总的来说,本文提出了一个两阶段的定位架构HRT-Net来有效地跨多个AP协作,以实现在CF-mMIMO雷达通信一体化系统中的目标定位。算法2给出了具体的实现过程,其数据预处理过程、训练过程和预测过程描述如下。
2 HRT-Net的实现过程2. Implementation procedure of HRT-Net数据预处理过程 1. 将总的区域划分成S个子区域 2. 收集每个子区域内的各个点位对应的接收信号矩阵 \tilde {\boldsymbol{Y}} 和目标
位置坐标 ({{x}_{q}},{{y}_{q}})3. 将接收信号矩阵 \tilde {\boldsymbol{Y}} 的实部和虚部拆开,形成输入特征 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} ,区
域选择网络和目标定位网络的标签分别为子区域索引RI和目标位置坐标 ({{x}_{q}},{{y}_{q}}) 4. 按照 8:2 的比例划分训练集和测试集 训练过程 1. 设置迭代次数 {{\mathrm{epoch}}_1} 和 {{\mathrm{epoch}}_2} ,批次 {{\mathrm{batch}}_1} 和 {{\mathrm{batch}}_2} ,损失
函数 {{\mathrm{loss}}_1} 和 {{\mathrm{loss}}_2} ,优化器 {{O}_1} 和 {O_2}2. for e = 1,2, \cdots ,{{\mathrm{epoch}}_1} 3. for b = 1,2, \cdots ,{{\mathrm{batch}}_1} 4. 基于 {{\mathrm{loss}}_1} 和 {{O}_1} 训练区域选择网络 5. end 6. end 7. for s = 1,2, \cdots ,S 8. for e = 1,2, \cdots ,{{\mathrm{epoch}}_2} 9. for b = 1,2, \cdots ,{{\mathrm{batch}}_2} 10. 基于 {{\mathrm{loss}}_2} 和 {{O}_2} 训练第s个子区域的分通道单维注意力
机制和目标定位网络11. end 12. end 13. end 预测过程 1. if需要目标定位 2. 基于 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 通过训练好的区域选择网络识别目标所属的
子区域RI3. 基于 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 和 {\bf{RI}} 通过训练好的分通道单维注意力机制和目标定
位网络实现高精度的目标定位 ({{x}_{q}},{{y}_{q}})4. end 3.5.1 数据预处理过程
数据预处理过程的目的是获取区域选择网络和目标定位网络的训练集和测试集。首先,将总的区域划分成S个子区域。然后,基于系统模型生成每个子区域中具有标签的数据集,即所有接收AP接收到的回波信号和对应的目标位置。接着,拆分接收到的复信号的实部和虚部,得到输入特征 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} \in {\mathbb{R}^{{\mathrm{KL}} \times {\mathrm{TR}} \times 2}} 。需要强调的是,区域选择网络的标签是对应子区域的索引,而目标定位网络的标签是目标位置坐标。最后,按照 8:2 的比例划分训练集和测试集。
3.5.2 训练过程
在训练过程中,精心配置具体的网络参数、损失函数和优化器等,具体的参数值将在4.1节给出。HRT-Net采用分批训练的方式,在多个迭代轮次中进行训练,以实现高精度的目标定位。值得注意的是,在实际系统中,训练过程是提前离线进行的,而不考虑其计算时间。
3.5.3 预测过程
在预测过程中,执行两个步骤。首先,通过区域选择网络识别目标所属的子区域。接着,利用目标定位网络实现高精度的目标定位。与训练过程不同,预测过程发生在在线阶段,所需时间代表了目标定位的延迟。
4. 仿真实验与分析
本节进行了大量的仿真,旨在证明HRT-Net的有效性和可靠性。首先介绍了详细的仿真实验设置;然后研究了区域选择网络的性能,包括在不同的信噪比(Signal-to-Noise Ratio, SNR)、网格间隔下;最后通过对比其他方法,验证了目标定位网络在定位精度和效率上的优越性。
4.1 仿真实验设置
为了评估HRT-Net,考虑了一个覆盖范围为 10\;{\text{m}} \times 10\;{\text{m}} 的场景,在特定位置部署2个发送AP和4个接收AP,每个AP配备一个UPA,其每行和每列的天线数为 {M_x} = 8 和 {M_y} = 4 。仿真实验中参数设置如表1所示。
表 1 仿真参数设置Table 1. Simulation parameter settings参数 数值 参数 数值 载波频率 30 GHz 天线间距 半波长 子载波间隔 60 kHz 循环前缀长度 64 子载波数 1024 发送AP坐标 (4.8,1.2),(5.2,9.2) 符号数 2 接收AP坐标 (2.4,0),(7.2,0),(2.8,10),(7.6,10) 为了验证HRT-Net对目标位置随机性的适用能力,在数据预处理阶段,首先将总的区域均匀划分为4个大小相等的子区域。然后,整个区域以0.1 m为间隔取网格点,这些点处接收到的信号作为区域选择网络数据集中的数据,其标签为对应子区域的索引,数据集规模为
10000 。此外,为了实现高精度的目标定位,在每个子区域内以0.025 m为间隔取网格点,其标签为对应的坐标,以构建一个大小为 4 \times 40000 的目标定位网络的数据集。最后,按照 8:2 的比例划分训练集和测试集。这确保了在训练和测试过程中,目标的位置是随机的。同时,该数据集的丰富性和多样性使得网络能够全面学习到观测区域的特征,从而确保训练出的网络具有较强的泛化能力。另外值得注意的是,由于观测空间的差异,区域划分策略可能会有所不同,因为子区域的大小和分布会影响定位精度。鉴于本文实验的观测空间较为简单且连续,均匀划分的策略能够满足验证HRT-Net框架的需求。然而,当观测空间变得更加复杂,例如出现不均匀的遮挡物时,制定最佳区域划分策略则是必要的。关于HRT-Net中具体的参数设置, 首先,PW卷积的超参数核尺寸和填充设置保持一致,分别为 (1,1) 和0,而步长取值为1或2或4,分别对应区域选择网络或目标定位网络的自残连接或跳跃连接,输入通道数和输出通道数根据输入和输出特征的通道数量而定。其次,除了分通道单维注意力机制中的最大池化和平均池化参见算法1外,其他最大池化的超参数核尺寸、步长和填充分别为 (2,2) , 2和0,而其他平均池化则采用自适应方式,即无论输入特征空间维度的高和宽如何,输出特征的高和宽均为1,而通道数保持不变。最后,HRT-Net的其他主要网络参数如表2所示,涵盖了各模块中标准卷积、DW卷积和全连接层的超参数设置。
表 2 HRT-Net主要网络参数设置Table 2. Main network parameter settings of HRT-Net模块名称 操作 超参数 核尺寸 步长 填充 输入通道 输出通道 区域选择网络 基本卷积模块 标准卷积 (3,3) 1 2 2 32 轻量级卷积模块 第1层DW卷积 (3,3) 1 1 2 2 第2层DW卷积 (3,3) 1 1 32 32 第3层DW卷积 (3,3) 1 1 32 32 第4层DW卷积 (3,3) 1 1 64 64 第5层DW卷积 (3,3) 1 1 64 64 第6层DW卷积 (3,3) 1 1 128 128 回归模块 全连接层 \ \ \ 128 4 分通道单维注意力机制 标准卷积 (1,3) 1 (0,1) 2 1 目标定位网络 多尺度卷积模块 标准卷积1 (3,3) 1 (1,1) 2 32 标准卷积2 (5,5) 1 (2,2) 2 32 标准卷积3 (9,9) 1 (4,4) 2 32 精细化卷积模块 第1层标准卷积1 (3,3) 2 1 2 32 第1层标准卷积2 (3,3) 2 1 32 32 第2层标准卷积1 (3,3) 2 1 32 64 第2层标准卷积2 (3,3) 2 1 64 64 第3层标准卷积1 (3,3) 2 1 64 128 第3层标准卷积2 (3,3) 2 1 128 128 回归模块 全连接层 \ \ \ 128 2 关于HRT-Net中具体的训练策略,首先,采用自适应优化算法(Adaptive Moment Estimation, Adam)更新网络参数,其通过反向传播计算权重的梯度[49]。其次,交叉熵损失函数和最小均方误差损失函数分别用于处理区域选择任务和目标定位任务,二者的初始学习率和批量大小均设置为0.001和40。另外,每经过25轮迭代,学习率减少为当前的0.15倍。这些策略共同作用,使得训练过程更加高效、稳定,同时提升模型的最终性能。最后,需要指出的是,HRT-Net的训练和测试均在一台配备有Intel(R) Core(TM) i7-13700K处理器和16 GB机带内存的计算机上进行,并采用Pytorch 2.2.1框架。
4.2 区域选择网络的性能分析
图5展示了不同SNR对区域选择网络分类精度的影响。从图5(a)可以看出,训练精度与SNR呈正相关,当 {\mathrm{SNR}} = - 5\;{\mathrm{dB}} 时,训练精度约为 92.65\% ,而当SNR提升到15 dB时,训练精度约为95.82%,提升幅度为3.17%。这一结果表明,区域选择网络对SNR的敏感度并不高,能够有效适应目标所在的不同环境,突显出其稳定的分类准确性和出色的泛化能力。图5(b)至图5(f)分别展示了SNR取值为–5 dB, 0 dB, 5 dB, 10 dB以及15 dB时对应的测试混淆矩阵。总体来看,随着SNR的提升,4个子区域的识别精度均有所提高。同时,可以观察到各个子区域的识别精度存在差异,但差异较小,在可接受的范围内,说明区域选择网络能够有效适应目标位置的随机变化。
图6展示了在SNR固定为15 dB的情况下,网格间隔对区域选择网络分类精度的影响。从图6(a)可以看出,随着网格间隔的减小,训练精度得到提升。与SNR相比,网格间隔对分类精度的影响更为显著。这一现象可归因于网格间隔的减小导致数据集的规模呈倍数级增长,进而提升了网络的性能。然而,需要注意的是,网格间隔的减小可能导致更高的部署成本,因此应根据实际需求在分类精度与成本之间寻求最佳平衡。图6(b)和图6(c)分别展示了网格间隔为0.2 m和0.05 m时对应的测试混淆矩阵。与图5(f)相比,当网格间隔为0.2 m时,数据集规模缩小至
2500 ,为之前的 {1 \mathord{\left/ {\vphantom {1 4}} \right. } 4} ,此时各个子区域的识别精度有明显下降,平均下降了5.75%;而当网格间隔为0.05 m时,数据集规模扩大至40000 ,为之前的4倍,此时各个子区域的识别精度已接近100%。为了证明区域选择网络的合理性,图7展示了不同轻量级卷积单元层数下区域选择网络的性能。由表2可知,通道数每两层变化一次,因此将其与4层网络和8层网络进行对比。从图7(a)可以看出,当层数从4增加到6时,训练精度提升约3.91%。然而,当层数从6增加到8时,训练精度仅提升约1.13% 。进一步,比较图5(f)、图7(b)与图7(c),可以发现,层数变为4时,4个子区域的识别精度均有明显下降,而层数变为8时,只有子区域4的识别精度有所提升。考虑到更多层数会增加时间成本,因此选择6层的轻量级卷积单元层数是合理的。
另外,本文进行了3组消融实验,以验证区域选择网络中基本卷积模块的必要性。实验结果如图8所示。消融实验1是不加基本卷积模块,消融实验2是在不加基本卷积模块的基础上,将轻量级卷积单元的层数设置为4,而消融实验3则是设置为8。实验结果表明,基本卷积模块对识别精度具有显著影响。尤其是在消融实验3中,尽管增加了轻量级卷积单元的层数,但识别精度仍显著低于所设计的区域选择网络。这是由于直接对原始输入应用轻量级卷积操作,可能导致模型所捕获的特征缺乏丰富性和精确性。因此,在区域选择网络初始设置一层基本卷积模块是必要且合理的。
4.3 目标定位网络的性能分析
为评估HRT-Net在CF-mMIMO雷达通信一体化系统中对目标定位精度与效率的影响,本文采用以下方法进行对比分析。
后向投影算法(Back-Projection Algorithm, BPA)[50]:作为一种传统方法,BPA首先根据接收信号匹配目标与单个发送和接收AP对之间的距离,然后通过考虑多个发送和接收AP对之间的几何关系,即通过识别多个椭圆的交点来确定目标的精确位置。
Transformer[51]:Transformer已成为自然语言处理领域中一种重要的深度学习架构。同时数据序列化技术的应用为其向计算机视觉领域的延伸展示了巨大的潜力。通过将接收到的信号序列化作为Transformer的输入数据,可以实现目标定位。具体来说,本文对比方案基于ViT的基本架构,并在其前增加了一个由卷积单元构成的前置模块,以更好地提取局部特征。同时,为了更充分地捕捉全局信息,Transformer编码器的输出通过平均池化进行处理,以获得更具代表性的全局特征。
FedSLoc[52]:FedSLoc是一种基于卷积神经网络提取特征的目标定位方法,旨在将各个站提取的特征传输至CPU进行处理。为验证残差网络的优越性,比较FedSLoc与HRT-Net的性能显得必要且合理。
为了比较不同方法的定位精度,首先分析了在不同SNR下的均方根误差(Root Mean Square Error, RMSE),具体结果如图9(a)所示。整体趋势表明,随着SNR的增加,4种定位方法的RMSE均有所下降。具体而言,BPA的性能最差,FedSLoc略优于Transformer。显然,HRT-Net在定位精度上优于其他3种方法,RMSE分别平均下降了0.3191 m,0.1486 m以及0.1347 m。进一步,为了探讨HRT-Net的稳定性,图9(b)展示了在SNR = 15 dB时,不同子区域的RMSE箱线图。结果显示,RMSE在各子区域的分布相对稳定,尤其是HRT-Net,这表明了其显著的稳定性和适用性,能够应对目标位置的随机性。四分位距是箱线图中衡量数据分布的重要指标。在4个子区域中,BPA, Transformer, FedSLoc和HRT-Net的平均四分位距分别为0.1672 m, 0.1092 m, 0.1472 m以及0.0636 m。可以看出,HRT-Net的平均四分位距最小,表明了其RMSE分布更为集中,进一步量化了它的稳定性。此外,图9(c)描述了在SNR = 15 dB时子区域1关于估计误差的累积分布函数(Cumulative Distribution Function, CDF)。可以看出,HRT-Net表现最优,以估计误差小于0.2 m为例,BPA, Transformer, FedSLoc和HRT-Net对应的概率分别为31.5%, 77.6%, 63.8%和95.2%。相比于其他3种方法,HRT-Net分别提升了63.7%, 17.6%和31.4%,进一步验证了HRT-Net在定位精度方面的有效性。
在环境基本保持不变的情况下,通常不需要每次都执行训练过程。值得关注的是,如何在在线阶段以低开销实现精准的目标定位。因此,将时间开销和存储开销定义为在线阶段执行目标定位所需的运行时间和存储空间。同时,利用深度学习框架Pytorch Profiler获得运行时间和存储空间的具体数值[53]。图10展示了4种定位方法的开销对比。可以观察到,由于复杂的自注意力机制和对长距离依赖性建模的要求,Transformer具有最高的时间开销和存储开销,分别为10.68 ms和158.9 MB。相比之下,BPA和FedSLoc拥有相近的时间开销和存储开销,且明显低于Transformer。HRT-Net的时间开销和存储开销分别为6.48 ms和42.5 MB。尽管存储开销略高于BPA和FedSLoc,但从实时性能来看,HRT-Net是最优的定位方法,这体现了其在目标定位效率方面的优势。
图11展示了HRT-Net在不同发送和接收AP数量下,目标定位精度的对比。实验结果表明,目标定位的精度与收发AP的数量呈正相关,即收发AP数量越多,目标定位精度越高。以估计误差小于0.1 m为例,1发2收、2发2收,2发4收和3发6收对应的概率分别为10.6%, 15.9%, 79.4%和97.2%。可以发现,随着AP数量的增加,定位精度的提高呈现出先快速后逐渐减缓的趋势。这一现象可归因于初期较少的收发AP数量导致观测到的目标信息有限。在此情况下,增加AP数量,能够获得较多的目标信息增量,从而定位精度显著提高。然而,随着AP数量逐步增多,所获得的目标信息增量逐渐减少,进而导致定位精度的提升速度放缓,最终趋于饱和。
进一步,为了验证HRT-Net的合理性,本文进行了3组消融实验,结果如图12(a)所示。消融实验1是将多尺度卷积模块替换为基本卷积模块,消融实验2是不加分通道单维注意力机制,消融实验3是消融实验1和消融实验2的结合。可以看出,多尺度卷积模块和分通道单维注意力机制对定位精度具有显著影响,尤其是后者。以估计误差小于0.15 m为例,4种情况对应的概率分别为93.2%, 89.4%, 79.2%和70.6%。此外,图12(b)展示了不同自残残差卷积单元层数下估计误差的CDF。可以看出,将层数从3增加到4对定位精度的提升明显不如从2增加到3。具体而言,2层、3层和4层对应的估计误差低于0.1 m所对应的概率分别为50.8%, 77.8%和82.6%。考虑到增加层数所带来的开销成本,精细化卷积模块选择3层自残残差卷积单元是明智的。综上所述,HRT-Net的设计是合理且可解释的。
5. 实测实验与分析
5.1 实测实验设置
本节针对室外环境开展一系列实测实验以比较分析不同的目标定位方法。首先介绍实际系统的典型架构。多个具有 16 \times 8 天线的UPA和双极化通道的AP通过光纤连接到同步时钟,以确保满足同步要求,然后连接到基带单元(Base Band Unit, BBU)。值得注意的是,协作感知的精度高度依赖于同步精度以及相位噪声。为此,在前期的研究工作中[54],提出了一种时频同步校准方案,能够实现优于纳秒级的同步精度。图13(a)展示了实际系统的各种设备,图13(b)和图13(c)直观呈现了实验场景的布局。具体而言,该实验部署了4个接收AP和1个发送AP,将移动的小车视为目标,并沿着3条不同的轨迹进行定位。需要说明的是,由于3条轨迹的起点不同,图13(b)仅标记了轨迹2的情况。
发送AP和接收AP的具体坐标以及小车的运动轨迹如表3所示。其他参数设置与仿真实验保持一致。此外,以0.625 ms作为采样时间,获取各个接收AP关于轨迹1、轨迹2和轨迹3的接收信号及其相应的目标位置,数据规模分别为
16000 ,12800 和32000 。同样地,按照 8:2 的比例划分训练集和测试集。表 3 实测场景参数设置Table 3. Experimental scenario parameter settings参数 数值 参数 数值 发送AP坐标 (2.4,1.2) 轨迹1 (2.4,5.0) \to (2.4,9.6) 接收AP坐标 (0,0),(1.2,0),(3.0,0),(4.8,0) 轨迹2 (0.6,4.1) \to (4.2,4.1) \ \ 轨迹3 (0.6,9.6) \to (4.8,5.4) 此外,在分析目标定位的实测性能之前,首先研究了在该场景下,雷达通信一体化系统的频谱效率。根据前期研究成果[55],该系统占用了3%的通信资源以实现感知功能。基于此,假设该场景下存在4个随机位置的UE,它们的总频谱效率分布如图14所示。结果表明,在当前设计下,3%的资源占用率对系统的通信性能几乎没有影响。
5.2 目标定位的实测性能分析
图15展示了3条轨迹在不同定位方法下估计误差的CDF。首先可以看出,由于真实环境中存在各种干扰因素,BPA的性能急剧下降,而其他3种方法并未表现出明显的性能损失。无论是哪条轨迹,HRT-Net在定位精度方面仍表现最佳。以轨迹1为例,HRT-Net使得估计误差小于0.1 m的概率为95.66%。与Transformer的75.47%和FedSLoc的81.84%相比,分别增加了20.19%和13.82%,这定量反映了HRT-Net的优越性。同时值得一提的是,由于每种定位方法的基本架构保持不变,它们的时间开销和存储开销与仿真几乎相等。此外,可以发现同一种定位方法在不同轨迹下性能存在差异。这可以归因于现实环境中多变的干扰因素和具体的AP部署方案,使得不同位置的适用性不一致。然而,这被认为是可以接受的。
为了直观体现不同定位方法在实测场景中的表现,图16展示了它们对运动轨迹的预测情况。需要指出的是,由于BPA的性能较差,图16中没有对此进行描述。可以看到,与Transformer和FedSLoc相比,HRT-Net的预测轨迹与真实轨迹更为接近,这直观地证明了其有效性和鲁棒性。
6. 结语
针对CF-mMIMO雷达通信一体化系统中多站协作感知的问题,本文提出了一种两阶段的智能框架HRT-Net。前阶段,本文基于深度可分离卷积设计了一个轻量级的区域选择网络,用于识别目标所属的子区域。后阶段,本文首先提出了一个分通道单维注意力机制,以加权融合多站特征,解决多站数据差异性的问题;随后,设计了一个多尺度的目标定位网络,以实现目标的位置估计。仿真和实测实验结果表明,与BPA, Transformer和FedSLoc相比,本文所提方法能够实现准确且资源高效的目标定位,同时具备广泛的感知区域覆盖。此外,本文进行了多个消融实验,以证明HRT-Net的合理性。通过引入HRT-Net框架,本文为CF-mMIMO雷达通信一体化系统中实现多站协作感知提供了有效的技术途径。最后需要说明的是,本文仅讨论了固定AP部署下单目标的场景,在实际应用中,CF-mMIMO雷达通信一体化系统实现多站协作感知时,可能还会面临多目标跟踪、AP部署问题以及杂波干扰等挑战。以多目标跟踪为例,未来可以考虑将本文方法拓展至无监督模式,并结合本文提出的混合远近场信道模型或反卷积等操作,设计一个能够从多目标位置坐标重构出接收回波信号的模块。这有望为解决多目标跟踪问题提供新的方案。此外,如何设计更高效的区域划分策略,以及如何优化波束扫描和跟踪方案,也是未来研究中值得关注的问题。
-
1 分通道单维注意力机制的计算流程
1. Calculation process of sub-channel single dimensional attention mechanism
输入:输入特征 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 输出:加权特征 {\tilde {\boldsymbol{Y}}_{\mathrm{w}}} 初始化参数: {\bf{aw}}_{\max}^{{\mathrm{real}}} , {\bf{aw}}_{\max}^{{\mathrm{imag}}} , {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{real}}} , {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{imag}}} , {{\boldsymbol{A}}^{{\mathrm{real}}}} , {{\boldsymbol{A}}^{{\mathrm{imag}}}} ,
\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{real}}} , \tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{imag}}}1. for {\mathrm{ch}} = 1,2 //1和2分别代表实部和虚部 2. for {\mathrm{tr}} = 1,2, \cdots ,{\mathrm{TR}} 3. {\bf{aw}}_{\max}^{{\mathrm{ch}}}({\mathrm{tr}}) = \max\left( {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}}(1:{\mathrm{KL}},{\mathrm{tr}})} \right) 4. {\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{ch}}}({\mathrm{tr}}) = \dfrac{1}{{{\mathrm{KL}}}}\displaystyle\sum\limits_{{\mathrm{kl}} = 1}^{{\mathrm{KL}}} {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}}({\mathrm{kl}},{\mathrm{tr}})} 5. end 6. // {\mathrm{conv}} 函数和 {\mathrm{expand}} 函数分别代表标准卷积操作和扩展维
度操作7. {{\boldsymbol{A}}^{{\mathrm{ch}}}} = {\mathrm{expand}}({\mathrm{sigmoid}}({\mathrm{conv}}({\mathrm{concat}}({\bf{aw}}_{\max }^{{\mathrm{ch}}},{\bf{aw}}_{{\mathrm{avg}}}^{{\mathrm{ch}}})))) 8. \tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{ch}}} = {A^{{\mathrm{ch}}}} \odot \tilde {\boldsymbol{Y}}_{{\mathrm{in}}}^{{\mathrm{ch}}} //符号 \odot 代表元素级相乘 9. end 10. {\tilde {\boldsymbol{Y}}_{\mathrm{w}}} = {\mathrm{concat}}(\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{real}}},\tilde {\boldsymbol{Y}}_{\mathrm{w}}^{{\mathrm{imag}}}) 2 HRT-Net的实现过程
2. Implementation procedure of HRT-Net
数据预处理过程 1. 将总的区域划分成S个子区域 2. 收集每个子区域内的各个点位对应的接收信号矩阵 \tilde {\boldsymbol{Y}} 和目标
位置坐标 ({{x}_{q}},{{y}_{q}})3. 将接收信号矩阵 \tilde {\boldsymbol{Y}} 的实部和虚部拆开,形成输入特征 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} ,区
域选择网络和目标定位网络的标签分别为子区域索引RI和目标位置坐标 ({{x}_{q}},{{y}_{q}}) 4. 按照 8:2 的比例划分训练集和测试集 训练过程 1. 设置迭代次数 {{\mathrm{epoch}}_1} 和 {{\mathrm{epoch}}_2} ,批次 {{\mathrm{batch}}_1} 和 {{\mathrm{batch}}_2} ,损失
函数 {{\mathrm{loss}}_1} 和 {{\mathrm{loss}}_2} ,优化器 {{O}_1} 和 {O_2}2. for e = 1,2, \cdots ,{{\mathrm{epoch}}_1} 3. for b = 1,2, \cdots ,{{\mathrm{batch}}_1} 4. 基于 {{\mathrm{loss}}_1} 和 {{O}_1} 训练区域选择网络 5. end 6. end 7. for s = 1,2, \cdots ,S 8. for e = 1,2, \cdots ,{{\mathrm{epoch}}_2} 9. for b = 1,2, \cdots ,{{\mathrm{batch}}_2} 10. 基于 {{\mathrm{loss}}_2} 和 {{O}_2} 训练第s个子区域的分通道单维注意力
机制和目标定位网络11. end 12. end 13. end 预测过程 1. if需要目标定位 2. 基于 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 通过训练好的区域选择网络识别目标所属的
子区域RI3. 基于 {\tilde {\boldsymbol{Y}}_{{\mathrm{in}}}} 和 {\bf{RI}} 通过训练好的分通道单维注意力机制和目标定
位网络实现高精度的目标定位 ({{x}_{q}},{{y}_{q}})4. end 表 1 仿真参数设置
Table 1. Simulation parameter settings
参数 数值 参数 数值 载波频率 30 GHz 天线间距 半波长 子载波间隔 60 kHz 循环前缀长度 64 子载波数 1024 发送AP坐标 (4.8,1.2),(5.2,9.2) 符号数 2 接收AP坐标 (2.4,0),(7.2,0),(2.8,10),(7.6,10) 表 2 HRT-Net主要网络参数设置
Table 2. Main network parameter settings of HRT-Net
模块名称 操作 超参数 核尺寸 步长 填充 输入通道 输出通道 区域选择网络 基本卷积模块 标准卷积 (3,3) 1 2 2 32 轻量级卷积模块 第1层DW卷积 (3,3) 1 1 2 2 第2层DW卷积 (3,3) 1 1 32 32 第3层DW卷积 (3,3) 1 1 32 32 第4层DW卷积 (3,3) 1 1 64 64 第5层DW卷积 (3,3) 1 1 64 64 第6层DW卷积 (3,3) 1 1 128 128 回归模块 全连接层 \ \ \ 128 4 分通道单维注意力机制 标准卷积 (1,3) 1 (0,1) 2 1 目标定位网络 多尺度卷积模块 标准卷积1 (3,3) 1 (1,1) 2 32 标准卷积2 (5,5) 1 (2,2) 2 32 标准卷积3 (9,9) 1 (4,4) 2 32 精细化卷积模块 第1层标准卷积1 (3,3) 2 1 2 32 第1层标准卷积2 (3,3) 2 1 32 32 第2层标准卷积1 (3,3) 2 1 32 64 第2层标准卷积2 (3,3) 2 1 64 64 第3层标准卷积1 (3,3) 2 1 64 128 第3层标准卷积2 (3,3) 2 1 128 128 回归模块 全连接层 \ \ \ 128 2 表 3 实测场景参数设置
Table 3. Experimental scenario parameter settings
参数 数值 参数 数值 发送AP坐标 (2.4,1.2) 轨迹1 (2.4,5.0) \to (2.4,9.6) 接收AP坐标 (0,0),(1.2,0),(3.0,0),(4.8,0) 轨迹2 (0.6,4.1) \to (4.2,4.1) \ \ 轨迹3 (0.6,9.6) \to (4.8,5.4) -
[1] MAO Weihao, LU Yang, LIU Jingxian, et al. Beamforming design in cell-free massive MIMO integrated sensing and communication systems[C]. GLOBECOM 2023-2023 IEEE Global Communications Conference, Kuala Lumpur, Malaysia, 2023: 546–551. doi: 10.1109/GLOBECOM54140.2023.10437290. [2] 马丁友, 刘祥, 黄天耀, 等. 雷达通信一体化: 共用波形设计和性能边界[J]. 雷达学报, 2022, 11(2): 198–212. doi: 10.12000/JR21146.MA Dingyou, LIU Xiang, HUANG Tianyao, et al. Joint radar and communications: Shared waveform designs and performance bounds[J]. Journal of Radars, 2022, 11(2): 198–212. doi: 10.12000/JR21146. [3] LIU Fan, ZHENG Le, CUI Yuanhao, et al. Seventy years of radar and communications: The road from separation to integration[J]. IEEE Signal Processing Magazine, 2023, 40(5): 106–121. doi: 10.1109/MSP.2023.3272881. [4] YOU Xiaohu, HUANG Yongming, LIU Shengheng, et al. Toward 6G TKμ extreme connectivity: Architecture, key technologies and experiments[J]. IEEE Wireless Communications, 2023, 30(3): 86–95. doi: 10.1109/MWC.004.2200482. [5] LU Shihang, LIU Fan, LI Yunxin, et al. Integrated sensing and communications: Recent advances and ten open challenges[J]. IEEE Internet of Things Journal, 2024, 11(11): 19094–19120. doi: 10.1109/JIOT.2024.3361173. [6] 尹浩, 黄宇红, 韩林丛, 等. 6G通信–感知–计算融合网络的思考[J]. 中国科学: 信息科学, 2023, 53(9): 1838–1842. doi: 10.1360/SSI-2023-0135.YIN Hao, HUANG Yuhong, HAN Lincong, et al. Thoughts on 6G integrated communication, sensing and computing networks[J]. SCIENTIA SINICA Informationis, 2023, 53(9): 1838–1842. doi: 10.1360/SSI-2023-0135. [7] WANG Yunlong, WU Ying, and SHEN Yuan. Cooperative tracking by multi-agent systems using signals of opportunity[J]. IEEE Transactions on Communications, 2020, 68(1): 93–105. doi: 10.1109/TCOMM.2019.2944605. [8] XIE Lei, SONG Shenghui, ELDAR Y C, et al. Collaborative sensing in perceptive mobile networks: Opportunities and challenges[J]. IEEE Wireless Communications, 2023, 30(1): 16–23. doi: 10.1109/MWC.005.2200214. [9] NGO H Q, ASHIKHMIN A, YANG Hong, et al. Cell-free massive MIMO versus small cells[J]. IEEE Transactions on Wireless Communications, 2017, 16(3): 1834–1850. doi: 10.1109/TWC.2017.2655515. [10] MENG Kaitao, MASOUROS C, PETROPULU A P, et al. Cooperative ISAC networks: Opportunities and challenges[J]. IEEE Wireless Communications, 2024, 1–8. doi: 10.1109/MWC.008.2400151. [11] WANG Xinhua, ASHIKHMIN A, and WANG Xiaodong. Wirelessly powered cell-free IoT: Analysis and optimization[J]. IEEE Internet of Things Journal, 2020, 7(9): 8384–8396. doi: 10.1109/JIOT.2020.2990378. [12] WEI Chen, XU Kui, SHEN Zhexian, et al. Fingerprint-based localization and channel estimation integration for cell-free massive MIMO IoT systems[J]. IEEE Internet of Things Journal, 2022, 9(24): 25237–25252. doi: 10.1109/JIOT.2022.3195899. [13] 王鼎, 尹洁昕, 高路, 等. 一种协同二维DOA和TDOA观测量的超视距短波辐射源定位新方法[J]. 雷达学报(中英文), 2024, 13(6): 1135–1156. doi: 10.12000/JR24136.WANG Ding, YIN Jiexin, GAO Lu, et al. A novel cooperative positioning method for over-the-horizon shortwave emitter based on two-dimensional direction-of-arrival and time-difference-of-arrival measurements[J]. Journal of Radars, 2024, 13(6): 1135–1156. doi: 10.12000/JR24136. [14] XU Sheng, WU Linlong, DOĞANÇAY K, et al. A hybrid approach to optimal TOA-sensor placement with fixed shared sensors for simultaneous multi-target localization[J]. IEEE Transactions on Signal Processing, 2022, 70: 1197–1212. doi: 10.1109/TSP.2022.3152232. [15] YUAN Weijie, WU Nan, GUO Qinghua, et al. TOA-based passive localization constructed over factor graphs: A unified framework[J]. IEEE Transactions on Communications, 2019, 67(10): 6952–6965. doi: 10.1109/TCOMM.2019.2930517. [16] 朱丹, 徐威远, 陈文娟, 等. 基于光波分复用网络的分布式多目标定位系统[J]. 雷达学报, 2019, 8(2): 171–177. doi: 10.12000/JR19028.ZHU Dan, XU Weiyuan, CHEN Wenjuan, et al. Distributed multi-target localization system based on optical wavelength division multiplexing network[J]. Journal of Radars, 2019, 8(2): 171–177. doi: 10.12000/JR19028. [17] DAI Zichao, WANG Gang, JIN Xiaoping, et al. Nearly optimal sensor selection for TDOA-based source localization in wireless sensor networks[J]. IEEE Transactions on Vehicular Technology, 2020, 69(10): 12031–12042. doi: 10.1109/TVT.2020.3011118. [18] MENG Fan, LIU Shengheng, GAO Songtao, et al. TDoA positioning with data-driven LoS inference in mmWave MIMO communications[J]. Signal Processing, 2024, 220: 109447. doi: 10.1016/j.sigpro.2024.109447. [19] LIU Shengheng, LI Xingkang, MAO Zihuan, et al. Model-driven deep neural network for enhanced AoA estimation using 5G gNB[C]. The 38th AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024: 214–221. doi: 10.1609/aaai.v38i1.27773. [20] WANG Shengchu, JIANG Xianbo, and WYMEERSCH H. Cooperative localization in wireless sensor networks with AOA measurements[J]. IEEE Transactions on Wireless Communications, 2022, 21(8): 6760–6773. doi: 10.1109/TWC.2022.3152426. [21] MENG Kaitao, HAN K, MASOUROS C, et al. Network-level ISAC: Performance analysis and optimal antenna-to-BS allocation[J]. arXiv: 2410.06365, 2024. doi: 10.48550/arXiv.2410.06365. [22] ZUO Peiliang, PENG Tao, WU Hao, et al. Directional source localization based on RSS-AOA combined measurements[J]. China Communications, 2020, 17(11): 181–193. doi: 10.23919/JCC.2020.11.015. [23] ZHANG Zhenkun, REN Hong, PAN Cunhua, et al. Target localization in cooperative ISAC systems: A scheme based on 5G NR OFDM signals[J]. IEEE Transactions on Communications, 2024, 1. doi: 10.1109/TCOMM.2024.3486981. [24] YIN Lu, NI Qiang, and DENG Zhongliang. Intelligent multisensor cooperative localization under cooperative redundancy validation[J]. IEEE Transactions on Cybernetics, 2021, 51(4): 2188–2200. doi: 10.1109/TCYB.2019.2900312. [25] FIGUEROA M R, BISHOYI P K, and PETROVA M. Optimal weight scheme for fusion-assisted cooperative multi-monostatic object localization in 6G networks[J]. arXiv: 2408.16464, 2024. doi: 10.48550/arXiv.2408.16464. [26] JIA Ruo, XU Kui, XIA Xiaochen, et al. Time-sequential cooperative localization for moving sensor in millimeter-wave cell-free massive MIMO system[J]. IEEE Sensors Journal, 2022, 22(22): 22008–22019. doi: 10.1109/JSEN.2022.3211743. [27] WEI Zhiqing, XU Ruizhong, FENG Zhiyong, et al. Symbol-level integrated sensing and communication enabled multiple base stations cooperative sensing[J]. IEEE Transactions on Vehicular Technology, 2024, 73(1): 724–738. doi: 10.1109/TVT.2023.3304856. [28] PUCCI L, BACCHIELLI T, and GIORGETTI A. Cooperative maximum likelihood target position estimation for MIMO-ISAC networks[J]. arXiv: 2411.05187, 2024. doi: 10.48550/arXiv.2411.05187. [29] GAO Peng, LIAN Lixiang, and YU Jinpei. Cooperative ISAC with direct localization and rate-splitting multiple access communication: A Pareto optimization framework[J]. IEEE Journal on Selected Areas in Communications, 2023, 41(5): 1496–1515. doi: 10.1109/JSAC.2023.3240714. [30] JIANG Wangjun, WEI Zhiqing, LI Bin, et al. Improve radar sensing performance of multiple roadside units cooperation via space registration[J]. IEEE Transactions on Vehicular Technology, 2022, 71(10): 10975–10990. doi: 10.1109/TVT.2022.3184182. [31] TAGLIAFERRI D, MANZONI M, MIZMIZI M, et al. Cooperative coherent multistatic imaging and phase synchronization in networked sensing[J]. IEEE Journal on Selected Areas in Communications, 2024, 42(10): 2905–2921. doi: 10.1109/JSAC.2024.3414609. [32] HUANG Yanru, MAZUELAS S, GE Feng, et al. Indoor localization system with NLOS mitigation based on self-training[J]. IEEE Transactions on Mobile Computing, 2023, 22(7): 3952–3966. doi: 10.1109/TMC.2022.3148338. [33] LIU Guanying, LIU An, ZHANG Rui, et al. Angular-domain selective channel tracking and Doppler compensation for high-mobility mmWave massive MIMO[J]. IEEE Transactions on Wireless Communications, 2021, 20(5): 2902–2916. doi: 10.1109/TWC.2020.3045272. [34] WYMEERSCH H and SECO-GRANADOS G. Radio localization and sensing—part II: State-of-the-art and challenges[J]. IEEE Communications Letters, 2022, 26(12): 2821–2825. doi: 10.1109/LCOMM.2022.3206846. [35] LIU Junchen, WANG Tianyu, LI Yuxiao, et al. A transformer-based signal denoising network for AoA estimation in NLoS environments[J]. IEEE Communications Letters, 2022, 26(10): 2336–2339. doi: 10.1109/LCOMM.2022.3187661. [36] HE Hangchuan, TANG Yupeng, and GUO Wensheng. Target localization in ISAC system based on BP neural network[C]. 2023 IEEE International Conference on Image Processing and Computer Applications (ICIPCA), Changchun, China, 2023: 444–450. doi: 10.1109/ICIPCA59209.2023.10257773. [37] TEDESCHINI B C, KWON G, NICOLI M, et al. Real-time Bayesian neural networks for 6G cooperative positioning and tracking[J]. IEEE Journal on Selected Areas in Communications, 2024, 42(9): 2322–2338. doi: 10.1109/JSAC.2024.3413950. [38] ZENG Fan, LIU Ruoyun, SUN Xiaoyu, et al. Multi-static ISAC based on network-assisted full-duplex cell-free networks: Performance analysis and duplex mode optimization[J]. arXiv: 2406.08268, 2024. doi: 10.48550/arXiv.2406.08268. [39] ADHIKARY A, RAHA A D, QIAO Yu, et al. Holographic MIMO with integrated sensing and communication for energy-efficient cell-free 6G networks[J]. IEEE Internet of Things Journal, 2024, 11(19): 30617–30635. doi: 10.1109/JIOT.2024.3411695. [40] 郭帅, 陈婷, 王鹏辉, 等. 基于角度引导Transformer融合网络的多站协同目标识别方法[J]. 雷达学报, 2023, 12(3): 516–528. doi: 10.12000/JR23014.GUO Shuai, CHEN Ting, WANG Penghui, et al. Multistation cooperative radar target recognition based on an angle-guided transformer fusion network[J]. Journal of Radars, 2023, 12(3): 516–528. doi: 10.12000/JR23014. [41] WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional block attention module[C]. The 15th European Conference on Computer Vision (ECCV), Munich, Germany, 2018: 3–19. doi: 10.1007/978-3-030-01234-2_1. [42] TEMIZ M, ALSUSA E, and BAIDAS M W. A dual-function massive MIMO uplink OFDM communication and radar architecture[J]. IEEE Transactions on Cognitive Communications and Networking, 2022, 8(2): 750–762. doi: 10.1109/TCCN.2021.3128599. [43] HOWARD A G, ZHU Menglong, CHEN Bo, et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications[J]. arXiv: 1704.04861, 2017. doi: 10.48550/arXiv.1704.04861. [44] ZHANG Haokui, LI Ying, JIANG Yenan, et al. Hyperspectral classification based on lightweight 3-D-CNN with transfer learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(8): 5813–5828. doi: 10.1109/TGRS.2019.2902568. [45] KUMAR A, SHARMA A, BHARTI V, et al. MobiHisNet: A lightweight CNN in mobile edge computing for histopathological image classification[J]. IEEE Internet of Things Journal, 2021, 8(24): 17778–17789. doi: 10.1109/JIOT.2021.3119520. [46] AMMAR H A, ADVE R, SHAHBAZPANAHI S, et al. User-centric cell-free massive MIMO networks: A survey of opportunities, challenges and solutions[J]. IEEE Communications Surveys & Tutorials, 2022, 24(1): 611–652. doi: 10.1109/COMST.2021.3135119. [47] LU Zhilin, WANG Jintao, and SONG Jian. Multi-resolution CSI feedback with deep learning in massive MIMO system[C]. ICC 2020-2020 IEEE International Conference on Communications (ICC), Dublin, Ireland, 2020: 1–6. doi: 10.1109/ICC40277.2020.9149229. [48] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 770–778. doi: 10.1109/CVPR.2016.90. [49] KINGMA D P and BA J L. Adam: A method for stochastic optimization[C]. The 3rd International Conference on Learning Representations, San Diego, USA, 2015. [50] SAKHNINI A, DE BAST S, GUENACH M, et al. Near-field coherent radar sensing using a massive MIMO communication testbed[J]. IEEE Transactions on Wireless Communications, 2022, 21(8): 6256–6270. doi: 10.1109/TWC.2022.3148035. [51] DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16x16 words: Transformers for image recognition at scale[C]. The 9th International Conference on Learning Representations, 2021. [52] LIU Rui, LI Jiamin, LIU Feiyang, et al. Scalable fingerprint-based localization framework for 3D cell-free radio access networks[J]. IEEE Communications Letters, 2024, 28(8): 1840–1844. doi: 10.1109/LCOMM.2024.3414991. [53] YIN Jun and VERHELST M. CNN-based robust sound source localization with SRP-PHAT for the extreme edge[J]. ACM Transactions on Embedded Computing Systems, 2023, 22(3): 55. doi: 10.1145/3586996. [54] CAO Yang, WANG Pan, ZHENG Kang, et al. Experimental performance evaluation of cell-free massive MIMO systems using COTS RRU with OTA reciprocity calibration and phase synchronization[J]. IEEE Journal on Selected Areas in Communications, 2023, 41(6): 1620–1634. doi: 10.1109/JSAC.2023.3276057. [55] WANG Dongming, YOU Xiaohu, HUANG Yongming, et al. Full-spectrum cell-free RAN for 6G systems: System design and experimental results[J]. Science China Information Sciences, 2023, 66(3): 130305. doi: 10.1007/s11432-022-3664-x. -