Track-MT3：一种基于Transformer的新型多目标跟踪算法

陈辉; 杜双燕; 连峰; 韩崇昭

doi:10.12000/JR24164

Track-MT3：一种基于Transformer的新型多目标跟踪算法

DOI: 10.12000/JR24164

陈辉^1, ,,
杜双燕¹,
连峰²,
韩崇昭²

1.
兰州理工大学电气工程与信息工程学院兰州 730050
2.
西安交通大学自动化科学与工程学院西安 710049

基金项目: 国家自然科学基金(62163023, 61873116, 62363023, 62366031)，2024年甘肃省重点人才项目资助

详细信息

作者简介:
陈　辉，教授，博士生导师，主要研究方向为数据融合、统计信号处理、机器学习和智能决策

杜双燕，硕士生，主要研究方向为深度学习和雷达目标跟踪

连　峰，教授，博士生导师，主要研究方向为多源信息融合、滤波与估计算法、气动融合算法

韩崇昭，教授，博士生导师，主要研究方向为数据融合、电子对抗、雷达目标跟踪等

通讯作者:
陈辉 chenh@lut.edu.cn

责任主编：李天成 Corresponding Editor: LI Tiancheng
中图分类号: TN953.6; TP389.1
计量
- 文章访问数: 764
- HTML全文浏览量: 278
- PDF下载量: 218
- 被引次数: 0
出版历程
- 收稿日期: 2024-08-15
- 修回日期: 2024-10-11
- 网络出版日期: 2024-11-01
- 刊出日期: 2024-12-28

Track-MT3: A Novel Multitarget Tracking Algorithm Based on Transformer Network

1.
School of Electrical and Information Engineering, Lanzhou University of Technology, Lanzhou 730050, China
2.
School of Automation Science and Engineering, Xi’an Jiaotong University, Xi’an 710049, China

Funds: The National Natural Science Foundation of China (62163023, 61873116, 62363023, 62366031), The Key Talent Project of Gansu Province in 2024

More Information

Corresponding author: CHEN Hui, chenh@lut.edu.cn

摘要

摘要: 针对复杂环境中多目标跟踪数据关联难度大、难以实现目标长时间稳定跟踪的问题，该文创新性地提出了一种基于Transformer网络的端到端多目标跟踪模型Track-MT3。首先，引入了检测查询和跟踪查询机制，隐式地执行量测-目标的数据关联并且实现了目标的状态估计任务。然后，采用跨帧目标对齐策略增强跟踪轨迹的时间连续性。同时，设计了查询变换与时间特征编码模块强化目标运动建模能力。最后，在模型训练中采用了集体平均损失函数，实现了模型性能的全局优化。通过构造多种复杂的多目标跟踪场景，并利用多重性能指标进行评估，Track-MT3展现了优于MT3等基线方法的长时跟踪性能，与JPDA和MHT方法相比整体性能分别提高了6%和20%，能够有效挖掘时序信息，在复杂动态环境下实现稳定、鲁棒的多目标跟踪。
- 多目标跟踪 /
- 数据关联 /
- Transformer /
- 长时跟踪 /
- 注意力机制
Abstract: To address the challenges associated with the data association and stable long-term tracking of multiple targets in complex environments, this study proposes an innovative end-to-end multitarget tracking model called Track-MT3 based on a transformer network. First, a dual-query mechanism comprising detection and tracking queries is introduced to implicitly perform measurement-to-target data association and enable accurate target state estimation. Subsequently, a cross-frame target alignment strategy is employed to enhance the temporal continuity of tracking trajectories, ensuring consistent target identities across frames. In addition, a query transformation and temporal feature encoding module is designed to improve target motion pattern modeling by adaptively combining target dynamics information at different time scales. During model training, a collective average loss function is adopted to achieve the global optimization of tracking performance, considering the entire tracking process in an end-to-end manner. Finally, the performance of Track-MT3 is extensively evaluated under various complex multitarget tracking scenarios using multiple metrics. Experimental results demonstrate that Track-MT3 exhibits superior long-term tracking performance than baseline methods such as MT3. Specifically, Track-MT3 achieves overall performance improvements of 6% and 20% against JPDA and MHT, respectively. By effectively exploiting temporal information, Track-MT3 ensures stable and robust multitarget tracking in complex dynamic environments.
- Multitarget Tracking (MTT) /
- Data Association (DA) /
- Transformer /
- Long-term tracking /
- Attention mechanism

HTML全文

1. 引言

飞机尾流是飞机飞行时所产生的固有的流体力学现象，与周围大气相比，尾流具有独特的空气动力学特性和雷达特性，具有较强的雷达可探测性。尾流的雷达探测是航空安全、反隐身等领域的前沿研究课题。处于潮湿大气中的尾流具有较强的散射截面积(Radar Cross Section, RCS)，但受到气象杂波的影响，需要根据功率谱特性来提高可探测性。飞机尾流回波经过傅里叶变换后，其功率谱是展宽的，其检测方法包括动目标检测(Moving Target Detection, MTD)方法、谱宽检测方法、神经网络方法等，这些方法有较多局限性。在传统的MTD技术中，首先估计观测数据的功率谱，然后对各频率通道进行恒虚警率(Constant False Alarm Rate, CFAR)检测，较难对展宽的尾流功率谱进行有效积累；而谱宽检测方法在云杂波环境下虚警较高；神经网络方法需要大量的训练样本。

信息几何是在黎曼流形上采用微分几何方法研究信息领域和统计学问题的一门学科，其主要思想是把参数化的概率分布族构建为统计流形，并采用Fisher信息矩阵作为流形上的黎曼度量，以此为基础得到统计流形上的联络、曲率、测地线距离等概念，从而采用微分几何方法解决统计学中的问题。其研究对象是由概率分布族所构成的统计流形，矩阵流形就是一种重要的统计流形。与利用回波的功率谱相比，利用回波的协方差矩阵描述回波特性，其优点有：(1)不对回波进行多普勒处理，避免了多普勒处理所面临的功率谱展宽问题；(2)协方差矩阵所构成的空间在数学上为负曲率空间，适合用信息几何方法研究矩阵流形的几何结构，有利于更准确度量目标、噪声或杂波协方差矩阵间的差别。

从信息几何的角度思考问题，能为许多问题提供更加符合实际的模型框架^[1]，并得出新的解决途径。1945年，印度统计学家Rao提出用Fisher信息矩阵来定义统计流形上的黎曼度量，Fisher度量与信息理论的相对熵具有紧密联系，都可以定量描述两个概率分布间可以区分的程度，从而开启了统计的几何学理论研究^[2]。黎曼度量描述的是流形上切空间的性质，联络把流形上不同点处的切空间联系起来，从而使流形具有整体性。20世纪70年代，苏联数学家Chentsov引入了一族单参数的仿射联络，并证明Fisher信息与仿射联络在概率分布流形中的唯一性^[3]，随后，Amari用α-仿射联络对尽可能多的统计问题进行了几何解释，取得了很大的成功，并建立了统计流形的对偶几何结构来研究信息处理，从而丰富了传统的微分几何理论，由于能够较好地描述概率分布的内在特性，微分流形的理论和方法逐步进入统计和信息处理领域^[4]。有了联络，就可以定义相对于该联络的曲率，曲率描述了流形中给定区域的体积与欧氏空间中与其相当区域体积的差异程度，曲率常用于研究Jacobi场的稳定性。测地线是欧氏空间上直线段在黎曼流形上的推广，测地线是连接流形上两点的最短距离的曲线，可用于计算多元概率分布间或协方差矩阵间的测地线距离，与Kulback-Leibler分离度相比，测地线距离的优势在于它满足距离的对称性和三角不等式等重要性质^[5]。实际上，测量通常含有噪声或杂波，我们需要利用统计学方法减少测量的不确定性，为了求解噪声或杂波协方差矩阵的均值，需要使目标函数，即协方差矩阵均值的经验方差，取得最小值，文献[6]利用自然梯度下降算法给出了黎曼均值的迭代计算方法，与算术均值相比，黎曼均值具有更小的经验方差。统计流形上的曲率、联络、测地线和均值等概念大大扩展了统计流形的应用范围，促进了信息几何学的产生与发展。

经过20余年的发展，信息几何学的理论迅速扩展，并在多个领域获得成功应用，已经开始应用到统计推断、控制理论、神经网络、医学成像、计算视觉、信号处理等领域^[1,7]。由于较多的实际问题可以在矩阵流形上进行研究，如雷达信号处理^[8,9]、矩阵方程求解^[1]、医学图像处理^[5,10]、流形学习、系统的稳定性与最优化等问题，将信息几何应用于矩阵流形上促进了矩阵信息几何的诞生。在用信息几何理论解决信息领域或统计学问题时，首先需要把所研究的问题构建成统计流形或矩阵流形，采用微分几何或李群方法研究流形的几何结构，从而用几何方法解决涉及的非线性问题。孙华飞等人将矩阵信息几何应用于求解矩阵方程问题，大多数矩阵方程难以得到解析解，通过将问题转化为矩阵流形上的优化问题，可以用自然梯度给出求解方案^[1]。在雷达信号处理、目标检测和数据处理领域，法国Thales Air Systems研究员Barbaresco等人利用信息几何方法研究了近海小目标检测^[8]、飞机尾流的检测和成像^[8]、极化数据处理、STAP处理^[11]等问题。文献[12]在信息几何框架下研究了雷达系统的信息分辨、信号检测、参数估计、目标跟踪等基础性和科学性问题，为雷达信号处理提供了一套全新的分析方法。总之，对于信号处理中涉及的非欧空间、非线性处理等问题，信息几何方法有优势。本文在前人研究基础上介绍了矩阵流形的几何结构，然后针对飞机尾流目标检测问题，提出了一种矩阵CFAR检测方法，分析了尾流目标的检测性能。

2. 尾流目标的多普勒特性

飞机尾流是飞机产生升力的必然产物，主要包括尾喷流和翼尖尾流两类。翼尖尾流包括两个旋向相反的漩涡，其持续时间长达数十秒到几分钟，在空间上表现为飞机后一个长的柱状分布介质目标，一般到达飞机后部百倍翼展，长达数千米，属于一种较强的湍流。欧、美、俄等对飞机尾流的关注是从航空安全领域开始的。当飞机进入前机的尾流时，会因受力不均而出现机身抖动、下沉、翻转等现象，严重时会导致飞机坠毁。飞机尾流对民用航空安全构成了巨大威胁，近年来，欧盟和美国分别投入巨资启动了SESAR (2005-2020)计划和NGATS (2005-2025)计划以提高航空安全性能^[13]，飞机尾流的实时探测技术无一例外地成为各个研究计划的主要内容。从80年代开始至今，英国、法国和美国进行了多次尾流探测实验测量尾流的雷达反射率和多普勒特性，理论研究和实验结果表明，雷达能够探测到晴空尾流回波，并且能够在雨、雾等潮湿天气中有效工作，因而有望取代激光雷达成为重要的尾流探测手段。国防科技大学是国内较早从事飞机尾流探测技术研究的单位，已有周彬、李健兵、李军、刘俊凯、屈龙海、刘忠训、牛凤梁等多位博士研究尾流特性及其探测技术。

处于云、雨、雾等潮湿大气中的飞机尾流具有较强的雷达散射截面，但受到气象杂波的影响，需要根据尾流功率谱特性来提高脉冲多普勒雷达对尾流的可探测性。在潮湿大气环境下，尾流的雷达后向散射主要是由大气中的水汽微粒产生的，水气微粒的运动规律可用尾流涡旋速度模型模拟^[14]，这里使用一群水汽微粒模拟尾流涡旋的运动特征，使用视频回波仿真方法对尾流回波进行建模仿真。

首先，使用一群粒子表示飞机尾流内的水汽微粒，在时刻t把所有粒子的雷达回波矢量求和，得到一个时刻尾流的合成回波矢量。t时刻离散视频回波为：

${{S}}\left( t \right) = \sum\limits_{m = 1}^M {{A_m}} {{\rm{e}}^{ - {\rm{j}}{\varphi _m}\left( t \right)}}$

(1)

其中，A_m是第m个粒子的回波幅度，回波相位决定于粒子与雷达的距离，第m个粒子回波的相位与雷达距离的关系可表示为：

${\varphi _m}\left( t \right) = 4{{π}} {R_m}\left( t \right)/{\lambda _{\rm{w}}}$

(2)

其中， ${R_m}\left( t \right)$ 为第m个粒子t时刻距雷达的距离， ${\lambda _{\rm w}}$ 是雷达波长。

接着，假设每个粒子以Burnham-Hallock模型描述的速度做匀速圆周运动，t+1时刻运动到新的位置后，得到新的合成回波矢量 ${S}\left( {t + 1} \right)$ 。其中，每个粒子运动的Burnham-Hallock速度模型表达式为^[15]：

$v\left( {{{{r}}_m}} \right) = \frac{{{\varGamma _0}}}{{2{{π}} }}\frac{{{{{r}}_m}}}{{{{{r}}_m}\!\!\!^2 + r_{\rm{c}}^{\rm{2}}}}$

(3)

其中， ${{{r}}_m}$ 表示尾涡上第m个粒子距尾涡中心的距离， ${r_{\rm{c}}}$ 是尾涡的核半径， ${\varGamma _0}$ 是涡环量，表示点涡的强度，表达式为：

${\varGamma _0} = \frac{{4{M_{\rm{a}}}g}}{{{{π}} \rho {V_{\rm{a}}}{B_{\rm{a}}}}}$

(4)

式中， ${M_{\rm{a}}}$ 为飞机重量，g为重力加速度， $\rho$ 为室温空气密度(1.16 kg/m³)， ${V_{\rm{a}}}$ 为飞机的速度， ${B_{\rm{a}}}$ 为翼展。

最后，得到一个相关处理间隔内若干个时刻的回波实部和虚部，对这一复回波序列进行傅里叶变换，得到功率谱。以波音747飞机为例进行仿真。波音747的典型参数为：飞机重量 ${M_{\rm{a}}} = {\rm{350,000}}\;{\rm{kg}}$ ，飞机的速度 ${V_{\rm{a}}} = {\rm{200}}\;{\rm{m/s}}$ ，翼展 ${B_{\rm{a}}} = 68\;{\rm{m}}$ ，重力加速度 $g = {\rm{9}}{\rm{.81}}\;{\rm{m/}}{{\rm{s}}^{\rm{2}}}$ ，室温空气密度 $\rho = {\rm{1}}{\rm{.16 kg/}}{{\rm{m}}^{\rm{3}}}$ ，计算得到 ${\varGamma _0} = 277$ m²/s。一次仿真得到的飞机尾流回波如图1所示。进行多次仿真，可得到相似的归一化径向速度谱。

图 1 仿真的飞机尾流雷达回波

Figure 1. Simulation of the aircraft wake radar echo

下载: 全尺寸图片幻灯片

1992年至1993年，美国通用电气公司马可尼研究中心的Sheppard使用X波段全相参脉冲多普勒雷达DX04进行了尾流雷达探测实验。在距离4.5 km处，经过相参处理，波音747飞机尾流回波接近接收机噪声电平，超过噪声尖峰2～3 dB，分析得到尾流RCS约为–73 dBsm, X波段雷达测量的功率谱如图2所示^[16]。可见，视频回波建模方法仿真结果与马可尼研究中心测量的X波段功率谱具有相似的频域展宽特性，多普勒速度与尾涡旋转径向速度一致。

图 2 马可尼研究中心X波段雷达测量的功率谱^[16]

Figure 2. The Power Spectrum measured by the X-band radar in Marconi Research Center

下载: 全尺寸图片幻灯片

对于尾流目标来说，功率谱是展宽的且具有两个较大的峰值，在不同机型和不同飞行速度时，功率谱的峰值位置也不同，较难设计有效的频域CFAR检测器，特别是，需防止展宽的功率谱处于参考单元中，导致检测门限增大和检测概率降低。

3. 雷达目标回波的矩阵CFAR检测方法

设观测样本 ${x} = {\left[ {x\left( 0 \right)\;x\left( 1 \right)\; ·\!·\!· \;x\left( {n - 1} \right)} \right]^{\rm T}}$ ，传统的统计检测方法首先对观测样本提出假设：

$\left\{ {\begin{array}{*{20}{l}} {{H_0}:{{x}} = {{v}}}\\ {{H_1}:{{x}} = {{s}} + {{v}}} \end{array}} \right.$

(5)

式中，s为目标信号向量， ${{v}}$ 为噪声向量；然后从观测样本出发，制定检测准则，如奈曼-皮尔逊准则，通常可以得到似然比检测判决表达式：

$\lambda \left( {{x}} \right) = \frac{{p\left( {\left. {{x}} \right|{H_1}} \right)}}{{p\left( {\left. {{x}} \right|{H_0}} \right)}} > \eta$

(6)

若式(6)成立，则接受H₁，否则接受H₀，式中， $\eta$ 为判决门限，由给定的先验条件确定。对左边的似然比进行化简，化为x的尽可能简单的表达式，称为检测统计量。

假设信号和噪声都可看做零均值的高斯过程，则观测样本x服从零均值复多元高斯分布，即

$p\left( {{x}\left| {R} \right.} \right) = \frac{1}{{{{{π}} ^n}\left| {R} \right|}}{{\mathop{\rm e}\nolimits} ^{ - {{{x}}^{\rm{H}}}{{R}^{ - 1}}{x}}}$

(7)

其中，R为n阶协方差矩阵。从信息几何的角度看，零均值多元复高斯分布族可以构成一个统计流形^[4]

$S = \left\{ {p\left( {{x}|{{R}}} \right)|{{R}} \in \Theta } \right\}$

(8)

式中， $\Theta \subset {C^{n \times n}}$ 为n阶共轭对称正定矩阵空间。R为统计流形S的坐标，S又称为矩阵流形，其几何结构反应了概率密度函数族内在的本质属性。此时，H₀和H₁条件下的似然函数 $p\left( {\left. {{x}} \right|{H_0}} \right)$ 和 $p\left( {\left. {{x}} \right|{H_1}} \right)$ 分别对应统计流形S上的两点，将其坐标记为协方差矩阵R₀和R₁。

在统计流形上以H₀和H₁条件下似然函数间的距离，或者说，以统计流形S上两点R₀和R₁间的距离 $D\left( {{{{R}}_1},\,{{{R}}_0}} \right)$ ，作为检测统计量，可以得到一类距离检测器，若

$D\left( {{{{R}}_1},\,{{{R}}_0}} \right) > \eta$

(9)

则接受H₁，否则接受H₀，式中， $\eta$ 为根据虚警概率计算得到的判决门限。在检测器中，R₀和R₁分别表示噪声或杂波协方差矩阵和检测单元观测样本协方差矩阵。

由式(9)，可得虚警概率和检测概率表达式

${P_{{\rm{fa}}}} = \Pr \left[ {\left. {D\left( {{{{R}}_{\rm{1}}},{{{R}}_0}} \right) \ge \eta } \right|{H_0}} \right]$

(10)

${P_{\rm d}} = \Pr \left[ {\left. {D\left( {{{{R}}_{\rm{1}}},{{{R}}_0}} \right) > \eta } \right|{H_1}} \right]$

(11)

实际中，为了满足检测器的恒虚警率特性，需要实时估计R₀的值，R₀的估计性能对检测性能具有重要影响。

在信息论中应用较广的距离度量是Kulback-Leibler分离度，其定义为：

$\begin{aligned} {\mathop{\rm KLD}\nolimits} \left( {{{{R}}_1},\,{{{R}}_0}} \right) = & {\mathop{\rm KLD}\nolimits} \left[ {p\left( {{x}|{{{R}}_1}} \right),\,p\left( {{x}|{{{R}}_0}} \right)} \right] \\ = & \int {p\left( {{x}|{{{R}}_1}} \right)} \ln \frac{{p\left( {{x}|{{{R}}_1}} \right)}}{{p\left( {{x}|{{{R}}_0}} \right)}}{{\rm d}} {x} \end{aligned}$

Kulback-Leibler分离度容易计算，但也存在一定的局限性，即对于流形上相距较近的两点，它与测地线距离等价，但当两点相距较远时，由于未考虑流形的结构和连接两点的最短路径，它与测地线距离差异较大。另外，Kulback-Leibler分离度不满足距离定义的对称性、三角不等式等性质，并不是一个严格意义上的距离度量。程永强等人针对确定性信号检测和随机信号检测问题，将经典的似然比检测方法等效为统计流形上的“广义最小距离检测器”，并在信息几何框架下研究了广义似然比检测器和局部最大势检测器，从而将检测问题转变为统计流形上的几何问题来研究^[12]。赵兴刚等人研究了低信杂比条件下基于Kulback-Leibler分离度的距离检测器和基于测地线距离的距离检测器，当信杂比较低时，统计流形上两假设分布间的距离很小，此时可以使用距离的近似形式来定义距离检测器，以使最终的检测器形式上更简单，更易实现^[17]。这些检测器并不是严格意义上的恒虚警率(CFAR)检测器。

在雷达目标检测中，要求检测器能实时估计检测单元的杂波功率、杂波概率分布类型或其参数，以满足恒虚警率特性，为此，前人提出了单元平均CFAR、有序统计类CFAR、自适应CFAR、双参数CFAR等检测器。在信息几何框架下，将观测数据协方差矩阵构成一个统计流形，它成为一个矩阵流形，类比CFAR检测的思想，首先计算参考单元中协方差矩阵的均值，以该均值作为检测单元中噪声或杂波协方差矩阵的估计值，然后利用检测单元协方差矩阵与参考单元协方差矩阵均值间定义的距离作为检测统计量，所获得的检测器称为矩阵CFAR检测器。文献[17]在矩阵流形上，研究了黎曼度量、测地线、测地线距离，以及矩阵黎曼均值的迭代计算方法，在此基础上对矩阵CFAR进行了讨论。这里仅给出主要概念和结论。

在统计流形S上，研究流形上的几何性质。在统计流形上，Fisher信息矩阵是唯一的度量不变量^[2]，通常将Fisher信息矩阵作为黎曼度量张量，直接计算或通过仿射黎曼度量计算，得到黎曼度量分量为^[1]：

$\begin{aligned} {g_{ij}} = & E\left[ {{\partial _i}\ln p\left( {{x}|{R}} \right){\partial _j}\ln p\left( {{x}|{R}} \right)} \right]\; \; \; \; \\ = & {\left\langle {{\partial _i}{R},\; {\partial _j}{R}} \right\rangle _{R}} = {\mathop{\rm tr}\nolimits} ({{R}^{ - 1}}{\partial _i}{R}{{R}^{ - 1}}{\partial _j}{R}), \\ & \quad i,j = 1,2, ·\!·\!· ,n \end{aligned}$

(12)

式中，tr表示矩阵的迹。以R和 ${R} + {\mathop{\rm d}\nolimits} {R}$ 为参数的相邻两个点 $p\left( {{x}\left| {R} \right.} \right)$ 和 $p\left( {{x}\left| {{R} + {\mathop{\rm d}\nolimits} {R}} \right.} \right)$ 之间的微分距离 ${{\rm d}} {s^2}$ 可以通过Fisher信息矩阵得到^[9]：

$\begin{aligned} {{\rm d}} {s^2} = & \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{g_{ij}}{\rm{d}}{\theta ^i}{\rm{d}}{\theta ^j}} } = {\rm{tr}}\left[ {{{R}}^{ - 1}} \cdot \left( {\sum\limits_{i = 1}^n {{\partial _i}{{R}}{\rm{d}}{\theta ^i}} } \right) \right. \\ & \cdot \left. {{{R}}^{ - 1}} \cdot \left( {\sum\limits_{i = 1}^n {{\partial _j}{{R}}{\rm{d}}{\theta ^j}} } \right) \right] = {\rm{tr}}\left[ {{{\left( {{{{R}}^{ - 1}}{\mathop{\rm d}\nolimits} {R}} \right)}^2}} \right] \\ = & \left\| {{{R}^{ - 1}}{\mathop{\rm d}\nolimits} {R}} \right\|_{\rm{F}}^2 = \left\| {{{R}^{ - 1/2}} \cdot {\mathop{\rm d}\nolimits} {R} \cdot {{R}^{ - 1/2}}} \right\|_{\rm{F}}^2 \end{aligned}$

(13)

其中， ${\rm{d}}{{R}} = \displaystyle\sum\nolimits_{i = 1}^n {{\partial _i}{{R}}{\rm{d}}{\theta ^i}}$ , ${\left\| \cdot \right\|_{\rm{F}}}$ 为矩阵Frobenius范数。对于任意的 ${M} = \left[ {{m_{ij}}} \right] \in {C^{n \times n}}$ ，则 $\left\| {M} \right\|_{\rm{F}}^2 =$ $\displaystyle\sum\nolimits_{i = 1}^n {\sum\nolimits_{j = 1}^n {{{\left| {{m_{ij}}} \right|}^2}} }$ 。

流形上两点间的距离与连接两点的曲线有关，在所有可选的曲线中，使距离最短的曲线称为测地线，相应的最小距离称为测地线距离。测地线距离是欧氏空间中直线距离在流形上的推广。对于矩阵流形上的任意点 ${A} \in \Theta$ ，设A点的切向量为 ${{v}} \in {{\mathop{\rm T}\nolimits} _{{A}}}\Theta$ ( ${{\mathop{\rm T}\nolimits} _{{A}}}\Theta$ 为A点的切空间)。利用指数映射的概念，则流形上以A为起点，沿 ${{v}}$ 方向随参数t变化的测地线^[18]为：

${γ} \left( t \right) = {{{A}}^{1/2}}{{\mathop{\rm e}\nolimits} ^{t{{{A}}^{ - 1/2}}{{v}}{{{A}}^{ - 1/2}}}}{{{A}}^{1/2}}, \ \ 0 \le t \le 1$

(14)

${γ} \left( 0 \right) = {A}$ ，令 ${γ} \left( 1 \right) = {{B}}$ ，可得连接两点A和B的测地线为：

$\begin{aligned} {γ} \left( t \right) = &{{{A}}^{1/2}}{{\mathop{\rm e}\nolimits} ^{t\log ({{{A}}^{ - 1/2}}{{B}}{{{A}}^{ - 1/2}})}}{{{A}}^{1/2}} \\ = & {{{A}}^{1/2}}{\left( {{{{A}}^{ - 1/2}}{{B}}{{{A}}^{ - 1/2}}} \right)^t}{{{A}}^{1/2}}, \;\;0 \le t \le 1 \end{aligned}$

(15)

沿测地线 ${γ} \left( t \right)$ 对 ${\rm{d}}{s^2}$ 进行积分，可得A和B之间的测地线距离^[8]为：

$\begin{aligned} D\left( {{{A}},{{B}}} \right) = &\min \int_{{A}}^{{B}} {\sqrt {{{\rm d}} {s^2}\left( {{R}} \right)} } \\ = & \int_{{γ} \left( t \right)} {\sqrt {{{\left[ {\frac{{{{\rm d}} s\left( {{{R}}\left( t \right)} \right)}}{{{\mathop{\rm d}\nolimits} t}}} \right]}^2}} } {\mathop{\rm d}\nolimits} t \\ = & {\left\| {{\rm{log}}({{{A}}^{ - 1/2}}{{B}}{{{A}}^{ - 1/2}})} \right\|_{\rm{F}}} \\ = &\sqrt {\sum\limits_{k = 1}^n {{{\ln }^2}} \left( {{\lambda _k}} \right)} \end{aligned}$

(16)

式中， ${{R}}\left( t \right)$ 表示测地线 ${γ} \left( t \right)$ 上对应点的矩阵， ${\lambda _k}\left( {k = 1, ·\!·\!· ,n} \right)$ 为对 ${{{A}}^{ - 1/2}}{{B}}{{{A}}^{ - 1/2}}$ 进行谱分解得到的第k个特征值，利用矩阵的谱分解能够简化矩阵运算。与Kulback-Leibler分离度相比，测地线距离具有以下性质^[5]：

①非负性： $D\left( {{{A}},{{B}}} \right) \!\ge \! 0$ , $D\left( {{{A}},{{B}}} \right) \!=\! 0$ $\Leftrightarrow$ ${{A}} \!=\! {{B}}$ ；

②对称性： $D\left( {{{A}},{{B}}} \right) = D\left( {{{B}},{{A}}} \right)$ ；

③三角不等式： $D\left( {{{A}},{{C}}} \right) \!\le\! D\left( {{{A}},{{B}}} \right) \!+\! D\left( {{{B}},{{C}}} \right)$ ；

④矩阵合同变换条件下不变性：D (A, B)= $D\left( {{{PA}}{{{P}}^{\rm{H}}},{{PB}}{{{P}}^{\rm{H}}}} \right)$ , P为n阶可逆矩阵；

⑤矩阵求逆条件下不变性： $D\left( {{{A}},{{B}}} \right) =$ $D\left( {{{{A}}^{ - 1}},{{{B}}^{ - 1}}} \right)$ 。

这些性质使得测地线距离成为性能较好的检测统计量。

对于已知的N个矩阵 ${{R}_k}\left( {k = 1,2, ·\!·\!· ,N} \right)$ ，其黎曼均值 $\bar{{R}}$ 是使得目标函数，即下式中均方测地线距离表示的经验方差

$J\left( {R} \right) = \frac{1}{N}\sum\limits_{k = 1}^N {{D^2}} \left( {{{R}_k},{R}} \right)$

(17)

取最小值时所对应的矩阵，即

$\bar{{R}} = \arg \mathop {\min }\limits_{{{R}} \in \Theta } J\left( {R} \right)$

(18)

与算术均值相比，矩阵流形上的黎曼均值符合流形的几何性质，具有更高的估计精度。通常，利用目标函数 $J\left( {R} \right)$ 对R的梯度计算局部最小值，该梯度

$\begin{aligned} \nabla J\left( {R} \right) & = \frac{1}{N}\sum\limits_{k = 1}^N {\nabla {D^2}} \left( {{{R}_k},{R}} \right) \\ & = \frac{1}{N}\sum\limits_{k = 1}^N {\nabla \left\| {\log \left({R}_k^{ - 1/2}{RR}_k^{ - 1/2}\right)} \right\|_{\rm F}^2} \\ & = \frac{{R}}{N}\sum\limits_{k = 1}^N {\log } \left( {{R}_k^{ - 1/2}{RR}_k^{ - 1/2}} \right) \end{aligned}$

(19)

$J\left( {R} \right)$ 获得局部最小值的充要条件为 $\nabla J\left( {R} \right) = 0$ 。当 $N > 2$ 时较难获得解析表达式，梯度下降算法是一种可行的计算方法。

梯度下降方法的实现思想是：任意指定流形上的一个协方差矩阵作为黎曼均值的假定值，则该假定值与真实矩阵均值 $\bar{{R}}$ 之间就确定了一条测地线 ${{γ} _{\bar{{R}}}}\left( t \right)$ , $t \ge 0$ ，该测地线上任一参数t对应的协方差矩阵记为 $\bar{{R}}\left( t \right)$ ，则均值的假定值对应了 $\bar{{R}}\left( 0 \right)$ , $\bar{{R}}$ 对应了 $\bar{{R}}\left( t \right)$ 在终点处的取值。利用式(14)所给的测地线方程，以 $\bar{{R}}\left( {{t_0}} \right)$ , ${t_0} = 0$ 为初始值，切向量 ${ν}$ 为目标函数 $J\left( {R} \right)$ 在 ${\bar{{R}}}\left( {{t_0}} \right)$ 处的负梯度 ${ν} \!\!=\!\! - \nabla J\left[ {\bar{{R}}\left( {{t_0}} \right)} \right]$ ，令 $\tau$ 为增量， $\tau < 1$ ，可得测地线 ${{γ} _{\bar{{R}}}}\left( t \right)$ 上 ${t_0} + \tau$ 处对应的点 $\bar{{R}}\left( {{t_0} + \tau } \right)$ ，经多次迭代计算，直到目标函数 $J\left( {R} \right)$ 小于一个较小值。

文献[5]和文献[6]利用梯度下降算法给出了 $\bar{{R}}$ 的迭代计算方法，将实矩阵情况推广到复矩阵情况下，令第i次迭代计算得到的黎曼均值估计值为 ${\bar{{R}}_i}$ ，第 $i + 1$ 次迭代计算得到的黎曼均值估计值为：

${\bar{{R}}_{i + 1}} \!\!=\!\! \bar{{R}}_i^{1/2}{{\mathop{\rm e}\nolimits} ^{\tiny\displaystyle\frac{\tau }{N}\sum\limits_{k = 1}^N {\log \left( {\bar{{R}}_i^{ - 1/2}{{R}_k} \bar{{R}}_i^{ - 1/2}} \right)} }}\bar{{R}}_i^{1/2},\; 0 \!\le\!\! \tau \!\le\!\! 1 \quad\ \$

(20)

选择迭代的初始值 ${\bar{{R}}_0}$ 和步长 $\tau$ ，就可以对矩阵的黎曼均值进行迭代运算。

基于黎曼均值和测地线距离，矩阵CFAR检测器的框图如图3所示，其中，观测数据为根据复采样序列估计得到的样本协方差矩阵，当矩阵维数较大时，需要降低协方差矩阵的维数以提高矩阵处理的效率，滑窗中参考单元的长度为N，滑窗中的阴影部分为保护单元，R_D为检测单元的协方差矩阵， $\bar{{R}}$ 是参考单元中的N个协方差矩阵的黎曼均值，T是根据虚警概率计算得到的检测门限。

图 3 基于信息几何的矩阵CFAR检测器框图

Figure 3. Block diagram of CA-CFAR detector based on information geometry

下载: 全尺寸图片幻灯片

检测过程中，首先利用式(20)计算参考单元的黎曼均值 $\bar{{R}}$ ，用于估计背景噪声或杂波协方差矩阵；然后利用式(16)计算R_D和 $\bar{{R}}$ 之间的测地线距离平方作为检测统计量进行检测：

${D^2}\left( {{{R}_{\rm{D}}},\bar{{R}}} \right)\mathop \gtrless \limits_{{H_0}}^{{H_1}} T$

(21)

由于虚警概率解析表达式难以得到，不易从理论上计算检测门限T，可利用Monte-Carlo仿真得到T。说明，为避免 $D\left( {{{R}_{\rm{D}}},\bar{{R}}} \right)$ 中的根号运算和称呼简便，后续称 ${D^2}\left( {{{R}_{\rm{D}}},\bar{{R}}} \right)$ 为测地线距离。

矩阵CFAR检测方法直接利用观测样本序列的协方差矩阵描述回波特性，并进行目标检测，协方差矩阵中包括了目标及杂波时间相关性的原始信息，有利于检测飞机尾流目标这类的多普勒展宽目标，能避免常规的多普勒处理所面临的问题。由于利用矩阵流形的结构计算参考单元的协方差矩阵均值，即满足式(18)给出的条件，该均值具有较小的经验方差，从而使得CFAR检测器具有更稳健的恒虚警特性。

需要说明的是，上面给出了一般的矩阵流形几何结构，当使用不同的统计流形的坐标、距离定义、均值定义和梯度下降算法等，能够获得不同的几何结构，同时也可以利用更多的几何结构，或采用更合适的检测策略或检测统计量，以便适应于不同的检测场景。

4. 尾流回波协方差矩阵的降低维数处理

当协方差矩阵的维数较大时，矩阵CFAR检测器的运算效率较低，不利于实时处理，因此有必要在检测性能下降较少的条件下，尽量降低协方差矩阵的维数。在对尾流回波协方差矩阵进行降维处理后，一种直观的评价标准是，降低维数之前与之后，根据相关系数估计得到的功率谱基本一致。

由于矩阵CFAR检测方法利用的是观测数据的协方差矩阵，而常规MTD检测方法利用的是观测数据的功率谱，因此这里分别给出观测数据的自相关函数和功率谱，以对两种检测方法进行对比。自相关函数和功率谱是描述脉冲序列时间相关性的两种方式，利用傅里叶变换可以将自相关函数变换为功率谱。在脉冲数为16时，在噪声中加入SNR为6 dB的仿真尾流回波，噪声和尾流回波的自相关函数如图4(a)所示，功率谱如图4(b)所示。

图 4 脉冲个数为16时的自相关函数与功率谱

Figure 4. Autocorrelation function and power spectrum when the pulse number is 16

下载: 全尺寸图片幻灯片

当尾流目标距离雷达较远时，需要进行长时间积累，实际使用的脉冲数较多。在脉冲数为64，SNR为6 dB时，利用协方差矩阵中延迟为0至15的相关系数估计功率谱，与直接利用FFT得到的功率谱进行比较，两种方法得到的功率谱如图5所示。可见，两种方法得到的功率谱较为一致，所以可以利用相关系数进行协方差矩阵的降维处理。该矩阵降维算法的缺点是功率谱的旁瓣较高，下一步将研究性能更优的矩阵降维算法。

图 5 协方差矩阵降低维数之前与之后的功率谱

Figure 5. The power spectrum before and after the covariance matrix reduces the dimension

下载: 全尺寸图片幻灯片

5. 噪声背景下仿真尾流回波的检测性能

下面以 64个脉冲为例，利用上节的方法降低协方差矩阵的维数为16，在矩阵流形上分析尾流目标的测地线距离随信噪比变化、黎曼均值估计性能和检测性能。

在噪声背景下，计算仿真的尾流回波的协方差矩阵与噪声的协方差矩阵间的测地线距离，对100次仿真结果进行平均，图6给出了测地线距离 ${D^2}\left( {{{R}_{\rm{D}}},\bar{{R}}} \right)$ 随信噪比变化的曲线。测地线距离随着信噪比增大而增大，所以取适当的检测门限，在信噪比大于某一确定值时，就能够检测到尾流目标。

图 6 随SNR的变化测地线距离的变化

Figure 6. The variation of geodesic distance with the variation of SNR

下载: 全尺寸图片幻灯片

利用仿真噪声数据对矩阵均值迭代算法的估计性能进行仿真分析，其中已知矩阵的个数N=16，选择矩阵的算术均值作为迭代算法的初始值 ${\bar{{R}}_0}$ ，步长 $\tau = 0.1$ ，可得协方差矩阵均值的估计性能如图7所示。由图可知，随着迭代次数的增加，均方测地线距离，即经验方法，不断减小，一般在20次迭代后，趋向于一个常数，利用梯度下降算法可以得到更符合物理意义的矩阵均值。

图 7 矩阵均值迭代估计性能

Figure 7. Iterative estimation performance of matrix mean

下载: 全尺寸图片幻灯片

对于仿真的噪声和尾流回波，令检测统计量为尾流回波加噪声的协方差矩阵与噪声的协方差矩阵均值间的测地线距离，利用统计方法得到检测统计量的统计直方图，以及检测门限。令虚警概率为10^–4，脉冲数目为16时，通过Monte-Carlo仿真得到检测门限为44.3999；脉冲数目为64时，检测门限为11.9567；脉冲数目为256时，检测门限为2.7531。脉冲数为16, SNR为6 dB时，噪声条件下和存在尾流条件下检测统计量的统计直方图如图8(a)所示，仿真1000次，检测概率为0.59。脉冲数为64, SNR为0 dB时，噪声条件下和存在尾流条件下检测统计量的统计直方图如图8(b)所示，仿真1000次，检测概率为0.79。

图 8 有无尾流情况下检测统计量的统计直方图

Figure 8. The statistical histogram of detection statistics with and without the vortex target

下载: 全尺寸图片幻灯片

在脉冲数分别为16, 64和256时，利用矩阵CFAR检测方法进行尾流目标检测，其中，脉冲数大于16时，均降低协方差矩阵的维数为16。随着信噪比变化，尾流目标的检测概率如图9所示，可知，脉冲数为64时与脉冲数为16时相比，以及脉冲数为256时与脉冲数为64时相比，在相同的检测概率处检测增益均提高约6 dB，增加4倍脉冲数所获得的增益相当于相参积累所获得的增益，所以利用延迟为0至15的相关系数构成16维协方差矩阵，能够达到降低协方差矩阵的维数的目的，对矩阵CFAR检测器的性能不造成影响。

图 9 基于矩阵CFAR的尾流目标的检测概率

Figure 9. Detection probability of the vortex target based on matrix CFAR

下载: 全尺寸图片幻灯片

由图9可知，若用矩阵CFAR检测方法对尾流目标回波进行检测，在虚警概率10^–4、检测概率80%、脉冲数为64时，所需信噪比约为0 dB。

常规MTD检测方法通过MTD加CFAR检测器来实现尾流目标功率谱的频域峰值检测，设定如下的假设条件：

(1) 在未知功率水平的白色高斯噪声及单脉冲平方律检测的假设下，背景功率水平由16个参考单元采样的均值估计得到，对非起伏目标，常规CA-CFAR检测器在虚警概率10^–4、检测概率80%时，检测常规点目标所需的信噪比为11.6 dB；

(2) 在信噪比为0 dB时，进行100次尾流谱仿真，统计出尾流功率谱的峰值与所有功率谱值之和的比值，由统计平均可知，尾流谱的峰值约占整个尾流谱20%的功率，理论上可做出假设，由于尾流谱的展宽，导致的检测损失约7 dB；

(3) 在脉冲数为64时，经过相参积累，增益18 dB。

综上，可以近似分析出，对于尾流目标功率谱的常规MTD检测方法，在虚警概率10^–4、检测概率80%、脉冲数为64时，所需信噪比约为0.6 dB。

由上面的分析可知，矩阵CFAR检测方法与常规方法相比，检测性能略有改善。另外，在信噪比为0 dB时，受噪声随机性的影响，100次仿真中有若干次，尾流目标功率谱的峰值与噪声相当，实际上常规方法的虚警概率将略高于10^–4，检测性能还将低于上面的理论分析结果。更进一步，在使用常规MTD检测方法时，若参考单元选择不当，展宽的尾流目标功率谱落在参考单元中，还将抬高检测门限，导致目标遮蔽现象和检测概率下降。

矩阵CFAR检测方法直接利用观测样本序列的协方差矩阵进行尾流目标检测，避免了常规多普勒处理所面临的问题，仿真实验证明了它在尾流目标检测中具有较大优势。矩阵CFAR检测方法的缺点是运算量较大，导致较多的处理时间，有待改善实时性，可能的解决思路是通过算术均值代替黎曼均值，利用协方差矩阵为Toeplitz Hermitian正定矩阵的特点，利用矩阵谱分解方法提高矩阵运算的效率等方面。

6. 小结

飞机尾流是一种典型的角度、距离、多普勒展宽目标，同时也是一种空气介质目标，信噪比很低，针对某个特定的角度和距离单元上多普勒展宽目标的检测问题，本文研究了矩阵信息几何方法在飞机尾流目标检测中的应用。为保留原始观测信息，将协方差矩阵看作统计流形上的点，以测地线距离来定量描述目标和噪声杂波协方差矩阵间的差异，将统计检测问题转化为几何问题，提供了解决目标检测问题的一个新思路。对于功率谱展宽目标，该方法优于常规MTD检测方法。

信息几何方法在雷达目标探测技术领域的应用仍处于起步阶段，除了在尾流目标检测、近海小目标检测、短脉冲串信号检测等方面的应用，在雷达信号处理和数据处理中也具有较广的应用前景，在信息几何应用中的理论问题有待深入探讨。信息几何涉及较深的数学知识，尤其是微分几何、统计流形等方面，由于黎曼度量、测地线、测地距离、黎曼均值等几何概念的物理意义较明确，在应用中发挥了重要作用，而信息几何中更多概念的物理意义还需要深入分析。在雷达信号处理和目标检测领域中，信息几何的优势与应用条件、非高斯概率分布流形的几何结构、基于功率谱的信息几何检测器、气象杂波环境下尾流目标的信息几何检测方法、矩阵CFAR的快速算法、适用于矩阵信息几何的矩阵降维算法等方面还需要进一步研究。

图 1 Transformer编码器

Figure 1. Transformer encoder

下载: 全尺寸图片幻灯片

图 2 改进的Transformer解码器

Figure 2. Improved Transformer decoder

下载: 全尺寸图片幻灯片

图 3 Track-MT3模型架构示意图

Figure 3. Schematic diagram of Track-MT3 model architecture

下载: 全尺寸图片幻灯片

图 4 检测查询和跟踪查询示意图

Figure 4. Schematic diagram of detection query and track query

下载: 全尺寸图片幻灯片

图 5 查询变换与时间特征编码模块

Figure 5. Query transformation and temporal feature encoding module

下载: 全尺寸图片幻灯片

图 6 训练损失函数曲线

Figure 6. Training loss function curve

下载: 全尺寸图片幻灯片

图 7 一个滑动窗口下模型的输入和输出

Figure 7. Inputs and outputs of the model under a sliding window

下载: 全尺寸图片幻灯片

图 8 编码器输出数据分析可视化

Figure 8. Visualisation of the analysis of the encoder output data

下载: 全尺寸图片幻灯片

图 9 查询向量和编码器输出的注意力分数可视化

Figure 9. Attention score visualisation of query vectors and encoder outputs

下载: 全尺寸图片幻灯片

图 10 不同实验场景下的轨迹跟踪图

Figure 10. Trajectory tracking plots for different experimental scenarios

下载: 全尺寸图片幻灯片

图 11 不同实验场景下目标数量变化图

Figure 11. Variation of the number of targets in different experimental scenarios

下载: 全尺寸图片幻灯片

图 12 不同场景下评价指标对比

Figure 12. Comparison of evaluation indicators in different scenarios

下载: 全尺寸图片幻灯片

图 13 查询置信度阈值稳健性分析

Figure 13. Robustness analysis of query confidence threshold

下载: 全尺寸图片幻灯片

图 14 鲁棒性测试

Figure 14. Robustness test

下载: 全尺寸图片幻灯片

表 1 训练样本信息

Table 1. Training sample information

参数	数值
总的样本数(有效量测点数)	401651991
真实目标量测点数	81664937
杂波量测点数	319987054
平均每个批次样本总数	8034
平均每个时间窗口样本总数	252

下载: 导出CSV

表 2 实验环境

Table 2. Experimental environment

项目	版本
CPU	12th Gen Intel(R) Core i5-12400
GPU	NVIDIA GeForce RTX 3090 Ti
Python	3.7.4
Pytorch	1.6.0
Torchvision	0.7.0
CUDA	4.14.0

下载: 导出CSV

表 3 Track-MT3网络参数

Table 3. Track-MT3 network parameters

参数	取值
编码器层数	6
解码器层数	6
编码器输入数据维度	256
解码器输入数据层数	256
多头注意力头数	8
查询向量数量	16
前馈网络隐藏层维度	2048
神经元Dropout	0.1
预测器MLP层数	3
预测器隐藏层维度	128

下载: 导出CSV

表 4 模型训练参数

Table 4. Model training parameters

参数	取值
优化器	Adam
Epoch数	50000
Batch Size	32
初始学习率	0.0002
学习率衰减容忍度	5000
学习率衰减因子	0.5

下载: 导出CSV

表 5 不同仿真场景参数设置

Table 5. Parameter settings for different simulation scenarios

场景	目标数量(个)	出生率	死亡率
场景1	6	0.04	0.01
场景2	6	0.08	0.02
场景3	10	0.12	0.03

下载: 导出CSV

表 6 跟踪准确性对比

Table 6. Tracking accuracy comparison

跟踪方法	定位误差	漏检误差	虚警误差
JPDA	0.1629	0.6208	4.2812
MHT	0.6006	1.5921	3.8717
Track-MT3	0.0588	2.3683	2.3708

下载: 导出CSV

表 7 计算效率对比

Table 7. Computational efficiency comparison

跟踪方法	单帧运行时间(s)	平均内存占用(MB)
JPDA	0.0041	169.6641
MHT	0.1714	209.8398
Track-MT3	0.0123	253.6656

下载: 导出CSV

表 8 QTM消融实验

Table 8. QTM ablation experiment

评价指标	Full	No-QTM
GOSPA (×10^–1 m)	3.546362	4.760920
Pro-GOSPA (×10^–1 m)	1.340019	1.925471

下载: 导出CSV

表 9 实验参数设置

Table 9. Experimental parameter settings

实验组	${P_{\mathrm{D}}}$	${\sigma _{\mathrm{q}}}$	${\sigma _{\mathrm{r}}}$	${\lambda _{\mathrm{c}}}$
实验1	0.95	0.01	0.1	5
实验2	0.90	0.02	0.9	10
实验3	0.85	0.03	2.0	15

下载: 导出CSV

参考文献(34)

[1]	BAI Xianglong, LAN Hua, WANG Zengfu, et al. Robust multitarget tracking in interference environments: A message-passing approach[J]. IEEE Transactions on Aerospace and Electronic Systems, 2024, 60(1): 360–386. doi: 10.1109/TAES.2023.3323629.
[2]	YANG Jialin, JIANG Defu, TAO Jin, et al. A sector-matching probability hypothesis density filter for radar multiple target tracking[J]. Applied Sciences, 2023, 13(5): 2834. doi: 10.3390/app13052834.
[3]	HEM A G, BAERVELDT M, and BREKKE E F. PMBM filtering with fusion of target-provided and exteroceptive measurements: Applications to maritime point and extended object tracking[J]. IEEE Access, 2024, 12: 55404–55423. doi: 10.1109/ACCESS.2024.3389824.
[4]	CHEN Jiahui, GUO Shisheng, LUO Haolan, et al. Non-line-of-sight multi-target localization algorithm for driver-assistance radar system[J]. IEEE Transactions on Vehicular Technology, 2023, 72(4): 5332–5337. doi: 10.1109/TVT.2022.3227971.
[5]	HERZOG F, CHEN Junpeng, TEEPE T, et al. Synthehicle: Multi-vehicle multi-camera tracking in virtual cities[C]. 2023 IEEE/CVF Winter Conference on Applications of Computer Vision Workshops. Waikoloa, USA, 2023: 1–11. doi: 10.1109/WACVW58289.2023.00005.
[6]	RAKAI L, SONG Huansheng, SUN Shijie, et al. Data association in multiple object tracking: A survey of recent techniques[J]. Expert Systems with Applications, 2022, 192: 116300. doi: 10.1016/j.eswa.2021.116300.
[7]	LI Tiancheng, LIANG Haozhe, XIAO Bing, et al. Finite mixture modeling in time series: A survey of Bayesian filters and fusion approaches[J]. Information Fusion, 2023, 98: 101827. doi: 10.1016/j.inffus.2023.101827.
[8]	LIU Zongxiang, LUO Junwen, and ZHOU Chunmei. Multi-hypothesis marginal multi-target bayes filter for a heavy-tailed observation noise[J]. Remote Sensing, 2023, 15(21): 5258. doi: 10.3390/rs15215258.
[9]	QIU Changzhen, ZHANG Zhiyong, LU Huanzhang, et al. A survey of motion-based multitarget tracking methods[J]. Progress In Electromagnetics Research B, 2015, 62: 195–223. doi: 10.2528/PIERB15010503.
[10]	Vo B N and MA W K. The gaussian mixture probability hypothesis density filter[J]. IEEE Transactions on Signal Processing, 2006, 54(11): 4091–4104. doi: 10.1109/TSP.2006.881190.
[11]	Vo B T, Vo B N, and CANTONI A. Analytic implementations of the cardinalized probability hypothesis density filter[J]. IEEE Transactions on Signal Processing, 2007, 55(7): 3553–3567. doi: 10.1109/TSP.2007.894241.
[12]	Vo B T, Vo B N, and CANTONI A. The cardinality balanced multi-target multi-bernoulli filter and its implementations[J]. IEEE Transactions on Signal Processing, 2009, 57(2): 409–423. doi: 10.1109/TSP.2008.2007924.
[13]	Vo B N, Vo B T, and PHUNG D. Labeled random finite sets and the bayes multi-target tracking filter[J]. IEEE Transactions on Signal Processing, 2014, 62(24): 6554–6567. doi: 10.1109/TSP.2014.2364014.
[14]	GARCÍA-FERNÁNDEZ Á F, WILLIAMS J L, GRANSTRÖM K, et al. Poisson multi-Bernoulli mixture filter: Direct derivation and implementation[J]. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(4): 1883–1901. doi: 10.1109/TAES.2018.2805153.
[15]	CHONG C Y. An overview of machine learning methods for multiple target tracking[C]. 2021 IEEE 24th International Conference on Information Fusion, Sun City, South Africa, 2021: 1–9. doi: 10.23919/FUSION49465.2021.9627045.
[16]	JONDHALE S R and DESHPANDE R S. Kalman filtering framework-based real time target tracking in wireless sensor networks using generalized regression neural networks[J]. IEEE Sensors Journal, 2019, 19(1): 224–233. doi: 10.1109/JSEN.2018.2873357.
[17]	LIU Huajun, ZHANG Hui, and MERTZ C. DeepDA: LSTM-based deep data association network for multi-targets tracking in clutter[C]. 22th International Conference on Information Fusion, Ottawa, Canada, 2019: 1–8. doi: 10.23919/FUSION43075.2019.9011217.
[18]	BECKER P, PANDYA H, GEBHARDT G H W, et al. Recurrent Kalman networks: Factorized inference in high-dimensional deep feature spaces[C]. International Conference on Machine Learning, Long Beach, USA, 2019: 544–552. doi: 10.48550/arXiv.1905.07357.
[19]	SHI Zhuangwei. Incorporating Transformer and LSTM to Kalman filter with EM algorithm for state estimation[OL]. https://doi.org/10.48550/arXiv.2105.00250.
[20]	GAO Chang, YAN Junkun, ZHOU Shenghua, et al. Long short-term memory-based deep recurrent neural networks for target tracking[J]. Information Sciences, 2019, 502: 279–296. doi: 10.1016/j.ins.2019.06.039.
[21]	ZHANG Yongquan, SHI Zhenyun, JI Hongbing, et al. Online multi-target intelligent tracking using a deep long-short term memory network[J]. Chinese Journal of Aeronautics, 2023, 36(9): 313–329. doi: 10.1016/j.cja.2023.02.006.
[22]	LI Jing, LIANG Xinru, YUAN Shengzhi, et al. A strong maneuvering target-tracking filtering based on intelligent algorithm[J]. International Journal of Aerospace Engineering, 2024, 2024(1): 9981332. doi: 10.1155/2024/9981332.
[23]	EMAMBAKHSH M, BAY A, and VAZQUEZ E. Deep recurrent neural network for multi-target filtering[C]. MultiMedia Modeling: 25th International Conference, Thessaloniki, Greece, 2019: 519–531. doi: 10.1007/978-3-030-05716-9_42.
[24]	LIU Jingxian, WANG Zulin, and XU Mai. DeepMTT: A deep learning maneuvering target-tracking algorithm based on bidirectional LSTM network[J]. Information Fusion, 2020, 53: 289–304. doi: 10.1016/j.inffus.2019.06.012.
[25]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention is All you Need[C]. The 31st International Conference on Neural Information Processing Systems, Long Beach, USA, 2017: 6000–6010.
[26]	ZENG Ailing, CHEN Muxi, ZHANG Lei, et al. Are transformers effective for time series forecasting?[C]. 37th AAAI Conference on Artificial Intelligence, Washington, USA, 2023: 11121–11128. doi: 10.1609/aaai.v37i9.26317.
[27]	PINTO J, HESS G, LJUNGBERGH W, et al. Next generation multitarget trackers: Random finite set methods vs transformer-based deep learning[C]. 2021 IEEE 24th International Conference on Information Fusion, Sun City, South Africa, 2021: 1–8. doi: 10.23919/FUSION49465.2021.9626990.
[28]	PINTO J, HESS G, LJUNGBERGH W, et al. Can deep learning be applied to model-based multi-object tracking?[OL]. https://doi.org/10.48550/arXiv.2202.07909.
[29]	MEINHARDT T, KIRILLOV A, LEAL-TAIXÉ L, et al. TrackFormer: Multi-object tracking with transformers[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition, New Orleans, USA, 2022: 8844–8854. doi: 10.1109/CVPR52688.2022.00864.
[30]	ZENG Fangao, DONG Bin, ZHANG Yuang, et al. MOTR: end-to-end multiple-object tracking with transformer[C]. 17th European Conference on Computer Vision, Tel Aviv, Israel, 2022: 659–675. doi: 10.1007/978-3-031-19812-0_38.
[31]	WANG Qiang, LI Bei, XIAO Tong, et al. Learning deep transformer models for machine translation[C]. 57th Annual Meeting of the Association for Computational Linguistics, Florence, Italy, 2019: 1810–1822. doi: 10.18653/v1/P19-1176.
[32]	CARION N, MASSA F, SYNNAEVE G, et al. End-to-end object detection with transformers[C]. 16th European conference on computer vision, Glasgow, UK, 2020: 213–229. doi: 10.1007/978-3-030-58452-8_13.
[33]	BEARD M, VO B T, and VO B N. Bayesian multi-target tracking with merged measurements using labelled random finite sets[J]. IEEE Transactions on Signal Processing, 2015, 63(6): 1433–1447. doi: 10.1109/TSP.2015.2393843.
[34]	RAHMATHULLAH A S, GARCÍA-FERNÁNDEZ Á F, and SVENSSON L. Generalized optimal sub-pattern assignment metric[C]. 2017 20th International Conference on Information Fusion, Xi’an, China, 2017: 1–8. doi: 10.23919/ICIF.2017.8009645.

施引文献

资源附件(0)

访问统计

图(14) / 表(9)

计量

文章访问数: 764
HTML全文浏览量: 278
PDF下载量: 218
被引次数: 0

1. 引言
2. 尾流目标的多普勒特性
3. 雷达目标回波的矩阵CFAR检测方法
4. 尾流回波协方差矩阵的降低维数处理
5. 噪声背景下仿真尾流回波的检测性能
6. 小结

Track-MT3：一种基于Transformer的新型多目标跟踪算法

DOI: 10.12000/JR24164

通讯作者:
陈辉 chenh@lut.edu.cn

计量

Track-MT3: A Novel Multitarget Tracking Algorithm Based on Transformer Network

Corresponding author: CHEN Hui, chenh@lut.edu.cn

1. 引言

2. 尾流目标的多普勒特性

3. 雷达目标回波的矩阵CFAR检测方法

4. 尾流回波协方差矩阵的降低维数处理

5. 噪声背景下仿真尾流回波的检测性能

6. 小结

计量

目录

1. 引言

2. 尾流目标的多普勒特性

3. 雷达目标回波的矩阵CFAR检测方法

4. 尾流回波协方差矩阵的降低维数处理

5. 噪声背景下仿真尾流回波的检测性能

6. 小结

期刊介绍

联系我们

Track-MT3：一种基于Transformer的新型多目标跟踪算法

DOI: 10.12000/JR24164

通讯作者: 陈辉 chenh@lut.edu.cn

计量

出版历程

Track-MT3: A Novel Multitarget Tracking Algorithm Based on Transformer Network

Corresponding author: CHEN Hui, chenh@lut.edu.cn

1. 引言

2. 尾流目标的多普勒特性

3. 雷达目标回波的矩阵CFAR检测方法

4. 尾流回波协方差矩阵的降低维数处理

5. 噪声背景下仿真尾流回波的检测性能

6. 小结

计量

出版历程

目录

1. 引言

2. 尾流目标的多普勒特性

3. 雷达目标回波的矩阵CFAR检测方法

4. 尾流回波协方差矩阵的降低维数处理

5. 噪声背景下仿真尾流回波的检测性能

6. 小结

期刊介绍

联系我们

通讯作者:
陈辉 chenh@lut.edu.cn