Processing math: 100%

基于直方统计特征的多特征组合航迹关联

徐亚圣 丁赤飚 任文娟 许光銮

徐亚圣, 丁赤飚, 任文娟, 等. 基于直方统计特征的多特征组合航迹关联[J]. 雷达学报, 2019, 8(1): 25–35. doi: 10.12000/JR18028
引用本文: 徐亚圣, 丁赤飚, 任文娟, 等. 基于直方统计特征的多特征组合航迹关联[J]. 雷达学报, 2019, 8(1): 25–35. doi: 10.12000/JR18028
XU Yasheng, DING Chibiao, REN Wenjuan, et al. Multi-feature combination track-to-track association based on histogram statistics feature[J]. Journal of Radars, 2019, 8(1): 25–35. doi: 10.12000/JR18028
Citation: XU Yasheng, DING Chibiao, REN Wenjuan, et al. Multi-feature combination track-to-track association based on histogram statistics feature[J]. Journal of Radars, 2019, 8(1): 25–35. doi: 10.12000/JR18028

基于直方统计特征的多特征组合航迹关联

DOI: 10.12000/JR18028
基金项目: 国家自然科学基金(61725105, 61331017)
详细信息
    作者简介:

    徐亚圣(1993–),男,湖南耒阳人。2015年在吉林大学获得工学学士学位,现为中国科学院大学,中国科学院电子学研究所硕士研究生。主要研究方向为航迹关联、机器学习。E-mail: xuyasheng93@163.com

    丁赤飚(1969–),男,陕西西安人,研究员,博士生导师。1997年在北京航空航天大学获得博士学位,现任中国科学院电子学研究所副所长,微波成像技术国家重点实验室主任,国家863计划专家。主要研究方向为雷达信号处理。E-mail: cbding@mail.ie.ac.cn

    任文娟(1982–),女,河南焦作人,副研究员,博士。2011年在中国科学院电子学研究所获得博士学位,现为中国科学院电子学研究所中国科学院空间信息处理与应用系统技术重点实验室副研究员,主要研究方向为多源遥感信息融合处理与应用技术。E-mail: wjren@mail.ie.ac.cn

    许光銮(1978–),男,浙江天台人,研究员,博士生导师。2005年在中国科学院电子学研究所获得博士学位,现为中国科学院电子学研究所研究员,中国科学院空间信息处理与应用系统技术重点实验室主任,主要研究方向为地理空间信息挖掘与应用技术。E-mail: gluanxu@mail.ie.ac.cn

    通讯作者:

    徐亚圣 xuyasheng93@163.com

  • 中图分类号: TP391

Multi-feature Combination Track-to-track Association Based on Histogram Statistics Feature

Funds: The National Natural Science Foundation of China (61725105, 61331017)
More Information
  • 摘要: 现有的航迹关联方法主要有基于统计和基于模糊数学两大类方法。基于统计的方法大多依赖阈值的设置,基于模糊数学的方法参数设置复杂,且多数方法相关比较时只考虑单个航迹点的信息。针对现有问题,该文首先从航迹的整体出发,在传统欧式距离度量的基础上,提出了一种距离分布直方图的特征并提取了航迹的相似特征,有效地利用了航迹间的整体特性,具有较好的抗噪声性能以及关联准确率。其次充分考虑了船舶运动特征以及不同数据源位置精度,提取了航迹间的速度差分布直方图特征、传感器来源特征。然后将这些特征组合并利用机器学习的方法训练关联模型,有效地避免了需要人工设定阈值以及参数设置复杂的问题。最后,该文构建了一个真实的船舶数据集,实验结果表明距离分布直方图特征相比传统的距离特征总体关联准确率提高了3.23%~11.65%,组合特征相较于单一的距离分布直方图特征总体关联准确率提高了0.068%,验证了该文方法的有效性。

     

  • 数据融合目前在各个领域有着广泛地应用[1,2],分布式多传感器融合系统是一种典型的多传感器数据融合系统[3,4],具有鲁棒性强、成本低的特点。航迹关联方法的研究一直是分布式多传感器融合系统中的一个热点。航迹关联就是确认多条来自不同传感器的目标轨迹是否属于同一目标,关联后可以有效地降低数据的冗余,正确的关联也是实现数据融合的前提。目前航迹关联的方法可以分为两大类,一类是基于统计的方法,另一类是基于模糊数学的方法。基于统计的方法主要是利用状态估计的差作为统计量并建立统计假设,然后以设定的概率阈值来判定航迹是否关联[46]。基于模糊数学的方法主要是选定或设计关联隶属度,通过计算两两航迹的关联隶属度来判断航迹是否关联[68]。这些方法主要存在以下问题:(1)对目标的航迹进行逐点比较,没有从航迹整体的角度来考虑,忽视了航迹的全局性的特征;(2)基于统计的方法需要人工设定阈值和大量的调试,扩展性不强;(3)只考虑了随机误差,而忽视了其他误差的影响。

    针对上述问题,大量文献对其进行了研究。文献[9]将航迹的整体视为时间序列,使用动态时间规整(Dynamic Time Warping, DTW)来测量任意两条航迹之间的相似度,从整体上考虑了航迹形状的相似性。将DTW相似性引入航迹关联当中,避免了在时域上进行配准,在一定程度上减小了误差。文献[10]将系统误差引入到原始的传感器量测中,构建了一种混合整数非线性规划模型,并对系统误差进行了估计,有效地提高了系统的性能。文献[11]提出了一种具有自适应阈值的最大后验概率(Maximum A Posteriori probability, MAP)关联算法。该算法显示,具有自适应阈值的算法性能优于固定阈值算法。

    针对现有方法存在的需要人工设定阈值、参数设置复杂、只考虑单个航迹点以及航迹信息利用不充分的问题,本文提出了一种基于多特征组合的航迹关联方法。首先从航迹的整体出发,在传统欧式距离度量的基础上,提出了一种距离分布直方图的特征并提取了航迹的相似特征,有效地利用了航迹整体的特性,具有较好的抗噪声性能以及关联准确率。其次挖掘了航迹间的速度差分布直方图特征、传感器来源特征,然后将这些特征组合,考虑到目前机器学习方法强大的特征学习能力,能够自动地学习特征中隐含的知识信息,且参数设置较为简单,因此利用机器学习方法对挖掘的特征进行学习得到航迹关联模型,从而有效地避免了需要人工设定阈值以及参数设置复杂的问题。最后通过实验验证了本文方法的有效性。

    船舶的航迹由一系列时空数据点(即经度、纬度、时间)组成,并且通过多种定位方式获得,由于同一个目标可能会被多个源观测到,因此在数据融合中心会出现一个目标的多条航迹观测(对于多条观测的情况,我们可以对观测中的航迹两两进行关联判断,最后得到关联结果),在系统中造成大量的数据冗余,在未判明目标时则会造成大量虚假目标信息,对后续的一些航迹知识挖掘任务,如目标识别、航迹融合造成很大的影响。

    假设分布式多传感系统中有M个传感器,每个传感器输出的航迹数为ms,将其中任意一条的航迹数据即目标的状态估计表示为Xsk,其中s=1,2,3,···,M,k=1,2,3,···,ms。目标的状态估计Xsk可以表示成为时间序列(1维或者多维的),这里定义Xsk为如下的一个多维的时间序列:

    x11,x12,x13,···,x1mx21,x22,x23,···,x2mxn1,xn2,xn3,···,xnm

    其中,m表示航迹的长度,n表示属性的维数。对于任意的两条航迹数据XsikiXsjkj(经过一定预处理后,在同一时间段里的两条航迹数据)存在以下两种假设H0H1

    H0: XsikiXsjkj源于同一目标

    H1: XsikiXsjkj源于不同目标

    本文对航迹数据XsikiXsjkj提取它们的距离分布,速度差分布直方图特征、DTW相似度特征以及来源特征,并将特征组合起来送入训练好的机器学习关联模型中,根据输出的结果判断是否将两条航迹进行关联。

    3.1.1   距离分布直方图特征

    距离是航迹间最基础也是最直观的特征,传统的航迹间的距离特征有欧式距离、编辑距离以及其它描述航迹形状相似度的距离等,传统的欧式距离主要是计算航迹对应的距离和或者最大最小距离[12],且需要两条航迹在时间上对齐,这些特征虽然简单且能在一定程度上解决关联的问题,但也有着十分明显的缺点:(1)单一数值不能很好地反映航迹间的细节差异;(2)在关联时需要人工设定阈值,依赖于人工经验,且关联准确率敏感于噪声。

    针对上述存在的问题,本文在欧式距离算法的基础上,提出了一种基于距离分布直方图特征(图1)。特征描述如下:

    图  1  距离分布直方图特征计算示意图
    Figure  1.  Schematic diagram of feature calculation of distance distribution histogram

    经过一定预处理(按照4.1.2节中,第1部分所做的时间对齐和抽样。3.1.2节及3.1.3节的特征提取也经过这样的预处理),两条时间上对齐(采样点的时间相同)、航迹长度相同、特征维度为经度、纬度、时间的航迹XY

    x11,x12,x13,···,x1my11,y12,y13,···,y1mx21,x22,x23,···,x2my21,y22,y23,···,y2mx31,x32,x33,···,x3my31,y32,y33,···,y3m

    其中,m表示航迹的长度,设航迹XY的距离序列为

    distance(X,Y)={d1,d2,d3,···,dm} (1)

    其中,di表示XYi个航迹点对应的距离。为了规范化处理,本文对距离序列distance(X,Y)取对数,得到:

    log(distance(X,Y))={log(d1),log(d2),log(d3),···,log(dm)} (2)

    统计distance(X,Y)的直方图分布,并对直方图分布各个区间的频次进行归一化处理,即将直方图分布在各个区间的频次转换为频率从而得到距离分布直方图特征量。

    3.1.2   动态时间规整(DTW)相似度特征

    航迹作为一种时间序列,可以考虑将其相似度作为一种特征,而DTW是一种典型的用于计算时间序列相似度的算法,它广泛应用于科学、医学、工业、金融等领域,在人工智能领域使用得更为频繁[1322]。DTW定义了时间序列间的最佳匹配,它同时支持不同时间长度的相似度量,具有更好的鲁棒性。DTW也从一定程度上反映了航迹间的形状相似度。因此本文计算航迹间的DTW相似度,并将其作为一类特征。同上设有两条航迹长度分别为m,nm,n>1。特征维度为经度、纬度、时间的航迹XY

    x11,x12,x13,···,x1my11,y12,y13,···,y1nx21,x22,x23,···,x2my21,y22,y23,···,y2nx31,x32,x33,···,x3my31,y32,y33,···,y3n

    我们构建一个m×n的矩阵D=(dij)m×n。其中,dijd(xi,yj),是两条航迹两个点xiyj的距离。本文将距离定义为两个经纬度点的实际距离,因此矩阵中的每个元素(i,j)表示的是两个点的匹配程度。在矩阵D中构建一条路径W表示航迹XY的匹配程度:

    W={w1,w2,w3,···,wk},max(m,n)km+n1 (3)

    路径W必须满足以下3个条件:

    (1) 边界条件:w1=(1,1),wk=(m,n)

    (2) 连续条件:给定wp=(ip,jp),wp+1=(ip+1,jp+1),有ip+1ip1, jp+1jp1

    (3) 单调条件:给定wp=(ip,jp),wp+1=(ip+1,jp+1),有ip+1ip0, jp+1jp0

    其中有多条路径满足上述的条件,取满足以下条件的路径:

    DTW(X,Y)=minW{kl=1wl} (4)

    为了计算式(4),需要构建一个累加距离矩阵,并且利用动态规划的思想求解这个矩阵,递归如下:

    f(i,j)=d(xi,yj)+min(f(i1,j),f(i,j1),f(i1,j1)) (5)

    初始条件为

    {f(0,0)=0,f(i,0)=, i=1,2,···mf(0,j)=, j=1,2,···n (6)

    最终得到的f(m,n)为航迹的DTW特征。图2图3显示了两条航迹在DTW算法下的逐点对应关系。

    图  2  DTW航迹点对应关系
    Figure  2.  Correspondence of DTW track points
    图  3  DTW算法匹配关系
    Figure  3.  DTW algorithm matching relationship
    3.1.3   其他特征

    航迹间除了距离和DTW相似度两种主要特征外,本文还提取了速度差分布直方图特征以及航迹的来源特征,考虑到船舶的行驶速度较慢且传感器的采样频率较高,本文假设任意两个航迹点之间,船做的是匀速直线运动,从而可以得到每一个航迹点的速度,对于航迹XY,记航迹XY的速度序列为

    Vx={vx1,vx2,vx3,···,vxm},Vy={vy1,vy2,vy3,···,vym} (7)

    其中:

    vi=d(i1,i)t(i1,i) (8)

    d(i1,i)表示的是第i个点与i1个点的距离,t(i1,i)表示的是第i个点与i1个点的时间差。

    设:

    difV(X,Y)={difv1,difv2,difv3,···,difvm} (9)

    为航迹XY的速度差序列,其中difvi表示XYi个航迹点对应的速度的差。然后对difV(X,Y)做与distance(X,Y)相同的后续处理得到速度差分布直方图特征。

    不同来源误差往往不同,传统的一些方法在进行仿真实验的时候假定误差服从高斯分布,而实际的误差情况不仅有随机误差还有系统误差的影响,同时不同来源的精度、特性也不相同,因此本文将不同数据来源量化为特征,结合机器学习的方法隐性地学习误差信息从而在一定程度上更好地克服误差影响。假设有n个不同的来源:

    S={s1,s2,s3,···,sn} (10)

    本文将其进行一定的编码作为来源特征

    Cd={cd1,cd2,cd3,···,cdn} (11)

    对任意两条航迹数据提取距离、速度差分布直方图特征、DTW相似度特征以及来源特征,并将这些特征进行组合。然后利用机器学习的模型来进行训练和判断。算法的流程图如图4所示。

    图  4  关联流程图
    Figure  4.  Association flow chart
    4.1.1   数据集构建

    传统的一些方法实验都是仿真数据上进行的,虽然为了接近真实的情况,在仿真数据上加入了噪声等干扰,但大多数都是假定噪声服从高斯分布,忽视其他误差的影响,因此与实际的船舶航迹数据仍然有着较大的差距。本文构建了一个真实的船舶航迹数据集,船舶航迹数据集是1年多的船舶航迹数据,涵盖了较多的航迹运动情况,数据集中每一个实验样本由两条航迹组成,两条航迹可能源于同一目标,也可能源于不同的目标。数据集的航迹样本标注都是经过一定的历史分析以及多个有经验的判读员检验标注的。因此数据集的标注具有较高的可靠性。本文一共标注了8063个航迹实验样本对,令两条航迹源于同一目标的为正样本,两条航迹源于不同目标的为负样本。其中正样本数量为2522个、负样本为5541个。

    4.1.2   数据预处理

    (1) 时间对齐和抽样

    一般情况下,各个传感器采样频率上报间隔都不尽相同,因此会出现如图5所示的情形。不同传感器的采样频率往往不同,得到的航迹点的时间并不一一对应,如果直接计算距离会有较大的误差,且不满足计算距离分布直方图特征的条件,因此需要对航迹进行插值,再在同一时刻进行采样。

    图  5  两条航迹对应点时间不同示意图
    Figure  5.  Different timings of the corresponding points on the two tracks

    通过对航迹数据集中的数据(在本文构建的数据集里)进行分析后,发现传感器的采样频率大多数在3~300 s,船舶行驶速率大多在11节左右(20 km/h)。因此本文假设船舶的两个采样点之间是做匀速直线运动,从而进行线性插值处理,此假设主要是为了减小直接计算非时间对齐航迹点的欧式距离时的较大误差同时满足距离分布直方图特征的计算条件。线性插值采样如图6所示。同时为了更符合匀速直线运动的假设,本文将不对采样间隔大于600 s的点做插值处理。

    图  6  航迹线性插值采样示意图
    Figure  6.  Linear interpolation sampling schematic diagram

    (2) 样本扩充

    原始的可用样本较少,正样本数量仅为2522个、负样本为5541个,通过对样本的观察发现:部分样本的时间跨度较长且样本点数极多(例如有些样本航迹点数有3万多个,时间长度超过20 h)。这样的样本可以对其进行拆分,拆分方式如图7所示,本文将其拆分为时间长度为2~3 h的多个样本以此来扩充样本。

    图  7  航迹样本拆分示意图
    Figure  7.  Schematic diagram of separation of track samples

    为了验证算法的性能,本文首先比较了传统方法提取的加权距离特征(加权航迹方法计算出的统计量特征)[23,24]、平均距离特征、最大距离特征在设定阈值与利用机器学习方法时性能的差异,其次比较了距离分布直方特征与传统的平均距离特征、加权航迹特征、最大距离特征,之后对本文提出特征进行组合,比较组合特征和单一特征的性能,最后对比了不同的机器学习方法的性能。实验数据集是经上述预处理后并随机打乱后的船舶样本集,其中80%的样本用来训练,20%的样本用来测试。

    4.2.1   评价指标

    本文采用常用的机器学习评价指标[25],精度、查全率、查准率、F1度量、ROC (Receiver Operating Characteristic)曲线以及AUC (Area Under Curve)值,令两条航迹源于同一目标的为正样本,两条航迹源于不同目标的为负样本。则评价指标的具体定义如下:

    = (12)
    = (13)
    = (14)
    F1=2××+ (15)

    ROC曲线根据学习器的预测结果对样本进行排序,并且按照这个顺序把样本预测为正例,性能越好的模型,ROC曲线越接近于左上角。由于从图形上无法直观比较ROC曲线,因此可以通过计算ROC曲线下方的面积,即AUC值,来比较模型的好坏,一般来说AUC值越大则表示模型性能越好。

    4.2.2   阈值方法与机器学习方法对比实验

    传统的方法阈值设置大多根据统计以及设计者经验来决定[26],其中一些方法还依赖于系统的参数[4,27],本文根据真实数据集的情况,利用了3种数据的统计值作为阈值来与机器学习方法进行比较,它们分别是精度最高阈值、平均数阈值以及中位数阈值。精度最高阈值:也是一般常用的阈值设置方法[4],在特征域值范围内的值,通过一定的步长设置寻找最佳精度阈值;平均数阈值和中位数阈值主要是利用特征的统计特性[28],本文对3种特征分别求得它们平均数与中位数作为阈值,具体的阈值与实验结果如表1表3所示。机器学习模型则选较为常用的树模型,从表1表3中可以看出,机器学习的方法则能够更好学习特征表示的含义,具有更强的泛化能力,因此关键指标均远高于设定阈值的方法,且不需要人工设定阈值(精度最高阈值需要大量的实验才能确定),进而说明了引入机器学习方法的有效性。

    表  1  平均距离特征阈值方法与机器学习方法指标对比
    Table  1.  Comparison of average distance characteristics threshold method and machine learning method index
    阈值精度查准率查全率F1
    机器学习0.94780.96170.95900.9603
    精度最高阈值4524.70.89060.91700.91700.9170
    平均数阈值76231.50.59981.00000.39270.5640
    中位数阈值8878.80.81420.99480.72180.8366
    下载: 导出CSV 
    | 显示表格
    表  2  加权距离特征阈值方法与机器学习方法指标对比
    Table  2.  Comparison of weighted distance characteristics threshold method and machine learning method index
    阈值精度查准率查全率F1
    机器学习0.92640.95380.93350.9435
    精度最高阈值0.00030.86260.98220.80620.8856
    平均数阈值0.26810.45281.00000.16790.2902
    中位数阈值0.00080.80800.98580.71900.8335
    下载: 导出CSV 
    | 显示表格
    表  3  最大距离特征阈值方法与机器学习方法指标对比
    Table  3.  Comparison of maximum distance characteristics threshold method and machine learning method index
    阈值精度查准率查全率F1
    机器学习0.86360.89040.90430.8973
    精度最高阈值14024.40.80360.93770.75200.8346
    平均数阈值108357.60.60940.96960.40260.5866
    中位数阈值20853.20.77130.94710.69170.7995
    下载: 导出CSV 
    | 显示表格
    4.2.3   距离分布直方图特征与传统特征对比实验

    表4是利用树模型学习不同特征的各项指标,图8描述了不同特征的ROC曲线图。从表4以及图8可以看出本文提出的距离分布直方图特征的性能优于传统的距离特征。主要原因是距离分布直方图特征从航迹的整体出发,更好地考虑了整体的距离分布。图9是传统距离特征无法识别而距离分布直方图特征能识别的关联目标,图中红色和蓝色分别代表了不同来源观测的同一目标的航迹。从图中可以看出,传统的距离特征由于是单一数值描述,对有噪声干扰的目标不能准确关联,而距离分布直方图特征考虑的是整体的距离分布,因此具有较好的抗噪性能。图10是距离分布直方图特征关联失败的典型情况,图10(a)图10(b)是两条航迹源于同一目标,图10(c)为两条航迹源于不同目标。从图10(a)图10(b)中可以直观地看出,其受噪声干扰较为严重,而图10(c)两条航迹十分接近,通过对它们特征的可视化分析发现,图10(a)图10(b)距离整体分布呈现较大差异,此时距离分布直方图特征难以有效地关联图10(a)图10(b)所示的情况。图10(c)的距离整体分布十分接近,但速度整体分布差异较大,单一的距离分布直方图特征在这种情况难以正确完成关联判断。

    图  8  不同方法ROC曲线
    Figure  8.  Different methods of ROC curves
    表  4  不同特征指标对比
    Table  4.  Comparison of different characteristics
    特征精度查准率查全率F1AUC
    距离分布直方图0.98010.98260.98730.98490.9768
    平均距离0.94780.96170.95900.93900.9426
    加权距离0.92640.95380.93350.94350.9373
    最大距离0.86360.89040.90430.89730.8446
    下载: 导出CSV 
    | 显示表格
    图  9  传统距离特征无法识别而距离分布直方图能够识别的目标
    Figure  9.  The targets that can’t be identified by traditional distance feature but can be identified by distance distribution histogram
    图  10  距离分布直方图特征关联失败的目标
    Figure  10.  The targets of distance distribution histogram feature error association
    4.2.4   组合特征对比实验

    表5是利用树模型学习不同组合特征的各项指标,图11描述了不同组合特征的ROC曲线图,表5以及图11中,DDH (Distance Distribution Histogram)表示的是距离分布直方图特征,SDDH (Speed Difference Distribution Histogram)表示的速度差分布直方图特征。图12给出了单一特征错误关联而组合特征正确识别情况(图10(c)在加入速度差分布直方图特征后能够准确地判断其为不同的目标),图12(a)是DDH特征错误关联的目标而加入DTW相似度特征准确识别的情形,主要原因是两条航迹的距离较近,在距离维度上很难区分,而其DTW相似度差异较大(DTW相似度在一定程度上描述了航迹形状上的相似度)。图12(b)是DDH+DTW特征错误关联的目标而加入速度差分布直方图特征准确识别的情形,主要原因是两条航迹的距离较近,DTW相似度也较高,而其有12.5%的航迹点速度相差5节航速,速度差分布差异较大。图12(c)是DDH+DTW+SDDH特征错误关联而加入来源特征准确识别的情形,主要原因是两条航迹的距离较近,DTW相似度也高,速度差分布也相近,但两条航迹来自同一观测源,因此判定不是同一目标。图13是距离分布直方图特征关联失败的典型情况,图13(a)图13(b)是两条航迹源于同一目标,图13(c)为两条航迹源于不同目标。从图13(a)图13(b)中可以直观地看出,其受噪声干扰较为严重,而图13(c)两条航迹十分接近,通过对它们特征的可视化分析发现,图13(a)图13(b)的距离、速度整体分布以及DTW相似度呈现较大差异,此时组合特征难以有效地关联图13(a)图13(b)所示的情况。图13(c)的目标十分接近,且几乎没有移动,因此各项特征十分接近,组合特征在这种情况难以正确完成关联判断。综上分析以及从表5图11中可以看出,每增加一组特征,模型的各项指标都有所提升,不仅说明了所提特征的有效性,而且由于不同特征之间具有一定的互补性,多种特征的组合能够更加全面地表征航迹间的关系,进一步提升航迹关联准确性。在噪声干扰较大时航迹间的特征也受到了较大的干扰,此时很难有效地进行关联判定,同时由于目前航迹点信息有限,可以挖掘的特征有限,因此在一些较为特殊的情况下当前组合特征不能准确地完成关联判断。

    表  5  组合特征指标对比
    Table  5.  Comparison of composite features
    组合特征精度查准率查全率F1AUC
    DDH0.98010.98580.98400.98490.9783
    DDH+DTW0.98290.98590.98820.98700.9804
    DDH+DTW+SDDH0.98420.98730.98870.98800.9820
    DDH+DTW+SDDH+数据来源特征0.98690.99010.99010.99010.9855
    下载: 导出CSV 
    | 显示表格
    图  11  特征组合ROC曲线
    Figure  11.  Feature combination ROC curve
    图  12  单一特征错误关联组合特征正确识别情况
    Figure  12.  Correct identification of single feature miscorrelation combination features
    图  13  组合特征关联失败的目标
    Figure  13.  The targets of combination features error association
    4.2.5   不同机器学习方法对比实验

    表6是利用不同的机器学习方法训练关联模型的各项指标,图14描述了不同机器学习方法的ROC曲线。从表6以及图14可以看出,Bagging各项指标最高,Tree模型各项指标最低。

    表  6  不同机器学习方法指标对比
    Table  6.  Comparison of different machine learning indicators
    学习方法精度查准率查全率F1AUC
    Tree0.98630.98870.99060.98960.9843
    Random forest0.98730.98960.99100.99030.9978
    Adaboost0.98850.99150.99100.99130.9965
    Bagging0.99160.99250.99480.99360.9979
    下载: 导出CSV 
    | 显示表格
    图  14  不同机器学习方法ROC曲线
    Figure  14.  ROC curves for different machine learning methods

    针对传统航迹关联方法存在需要人工设定阈值、参数设置复杂的问题,本文将机器学习的方法引入航迹关联中,针对一些传统方法只考虑航迹单个点的信息及抗噪声性能较差的问题,本文从航迹的整体出发,提出了一种距离分布直方图特征。与此同时对航迹的特征进行挖掘,提取了航迹间的DTW相似度特征、速度差分布直方图特征以及来源特征,结合机器学习的方法提出了一种基于多特征组合的航迹关联方法,该方法在有限的航迹点信息中挖掘了多种有效的特征信息,获得了较高的关联准确率,并且在实际应用中取得较好的效果,随着样本和航迹点信息不断增多,关联模型的准确率以及泛化性能还将进一步提升。理论分析和实验结果均表明该方法的有效性和合理性。根据算法设计中各环节的假设和约束,本文目前提出的航迹关联算法主要适用于传感器采样频率较高,运动目标速度较慢(船舶、汽车、行人等)的情况,对于高速运动的目标则需要进一步地分析其运动情况,建立更加精细的插值模型,这也是本文后续工作中的一个重要的研究方面。

  • 图  1  距离分布直方图特征计算示意图

    Figure  1.  Schematic diagram of feature calculation of distance distribution histogram

    图  2  DTW航迹点对应关系

    Figure  2.  Correspondence of DTW track points

    图  3  DTW算法匹配关系

    Figure  3.  DTW algorithm matching relationship

    图  4  关联流程图

    Figure  4.  Association flow chart

    图  5  两条航迹对应点时间不同示意图

    Figure  5.  Different timings of the corresponding points on the two tracks

    图  6  航迹线性插值采样示意图

    Figure  6.  Linear interpolation sampling schematic diagram

    图  7  航迹样本拆分示意图

    Figure  7.  Schematic diagram of separation of track samples

    图  8  不同方法ROC曲线

    Figure  8.  Different methods of ROC curves

    图  9  传统距离特征无法识别而距离分布直方图能够识别的目标

    Figure  9.  The targets that can’t be identified by traditional distance feature but can be identified by distance distribution histogram

    图  10  距离分布直方图特征关联失败的目标

    Figure  10.  The targets of distance distribution histogram feature error association

    图  11  特征组合ROC曲线

    Figure  11.  Feature combination ROC curve

    图  12  单一特征错误关联组合特征正确识别情况

    Figure  12.  Correct identification of single feature miscorrelation combination features

    图  13  组合特征关联失败的目标

    Figure  13.  The targets of combination features error association

    图  14  不同机器学习方法ROC曲线

    Figure  14.  ROC curves for different machine learning methods

    表  1  平均距离特征阈值方法与机器学习方法指标对比

    Table  1.   Comparison of average distance characteristics threshold method and machine learning method index

    阈值精度查准率查全率F1
    机器学习0.94780.96170.95900.9603
    精度最高阈值4524.70.89060.91700.91700.9170
    平均数阈值76231.50.59981.00000.39270.5640
    中位数阈值8878.80.81420.99480.72180.8366
    下载: 导出CSV

    表  2  加权距离特征阈值方法与机器学习方法指标对比

    Table  2.   Comparison of weighted distance characteristics threshold method and machine learning method index

    阈值精度查准率查全率F1
    机器学习0.92640.95380.93350.9435
    精度最高阈值0.00030.86260.98220.80620.8856
    平均数阈值0.26810.45281.00000.16790.2902
    中位数阈值0.00080.80800.98580.71900.8335
    下载: 导出CSV

    表  3  最大距离特征阈值方法与机器学习方法指标对比

    Table  3.   Comparison of maximum distance characteristics threshold method and machine learning method index

    阈值精度查准率查全率F1
    机器学习0.86360.89040.90430.8973
    精度最高阈值14024.40.80360.93770.75200.8346
    平均数阈值108357.60.60940.96960.40260.5866
    中位数阈值20853.20.77130.94710.69170.7995
    下载: 导出CSV

    表  4  不同特征指标对比

    Table  4.   Comparison of different characteristics

    特征精度查准率查全率F1AUC
    距离分布直方图0.98010.98260.98730.98490.9768
    平均距离0.94780.96170.95900.93900.9426
    加权距离0.92640.95380.93350.94350.9373
    最大距离0.86360.89040.90430.89730.8446
    下载: 导出CSV

    表  5  组合特征指标对比

    Table  5.   Comparison of composite features

    组合特征精度查准率查全率F1AUC
    DDH0.98010.98580.98400.98490.9783
    DDH+DTW0.98290.98590.98820.98700.9804
    DDH+DTW+SDDH0.98420.98730.98870.98800.9820
    DDH+DTW+SDDH+数据来源特征0.98690.99010.99010.99010.9855
    下载: 导出CSV

    表  6  不同机器学习方法指标对比

    Table  6.   Comparison of different machine learning indicators

    学习方法精度查准率查全率F1AUC
    Tree0.98630.98870.99060.98960.9843
    Random forest0.98730.98960.99100.99030.9978
    Adaboost0.98850.99150.99100.99130.9965
    Bagging0.99160.99250.99480.99360.9979
    下载: 导出CSV
  • [1] 杨威, 陈杰, 李春升. 面向目标特性精细提取的SAR数据融合成像处理方法[J]. 雷达学报, 2015, 4(1): 29–37. doi: 10.12000/JR15017

    YANG Wei, CHEN Jie, and LI Chun-sheng. SAR data fusion imaging method oriented to target feature extraction[J]. Journal of Radars, 2015, 4(1): 29–37. doi: 10.12000/JR15017
    [2] 李伟, 王兴亮, 邹鲲, 等. 基于数据融合和陷波滤波的MIMO雷达抗欺骗干扰算法[J]. 雷达学报, 2012, 1(3): 246–252. doi: 10.3724/SP.J.1300.2012.20060

    LI Wei, WANG Xing-liang, ZOU Kun, et al. Anti deceptive jamming for MIMO radar based on data fusion and notch filtering[J]. Journal of Radars, 2012, 1(3): 246–252. doi: 10.3724/SP.J.1300.2012.20060
    [3] LIGGINS M E, HALL D L, and LLINAS J. Handbook of Multisensor Data Fusion: Theory and Practice[M]. 2nd ed., Boca Raton, FL: CRC Press, 2009.
    [4] 何友, 王国宏, 陆大䋮, 等. 多传感器信息融合及应用[M]. 第2版, 北京: 电子工业出版社, 2007.

    HE You, WANG Guo-hong, LU Da-jin, et al. Multisensor Information Fusion with Applications[M]. 2nd ed., Beijing: Publishing House of Electronics Industry, 2007.
    [5] CHANG C and YOUENS L C. Measurement correlation for multiple sensor tracking in a dense target environment[J]. IEEE Transactions on Automatic Control, 1982, 27(6): 1250–1252. doi: 10.1109/TAC.1982.1103107
    [6] Bar-Shalom Y. On the track-to-track correlation problem[J]. IEEE Transactions on Automatic Control, 1981, 26(2): 571–572. doi: 10.1109/TAC.1981.1102635
    [7] AZIZ A M, TUMMALA M, and CRISTI R. Fuzzy Logic Data Correlation Approach in Multisensor-Multitarget Tracking Systems[M]. Elsevier North-Holland, Inc, 1999. https://www.sciencedirect.com/science/article/pii/S0165168499000080.
    [8] SMITH III J F. Fuzzy logic multisensor association algorithm[C]. Proceedings of SPIE Signal Processing, Sensor Fusion, and Target Recognition VI, Orlando, FL, USA, 1997: 76–87. doi: 10.1117/12.280788.
    [9] YANG Y T, LIANG Y, YANG Y B, et al. Asynchronous track-to-track association algorithm based on dynamic time warping distance[C]. Proceedings of the 34th Control Conference, Hangzhou, China, 2015: 4772–4777.
    [10] 董凯, 王海鹏, 刘瑜. 基于拓扑统计距离的航迹抗差关联算法[J]. 电子与信息学报, 2015, 37(1): 50–55. doi: 10.11999/JEIT140244

    DONG Kai, WANG Hai-peng, and LIU Yu. Anti-bias track association algorithm based on topology statistical distance[J]. Journal of Electronics &Information Technology, 2015, 37(1): 50–55. doi: 10.11999/JEIT140244
    [11] STONE L D, TRAN T M, and WILLIAMS M L. Improvement in track-to-track association from using an adaptive threshold[C]. Proceedings of the 12th International Conference on Information Fusion, Seattle, WA, USA, 2009: 1627–1633.
    [12] AGRAWAL R, FALOUTSOS C, and SWAMI A N. Efficient similarity search in sequence databases[C]. Proceedings of the 4th International Conference on Foundations of Data Organization and Algorithms, Berlin, Heidelberg, Germany, 1993: 69–84.
    [13] BARCZEWSKA K and DROZD A. Comparison of methods for hand gesture recognition based on dynamic time warping algorithm[C]. Proceedings of 2013 Federated Conference on Computer Science and Information Systems, Poland, 2013: 207–210.
    [14] BANKÓ Z and ABONYI J. Correlation based dynamic time warping of multivariate time series[J]. Expert Systems with Applications, 2012, 39(17): 12814–12823. doi: 10.1016/j.eswa.2012.05.012
    [15] CASACUBERTA F, VIDAL E, and RULOT H. On the metric properties of dynamic time warping[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1987, 35(11): 1631–1633. doi: 10.1109/TASSP.1987.1165065
    [16] HUANG B and KINSNER W. ECG frame classification using dynamic time warping[C]. Proceedings of 2002 Canadian Conference on Electrical and Computer Engineering, Winnipeg, Manitoba, Canada, 2002: 1105–1110.
    [17] JABLONSKI B. Quaternion dynamic time warping[J]. IEEE Transactions on Signal Processing, 2012, 60(3): 1174–1183. doi: 10.1109/TSP.2011.2177832
    [18] FU C X, ZHANG P L, JIANG J, et al. A Bayesian approach for sleep and wake classification based on dynamic time warping method[J]. Multimedia Tools and Applications, 2017, 76(17): 17765–17784. doi: 10.1007/s11042-015-3053-z
    [19] BAUMANN M, OZDOGAN M, RICHARDSON A D, et al. Phenology from landsat when data is scarce: Using MODIS and dynamic time-warping to combine multi-year landsat imagery to derive annual phenology curves[J]. International Journal of Applied Earth Observation and Geoinformation, 2017, 54: 72–83. doi: 10.1016/j.jag.2016.09.005
    [20] VARATHARAJAN R, MANOGARAN G, PRIYAN M K, et al. Wearable sensor devices for early detection of Alzheimer disease using dynamic time warping algorithm[J]. Cluster Computing, 2017(6): 1–10. doi: 10.1007/s10586-017-0977-2
    [21] ZHOU N C, WANG J, and WANG Q G. A novel estimation method of metering errors of electric energy based on membership cloud and dynamic time warping[J]. IEEE Transactions on Smart Grid, 2017, 8(3): 1318–1329. doi: 10.1109/TSG.2016.2619375
    [22] WAN Y, CHEN X L, and SHI Y. Adaptive cost dynamic time warping distance in time series analysis for classification[J]. Journal of Computational and Applied Mathematics, 2017, 319: 514–520. doi: 10.1016/j.cam.2017.01.004
    [23] SINGER R A and KANYUCK A J. Computer Control of Multiple Site Track Correlation[M]. Tarrytown, NY, USA: Pergamon Press, Inc., 1971.
    [24] DITZLER W R. A demonstration of multisensor tracking[C]. Proceedings of the 1987 Tri-Service Data Fusion Symposium, JHU/APL, Laurel, Md., 1987: 303–311.
    [25] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.

    ZHOU Zhi-hua. Machine Learning[M]. Beijing: Tsinghua University Press, 2016.
    [26] 周晓安. VTS系统中多传感器目标航迹关联算法研究[D]. [硕士论文], 南京信息工程大学, 2014.

    ZHOU Xiao-an. The research of track association for multi-sensor target in VTS system[D]. [Master dissertation], Nanjing University of Information Science & Technology, 2014.
    [27] 周晓安, 高贵明. 自适应阈值航迹关联算法与实现[J]. 现代防御技术, 2014, 42(4): 193–198. doi: 10.3969/j.issn.1009-086x.2014.04.031

    ZHOU Xiao-an and GAO Gui-ming. Adaptive threshold algorithm and implementation for track-to-track association[J]. Modern Defense Technology, 2014, 42(4): 193–198. doi: 10.3969/j.issn.1009-086x.2014.04.031
    [28] HAN Jia-wei and KAMBER M. 数据挖掘: 概念与技术[M]. 范明, 孟小峰, 译. 北京: 机械工业出版社, 2007.

    HAN Jia-wei and KAMBER M. Data Mining: Concepts and Techniques[M]. FAN Ming, MENG Xiao-feng, trans. Beijing: China Machine Press, 2007.
  • 期刊类型引用(8)

    1. 张敬艳. 基于组合序列波动性的异步航迹关联算法. 舰船电子工程. 2024(07): 39-43 . 百度学术
    2. 曾雅俊,王俊,魏少明,孙进平,雷鹏. 分布式多传感器多目标跟踪方法综述. 雷达学报. 2023(01): 197-213 . 本站查看
    3. 邱建杰,蔡益朝,李浩,龙威宇,韩瑜. 基于不确定噪声分布的多目标航迹关联模型. 空天防御. 2023(03): 104-112 . 百度学术
    4. 唐裕峰,宋瑶,武浩正,靳标. 雷达与AIS对海上低速目标航迹关联的特征选择. 计算机仿真. 2023(12): 193-199 . 百度学术
    5. 李寅龙,张天舒. 多传感器航迹关联算法综述. 舰船电子工程. 2021(08): 44-50 . 百度学术
    6. 衣晓,杜金鹏. 基于分段序列离散度的异步航迹关联算法. 航空学报. 2020(07): 265-274 . 百度学术
    7. 温镇铭,刘松涛,姜宁. 基于最优航迹隶属度的雷达与红外航迹关联方法. 电光与控制. 2020(10): 22-26+36 . 百度学术
    8. 蔡昌恺,朱浩,余仁伟,邹可. 基于航迹全局和局部混合特征的航迹关联算法. 仪器仪表学报. 2020(10): 32-42 . 百度学术

    其他类型引用(5)

  • 加载中
图(14) / 表(6)
计量
  • 文章访问数: 3487
  • HTML全文浏览量: 949
  • PDF下载量: 276
  • 被引次数: 13
出版历程
  • 收稿日期:  2018-03-29
  • 修回日期:  2018-05-29
  • 网络出版日期:  2019-02-28

目录

/

返回文章
返回