一种基于信息熵的雷达动态自适应选择跟踪方法

引用本文

葛建军, 李春霞. 一种基于信息熵的雷达动态自适应选择跟踪方法[J]. 雷达学报, 2017, 6(6): 587-593. DOI: 10.12000/JR17081.

Ge Jianjun, Li Chunxia. A dynamic and adaptive selection radar tracking method based on information entropy[J]. Journal of Radars, 2017, 6(6): 587-593. DOI: 10.12000/JR17081.

基金项目

装发预研重点基金项目(6140-4130-1021-6DZ9-1001)

通信作者

李春霞 yunhai_cetc@163.com

作者简介

葛建军(1967–)，男，研究员，研究方向为雷达系统;
李春霞(1987–)，女，北京理工大学博士，高级工程师，研究方向为网络化雷达、信息融合、信息论

文章历史

收稿日期：2017-09-08
改回日期：2017-11-16
网络出版：2017-12-20

Contents Abstract Full text Figures/Tables PDF

一种基于信息熵的雷达动态自适应选择跟踪方法

葛建军, 李春霞

(中国电子科技集团公司信息科学研究院北京 100081)

收稿日期：2017-09-08；改回日期：2017-11-16；网络出版：2017-12-20

基金项目：装发预研重点基金项目(6140-4130-1021-6DZ9-1001)

作者简介：葛建军(1967–)，男，研究员，研究方向为雷达系统;
李春霞(1987–)，女，北京理工大学博士，高级工程师，研究方向为网络化雷达、信息融合、信息论

通信作者：李春霞 yunhai_cetc@163.com

摘要：在现代战争中，战场环境复杂多变，为适应战场探测资源动态组织，基于信息熵，该文提出了定量度量多雷达联合观测获得目标信息量多少的方法，并给出了该信息量的下界。进而，基于最小化每个时刻多雷达观测获得的目标信息熵下界，提出了一种自适应选取信息含量高的雷达进行目标跟踪的方法。仿真结果表明，相比不采用信息熵的跟踪方法，提出的方法具有更高的跟踪精度。

关键词：多雷达信息论目标跟踪

A Dynamic and Adaptive Selection Radar Tracking Method Based on Information Entropy

Ge Jianjun, Li Chunxia

(Information Science Academy, China Electronics Technology Group Corporation, Beijing 100081, China)

Foundation Item: Key Projects of Equipment Forecast Fund of the General Armament Department (6140-4130-1021-6DZ9-1001)

Abstract: Nowadays, the battlefield environment has become much more complex and variable. This paper presents a quantitative method and lower bound for the amount of target information acquired from multiple radar observations to adaptively and dynamically organize the detection of battlefield resources based on the principle of information entropy. Furthermore, for minimizing the given information entropy’s lower bound for target measurement at every moment, a method to dynamically and adaptively select radars with a high amount of information for target tracking is proposed. The simulation results indicate that the proposed method has higher tracking accuracy than that of tracking without adaptive radar selection based on entropy.

Key words: Multi-static radar Information entropy Target tracking

1 引言

分布式多雷达系统节点多、分布广，为了适应复杂战场动态作战需求，需要根据作战任务动态组织各个站点的工作，提高整个系统抗干扰、抗截获、抗摧毁等能力。实际中，受各雷达节点工作参数及相对目标的位置等因素的影响，不同节点观测目标获得的信息量不同，为此，如何根据战场态势，动态优化选择雷达站点“匹配”目标跟踪，是一个重要问题。

目标跟踪理论是基于状态空间模型的递推结构，利用所有已知信息来求得目标状态变量的后验概率密度。即使用目标运动状态方程预测目标状态的先验概率，再利用最新时刻的雷达观测值来修正，得到状态的后验概率密度。传统多雷达跟踪通常使用所有雷达进行目标跟踪^[1,2]，研究的重点在于融合结构和融合算法^[1,2]，在传感器优化选取方面研究较少，目前，主要有基于目标预测的误差协方差矩阵^[3,4]和信息增益^[5]这两类优化准则的方法。第1类方法主要思想是依据目标跟踪的实际误差协方差矩阵与预设的期望协方差矩阵之间的差别进行雷达节点选择，使实际协方差矩阵在某种意义上逼近期望协方差矩阵；第2类方法主要思想是通过一个测量行为执行前后信息熵的减少求得信息增量，然后根据使信息增量最大的准则对传感器资源进行科学合理的分配。然而，第1类方法，实际中目标跟踪误差协方差矩阵的变化是相对缓慢的，灵敏度并不高，因此选择标准的精度不高；第2类方法仅是基于单部雷达的跟踪效果进行雷达的选取，并不能适用于雷达组合的选择。

本文提出了使用信息熵定量度量由多雷达联合观测获得的目标的信息量，并给出了该信息量的下界。以此为基础，本文提出基于信息熵的雷达动态自适应选择跟踪方法，该方法通过最小化观测信息熵下界，实时选择信息量高的多个雷达节点进行目标跟踪，从而避免使用信息量低或无信息量的雷达量测。最后，仿真结果表明提出方法的跟踪效果优于任意选择雷达跟踪的平均效果。

本文结构如下。第2节建立了多雷达跟踪目标的状态空间模型。第3节给出了多雷达观测信息熵的定量度量方法及其下界，进而理论推导了雷达动态自适应选择跟踪方法。第4节仿真对比了不同跟踪方法的效果。第5节为结束语。

2 问题描述

在目标跟踪中，通常使用动态空间模型对目标的运动状态进行描述，包括状态方程和量测方程。其中，状态方程描述了目标运动状态随时间演变的过程，量测方程描述了雷达观测与目标状态的关系。其中，目标运动的状态方程为：

${{{X}}}\left( k \right) = {{{f}}}\left( {{{{X}}}\left( {k - 1} \right)} \right) + {{{V}}}\left( k \right)$

(1)

其中，X(k)为k时刻目标的状态，f为状态转移函数，V(k)为零均值、协方差矩阵为Q(k)的白色高斯过程噪声序列。

雷达通常在2维或3维极坐标系中获得观测值，而目标运动则是在直角坐标系中描述^[3,4]。假设目标运动在2维平面，雷达在极坐标系下获得探测目标的观测值。针对任意的多雷达探测系统构型，并且不失一般性，考虑各雷达自发自收的情况，k时刻第n部雷达的观测向量记为Z_n(k)=[r_n(k) a_n(k)]^T。其中，r_n(k)为第n部雷达与目标之间的径向距离，a_n(k)为第n部雷达与目标之间的方位角。由N部雷达组成的多雷达系统形成的观测集合Z(k)={Z₁(k) Z₂(k) ··· Z_N(k)}，对应的观测方程为：

${{{{Z}}}_n}\left( k \right) = {{{{h}}}_n}\left( {{{{X}}}\left( k \right)} \right) + {{{{W}}}_n}\left( k \right){\rm{,}}\;\;\;n = 1,2, ·\!·\!· ,N$

(2)

其中，h_n(X(k))为观测函数，具体计算方程为：

${{{{h}}}_n}\left( {{{{X}}}\left( k \right)} \right) \!=\!\!\! \left[\!\!\!\! {\begin{array}{*{20}{c}}{\sqrt {{{\bigl( {x\left( k \right) \!-\! {x_{r,n}}} \bigl)}^2} \!+\! {{\bigl( {y\left( k \right) \!-\! {y_{r,n}}} \bigl)}^2}} }\\{\arctan \bigl [ {\left( {y\left( k \right) \!-\! {y_{r,n}}} \right) \!/ \!\left( {x\left( k \right) \!-\! {x_{r,n}}} \right)} \bigl]}\end{array}} \!\!\!\! \right]$

(3)

其中，(x(k) y(k))为k时刻目标在直角坐标系中的位置，( ${x_{r,n}}$ , ${y_{r,n}}$ )为第n部接收雷达的直角坐标位置。并且， ${x_{r,n}}$ 为位置的横坐标， ${y_{r,n}}$ 为位置的纵坐标。W_n(k)为与过程噪声不相关的测量噪声， $ {{{{W}}}_n}(k) =$ $ {[w_n^r(k) \ w_n^a\left( k \right)]^{\rm T}}$ ，测距噪声 $w_n^r(k)$ 和方位角测角噪声 $w_n^a\left( k \right)$ 是均值为零、标准差分别为 $\sigma _n^r$ 和 $\sigma _n^a$ 的统计独立的高斯白噪声，其中 $\sigma _n^r$ 表征了第n部雷达径向距离测量值误差的波动大小， $\sigma _n^a$ 表征了第n部雷达方位角测量值误差的波动大小。

相应的观测协方差矩阵 ${{{{R}}}_n}(k)$ 为：

${{{{R}}}_n}\left( k \right) \!=\! E\left( {{{{{W}}}_n}\left( k \right){{{{W}}}_n}{{\left( k \right)}^{\rm{T}}}} \right) \!=\! \left[\!\!\! {\begin{array}{*{20}{c}}{{{\left( {\sigma _n^r} \right)}^2}}&0\\0&{{{\left( {\sigma _n^a} \right)}^2}}\end{array}} \!\!\!\right]$

(4)

基于上述目标状态方程和观测方法，通常使用所有雷达进行目标跟踪，然而实际中不同雷达观测目标获得的信息量不同，有高有低，甚至有些雷达没有观测到任何目标信息，为此，需要从这些雷达中选择出信息含量高的雷达进行目标跟踪，提高目标跟踪效果。

3 基于信息熵的多雷达节点自适应选择跟踪 3.1 多雷达联合观测信息熵及其下界

由N部雷达组成的多雷达系统的观测量可以表示为 ${{{r}}} = {[{r_n}]_{1 \times N}}$ , ${{{a}}} = {[{a_n}]_{1 \times N}}$ ，每个观测量为：

${r_n} = {R_n} + w_n^r$

(5)

${a_n} = {A_n} + {\rm{ }}w_n^a$

(6)

其中， ${R_n}$ , A_n分别为目标相对于第n部雷达的真实距离和角度，并且雷达n的目标距离观测噪声 $w_n^r \sim N(0,{(\sigma _n^r)^2})$ ，测角噪声 $w_n^a \sim N(0,{(\sigma _n^a)^2})$ 。

在N部雷达构成的多雷达系统极坐标观测的条件下，目标直角坐标位置估计协方差矩阵记为：

${{{{R}}}_{N,xy}} = E\left[ \begin{array}{l}\left( {x - \hat x} \right)\left( {x - \hat x} \right) & \left( {x - \hat x} \right)\left( {y - \hat y} \right)\\\;\! \left( {x - \hat x} \right)\left( {y - \hat y} \right) & \!\; \left( {y - \hat y} \right)\left( {y - \hat y} \right)\end{array} \right]$

(7)

多雷达观测是为了更多更准确地获得目标位置信息，将由多雷达的极坐标系观测获得目标直角坐标位置的信息量，定义为多雷达联合观测信息熵，根据信息论原理，推导得N部雷达观测信息熵为：

${H_N}\left( {x,y|{{{r}}},{{{a}}}} \right) = \frac{1}{2}\ln \left( {{{\left( {2{{π}} e} \right)}^N}\left| {{{{{R}}}_{N,xy}}} \right|} \right)$

(8)

根据参数估计理论^[6]，由式(8)可知，多雷达联合观测信息熵下界为：

${H\!_N}\left( {x,y|{{{r}}},{{{a}}}} \right) \ge \frac{1}{2}\ln \left( {{{\left( {2{{π}} e} \right)}^N}\left| {{{{I}}}_N^{ - 1}\left( {x,y|{{{r}}},{{{a}}}} \right)} \right|} \right)$

(9)

其中， ${{{{I}}}\!_N}(x,y|{{{r}}},{{{a}}})$ 为Fisher信息矩阵。根据参数估计理论^[6]，式（9）中Fisher信息矩阵可以写为：

(10)

其中，f_N(r, a)为由N部自发自收雷达组成的多雷达系统观测的联合概率密度函数。假设各个观测值独立不相关，那么根据式(5)，式(6)中各个雷达观测服从的概率分布可知，联合概率密度函数f_N(r, a)为：

$\begin{align}{f\!_N}\left( {{{{r}}},{{{a}}}} \right) =& \prod\limits_{n = 1}^N \frac{1}{{\sqrt {2{{π}} } \sigma _n^r}}\exp \left( { - \frac{{{{\left| {{r_n} - {R_n}} \right|}^2}}}{{2{{\left( {\sigma _n^r} \right)}^2}}}} \right)\\& \cdot \frac{1}{{\sqrt {2{{π}} } \sigma _n^a}}\exp \left( { - \frac{{{{\left| {{a_n} - {A_n}} \right|}^2}}}{{2{{\left( {\sigma _n^a} \right)}^2}}}} \right)\end{align}$

(11)

由式(9)、式(10)及式(11)可知，在目标距离雷达站较远时，影响多雷达极坐标量测的信息熵下界的因素包括各雷达站与目标距离、方位角，以及各雷达站的测距精度和测角精度。

3.2 基于信息熵的多雷达联合跟踪方法描述

根据贝叶斯理论可知目标跟踪主要过程为，首先使用目标运动状态方程进行预测，获得目标状态的先验信息，然后再结合最新时刻的观测值来更新预测值，获得目标状态的后验概率密度，这样后验概率密度就包含了先验信息和观测在内的所有可利用信息，获得目标状态估计结果。因而，目标跟踪过程可理解为：后验=先验+观测，这表示调节观测会影响目标状态估计结果。

本文提出的基于信息熵的雷达节点自适应选择跟踪方法通过使用信息含量高的雷达节点而不是全部雷达节点进行目标跟踪，从而避免使用信息含量少甚至没有目标信息的雷达，有效提高目标跟踪效果。本文提出的方法在确定要选择的雷达站数目的情况下，通过最小化多雷达观测信息熵下界对每个时刻的雷达编号进行选择，然后使用所选取的信息量高的雷达对目标进行联合跟踪，从而获得较高的目标跟踪精度。

不失一般性，假设多雷达系统中共N部雷达，并且自发自收，在目标k时刻多雷达联合跟踪获得的目标状态估计值为 ${\hat{{{X}}}}(k|k)$ , ${{{P}}}(k|k)$ ，那么由k时刻递推到k+1时刻目标状态估计的过程描述如下。

•多雷达的选择

在k+1时刻的多个观测量中找出那些具有大的信息量的观测，利用这些观测量来更有效地提高目标跟踪精度。本文以信息熵下界最小，每个时刻自适应从多雷达观测信息熵中选出数值最小的两部(或多部)雷达编号，然后用于目标跟踪。

假设所选雷达站个数为N₀(N₀<N)，那么计算N部雷达中任意N₀部雷达的观测信息熵下界，形成 $C_N^{{N_0}}$ 个观测信息熵结果，进而选取具有最小观测信息熵下界的N₀部雷达的编号集 $ \widehat {{{{Θ}}}}$ ，用这一编号集中的雷达进行多雷达站联合跟踪。为此，由式(9)可得雷达编号集为：

${{{\widehat {Θ}}}} = \mathop {\arg \min }\limits_{{{Θ}}} \frac{1}{2}\ln \left( {{{\left( {2{{π}} e} \right)}^{{N_0}}}\left| {{{{I}}}_{{N_0}}^{ - 1}\left( {x,y|{{{r}}},{{{a}}}} \right)} \right|} \right)$

(12)

由于函数ln(·)单调递增，式(12)中 ${\widehat {Θ}}$ 的求解等价为：

${{{\widehat {Θ}}}} = \mathop {\arg \max }\limits_{{{Θ}}} \left| {{{{{I}}}_{{N_0}}}\left( {x,y|{{{r}}},{{{a}}}} \right)} \right|$

(13)

其中， ${{I}}\!_{N_0} $ (x, y|r, a)为N₀部雷达观测获得目标位置状态估计的Fisher信息矩阵，其求解过程与3.1节中的求N部雷达的类似，仅需要将式(11)中的N部雷达观测的联合概率密度函数替换为N₀部雷达观测的联合概率密度函数，其表示为：

$\begin{align}{f\!_{{N_0}}}\left( {{{{{r}}}\!_{{N_0}}},{{{{a}}}_{{N_0}}}} \right) = &\prod\limits_{n \in {{{Θ}}}} {\frac{1}{{\sqrt {2{{π}} } \sigma _n^r}}{{\rm e}^{\left( { - {\rm{ }}\scriptsize\displaystyle\frac{{{{\left| {{r_n} - {R_n}} \right|}^2}}}{{2{{\left( {\sigma _n^r} \right)}^2}}}} \right)}}}\\& \cdot \frac{1}{{\sqrt {2{{π}} } \sigma _n^a}}{{\rm e}^{\left( { - {\rm{ }}\scriptsize\displaystyle\frac{{{{\left| {{a_n} - {A_n}} \right|}^2}}}{{2{{\left( {\sigma _n^a} \right)}^2}}}} \right)}}\end{align}$

(14)

式中， $ {{r}_{N_0}}, {{a}_{N_0}}$ 分别为N₀部雷达距离和方位角观测集， ${{{Θ}}}$ 为N部雷达中任意N₀部雷达组成的集合，共有 $C_N^{{N_0}}$ 个。其余参数含义同3.1节。

目前的多雷达融合跟踪算法都与融合结构密切相关，融合结构大致分成3大类：集中式、分布式和混合式^[7]。集中式融合也称为中心式融合(centralized fusion)或量测融合(measurement fusion)。分布式融合(distributed fusion)是各传感器都具有自己的局部处理器，能够形成局部航迹，所以在融合中心也主要是对各局部航迹进行融合，所以这种融合方法通常也称为航迹融合(track fusion)。混合式融合(hybrid fusion)是集中式结构和分布式结构的一种综合，融合中心得到的可能是原始量测数据，也可能是局部节点处理过的数据。

在选择完所用的雷达编号后，可采用这3种融合结构的任何一种进行目标融合跟踪，本文以航迹级融合为例，主要步骤包括使用上一时刻目标融合的位置状态估计对时刻k+1目标状态进行预测，然后使用所选择雷达分别对k+1时刻目标状态进行更新，最后对所选取的雷达的k+1时刻目标状态估计进行融合，获得目标k+1时刻状态估计结果。更为具体的算法描述如下。

•目标状态预测

从最优贝叶斯跟踪滤波的角度来看，在获得k时刻的观测值之前，根据目标运动状态转移模型，目标状态预测实现先验概率 $p({{{X}}}(k)|{{{{Z}}}_{1:k}})$ 到 $p({{{X}}}(k + 1)|{{{{Z}}}_{1:k}})$ 的求解^[8]。假设在k–1时刻， $p({{{X}}}(k)|{{{{Z}}}_{1:k}})$ 是已知的，那么，对于1阶马尔可夫过程(即该时刻的状态仅与上一时刻的状态值有关，而与之前所有时刻的状态值无关)，由Chapman- Kolmogorov方程可知

$\begin{align}p\left( {{{{X}}}\left( {k + 1} \right)|{{{{Z}}}_{1:k}}} \right) =& \int {p\left( {{{{X}}}\left( {k + 1} \right)|{{{X}}}\left( k \right)} \right)}\\& \cdot p\left( {{{{X}}}\left( k \right)|{{{{Z}}}_{1:k}}} \right) {\rm d}{{{X}}}\left( k \right)\end{align}$

(15)

其中， $p({{{X}}}(k + 1)|{{{X}}}(k))$ 为目标状态转移概率， ${{{{Z}}}_{1:k}}$ 表示从1到k时刻观测量的集合，即 $ {{{{Z}}}_{1:k}} = $ $\{ {{{Z}}}(1),{{{Z}}}(2), ·\!·\!· ,{{{Z}}}(k)\} $ 。根据目标运动方程，可得式(15)中的目标状态转移概率为：

$\begin{align}&p\left( {{{{X}}}\left( {k + 1} \right)|{{{X}}}\left( k \right)} \right) \\&\quad\quad = N\left( {{{{X}}}\left( {k + 1} \right);f\left( {{{{X}}}\left( k \right)} \right),{{{Q}}}\left( k \right)} \right)\end{align}$

(16)

式中， $N({{{X}}}(k + 1);{{{f}}}({{{X}}}(k)),{{{Q}}}(k))$ 表示均值为 ${{{f}}}({{{X}}}(k))$ ，协方差矩阵为 ${{{Q}}}(k)$ 的高斯分布。

上述最优贝叶斯跟踪下的目标状态预测过程的具体实现可以采用转换量测卡尔曼滤波(CMKF)、基于泰勒展开式的扩展卡尔曼滤波^[9–11](Extended Kalman Filter, EKF)，不敏卡尔曼滤波^[12](Unscented Kalman Filter, UKF)，粒子滤波^[13](PF)等滤波方法中的目标状态预测过程。以EKF预测方法为例，目标状态的一步预测为：

${\hat{{{X}}}}(k + 1|k) = {\rm{ }}f\left( {{\hat{{{X}}}}\left( {k|k} \right)} \right)$

(17)

相应地，状态误差协方差矩阵的一步预测为：

${{{P}}}\left( {k + 1|k} \right) = {{{{f}}}\!_{{{X}}}}\left( k \right){{{P}}}\left( {k|k} \right){{{f}}}_{{{X}}}^{\rm T}\left( k \right) + {{{Q}}}\left( k \right)$

(18)

其中，f_X(k)为目标状态转移函数关于 ${\hat{{{X}}}}\!_n $ (k|k)的雅可比矩阵，Q(k)为白色高斯过程噪声序列的协方差矩阵。

•目标状态更新

从最优贝叶斯跟踪滤波的角度来看，目标状态更新是在获得k+1时刻的观测值后，实现先验概率 $p({{{X}}}(k + 1)|{{{{Z}}}_{1:k}})$ 至后验概率 $p({{{X}}}(k + 1)|{{{{Z}}}_{1:k + 1}})$ 的推导。根据贝叶斯定理可知

$p\bigr( {{{{X}}}\left( {k + 1} \right)|{{{{Z}}}_{1:k + 1}}} \bigr)= \frac{{p\bigr( {{{{Z}}}\left( {k \!+\! 1} \right)|{{{X}}}\left( {k \!+\! 1} \right)} \bigr)p\bigr( {{{{X}}}\left( {k \!+\! 1} \right)|{{{{Z}}}_{1:k}}} \bigr)}}{{\displaystyle\int {p\bigr( {{{{Z}}}\left( {k \!+\! 1} \right)|{{{X}}}\left( {k \!+\! 1} \right)} \bigr)p\bigr(\! {{{{X}}}\left( {k \!+\! 1} \!\right)|{{{{Z}}}_{1:k}}} \bigr){\rm d}{{{X}}}\left(\! {k \!+\! 1} \!\right)} }}$

(19)

其中，根据跟踪滤波的雷达观测模型，式(19)中的似然函数 $p\left( {{{{Z}}}\left( {k + 1} \right)|{{{X}}}\left( {k + 1} \right)} \right)$ 表达式为：

$\begin{align}&p\bigr( {{{{Z}}}\left( {k + 1} \right)|{{{X}}}\left( {k + 1} \right)} \bigr) \\& \quad\quad = N\bigr( {{{{Z}}}\left( {k + 1} \right);{{{h}}}\left( {{{{X}}}\left( {k + 1} \right)} \right),{{{R}}}\left( {k + 1} \right)} \bigr)\end{align}$

(20)

式中，N(Z(k+1); h(X(k+1)), R(k+1))表示均值为h(X(k+1))，协方差矩阵为R(k+1)的高斯分布。

同样地，上述最优贝叶斯跟踪下的目标状态更新过程的具体实现可以采用CMKF, EKF, UKF, PF等滤波方法中的目标状态更新过程。本文以EKF目标状态更新过程为例进行描述。

将k+1时刻多雷达观测中的每部雷达观测分别代入滤波中的状态更新，得到对应每部雷达观测的多个目标状态更新值，并将使用第n部雷达观测得到的k+1时刻目标状态更新值记作 ${\hat{{{X}}}}$ _n(k+1|k+1), P_n(k+1|k+1)。具体过程如下：

由目标跟踪的状态空间方程中的观测方程，可得观测值和观测新息协方差矩阵预测为：

$\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\! {{\hat{{{Z}}}}_n}\left( {k + 1|k} \right) = {{{{h}}}_n}\left( {{\hat{{{X}}}}\left( {k + 1|k} \right)} \right)$

(21)

$\begin{align}{{{{S}}}_n}\left( {k + 1\left| k \right.} \right) = & {{{{h}}}_{n,{{X}}}}\left( {k + 1} \right){{{{P}}}\!_n}\left( {k + 1\left| k \right.} \right)\\& \cdot{{{h}}}_{n,{{{X}}}}^{\rm T}\left( {k + 1} \right) + {{{{R}}}_n}\left( {k + 1} \right)\end{align}$

(22)

其中， ${{{{h}}}_{n,{X}}}(k + 1)$ 为量测函数关于 ${\hat{{{X}}}}$ _n(k+1|k)的雅可比矩阵，即

${{{{h}}}_{n,{{{X}}}}}\left( {k + 1} \right) = {\left[ {{\nabla\! _{{{X}}}}{{{h}}}_n^{\rm T}\left( {{{{X}}}\left( {k + 1} \right)} \right)} \right]^{\rm T}}\!\!\!\!_{{{{X}}} = {\hat{{{X}}}}(k + 1|k)} =\!\! {\left[\!\! {\begin{array}{*{20}{c}}{\frac{{x\left( {k + 1|k} \right)}}{{r\left( {k + 1|k} \right)}}}\!& \! 0\! & \! {\frac{{y\left( {k + 1|k} \right)}}{{r\left( {k + 1|k} \right)}}}&0\\{\frac{{y\left( {k + 1|k} \right)}}{{{{\left( {r\left( {k + 1|k} \right)} \right)}^2}}}}\! & \! 0 \! & \! {\frac{{x\left( {k + 1|k} \right)}}{{{{\left( {r\left( {k + 1|k} \right)} \right)}^2}}}}&0\end{array}} \!\!\right]_{\!\!{{{X}}} \!=\! {\hat{{{X}}}}(k \!+\! 1|k)}}$

(23)

EKF滤波方法的增益为：

${{{{P}}}\!_{n,{XZ}}} = {{{{P}}}\!_n}\left( {k + 1|k} \right){{{{h}}}_{n,{X}}}\left( {k + 1} \right)$

(24)

${{{{K}}}\!_n}\left( {k + 1} \right) = {{{{P}}}\!_{n,{{{XZ}}}}}{{{{S}}}\!_n}{\left( {k + 1|k} \right)^{ - 1}}$

(25)

空间目标状态和协方差矩阵的更新值分别为：

$\begin{align}{{\hat{{{X}}}}_n}\left( {k \!+\! 1|k \!+\! 1} \right) \!=\! &{\hat{{{X}}}}\left( {k + 1|k} \right) + {{{{K}}}_n}\left( {k + 1} \right)\\ & \cdot\left[ {{{{{Z}}}_n}\left( {k + 1} \right) - {{{\hat{{{Z}}}}}_n}\left( {k + 1|k} \right)} \right]\end{align}$

(26)

$\begin{align}&\!\!\!\!\! {{{{P}}}\!_n}\left( {k + 1|k + 1} \right)\\& = \bigr[ {{{{I}}} - {{{{K}}}_n}\left( {k + 1} \right){{{{h}}}_{n,{{{X}}}}}\left( {k + 1} \right)} \bigr]\\& \cdot {{{P}}}\left( {k + 1|k} \right){\bigr[ {{{{I}}} + {{{{K}}}_n}\left( {k + 1} \right){{{{h}}}_{n,{{{X}}}}}\left( {k + 1} \right)} \bigr]^{\rm{T}}}\\& - {{{{K}}}_n}\left( {k + 1} \right){{{{R}}}_n}\left( {k + 1} \right){{{K}}}_n^{\rm{T}}\left( {k + 1} \right)\end{align}$

(27)

其中，I为4阶单位矩阵，其余变量的含义如上。经由以上步骤，得到了目标在k+1时刻的使用雷达n观测的状态估计 ${\hat{{{X}}}}\!_n $ (k+1|k+1)及状态协方差矩阵P_n(k+1|k+1)。

•多雷达跟踪航迹融合

将选出的N₀部雷达的目标状态更新结果进行融合，得到最后的目标状态融合结果作为k+1时刻目标状态估计值。设选择的融合雷达编号集合为 ${{{Ω}}}$ ，并且采用广义凸组合融合1(Generalized Convex Combination 1, GCC1)，有时也称为简单凸组合融合(Simple Convex Combination, SCC)^[1,2,14]，得到的融合结果为：

$\begin{align}&\!\!\!\!\!\!\! {\hat{{{X}}}}\left( {k \!+\! 1|k \!+\! 1} \right) \\& \quad = {{{P}}}\left( {k + 1|k + 1} \right)\\ & \quad\quad \cdot \sum\limits_{n \in {{{Ω}}}} {{{{P}}}_n^{ - 1}\left( {k \!+\! 1|k \!+\! 1} \right){{{\hat{{{X}}}}}_n}\left( {k \!+\! 1|k \!+\! 1} \right)} \end{align}$

(28)

${{{P}}}\left( {k + 1|k + 1} \right) = {\left( {\sum\limits_{n \in {{{Ω}}}} {{{{P}}}_n^{ - 1}\left( {k + 1|k + 1} \right)} } \right)^{ - 1}}$

(29)

重复以上步骤直至跟踪结束，便可得到利用雷达观测信息熵下界自适应选择雷达节点，实现目标跟踪的整个过程。

4 仿真分析 4.1 参数设置

在目标跟踪中，航迹精度是对跟踪滤波算法性能进行评估的重要指标。航迹精度体现了不同滤波方法对雷达测量误差的平滑程度。概括来讲，航迹精度包括位置精度和速度精度，航迹的位置精度定义为航迹位置估计的均方根误差。目标状态估计的均方根误差越小，滤波器的滤波值与真实值越接近，航迹精度则越高^[8]。

第m次蒙特卡诺仿真得到滤波估计误差为：

${{{{e}}}_m}\left( k \right) = {{\hat{{{X}}}}_m}\left( {k|k} \right) - {{{X}}}\left( k \right)$

(30)

其中， ${\hat{{{X}}}}$ _m (k+1|k+1)和X(k)分别为k时刻目标状态的跟踪结果和真实值。

目标跟踪位置和速度估计的均方根误差分别为：

$\begin{align}\ \ \, {\rm {RMSE}}_{\rm POS}\left( k \right) = &\left( \frac{1}{{\rm MC}}\sum\limits_{m = 1}^{\rm MC} {{\left[ {{{\hat x}_m}\left( {k|k} \right) - x\left( k \right)} \right]}^2} \right. \\& +\left.{{\left[ {{{\hat y}_m}\left( {k|k} \right) - y\left( k \right)} \right]}^2}\right)^{1/2}\end{align}$

(31)

(32)

其中，向量 $({{\hat x}_m} \ {{\hat y}_m} \ {{\hat z}_m}) $ 和 $( x \ y \ z)$ 分别为目标在k时刻的位置估计值和真实值，向量 $({v{{\hat x}_m}} \ {v{{\hat y}_m}} \ {v{{\hat z}_m}})$ 和 $({vx} \ {vy} \ {vz})$ 分别为目标在k时刻的速度估计值和真实值，下标m表示第m次蒙特卡诺仿真，MC为总的蒙特卡诺仿真次数，本文设置为200，并且各部雷达的测距和测角误差方差分别为 $\sigma _r^2 = 25 \ {{\rm m}^2}$ , $\sigma _\theta ^2 = $ 0.0003 rad²。

假设在多雷达系统中共有4部雷达，它们在直角坐标系中的位置为：雷达1为(0, 0)、雷达2为(20000, 0) m、雷达3为(20000, 0) m和雷达4为(1000, 20000) m。设置的4部雷达站位置与目标航迹如图1所示。其中，目标运动时间为40 s，运动间隔为1 s，并在前26 s时间内目标做匀速直线运动，在26 s时目标进行了转弯，然后进行匀速直线运动，目标运动方向如图中箭头所示。

图 1 4部雷达位置与目标航迹图 Fig.1 Radars locations and target trajectory

4.2 仿真与分析

为了仿真验证提出的方法，需要从场景中的4部雷达选择信息含量高的N₀部雷达进行跟踪，而此个数在实际的多目标多任务复杂跟踪场景，需要进行合理设置。本文从验证提出的方法的角度出发，可以将N₀进行人为设置。不失一般性，设计N₀=2，即从4部雷达选出联合信息量最多的2部雷达进行联合跟踪。根据3.2节中雷达优化选择方法，可知不同时刻跟踪选择的雷达站编号如图2所示。

图 2 不同时刻选择的信息量高的雷达编号 Fig.2 Radars indexes selected by fusion entropy model

将基于联合信息量最大选出的两部雷达进行融合跟踪的方法记为“基于信息熵的联合跟踪”；将不采用信息量最大选择出的任意两部雷达跟踪的效果的平均记为“传统联合跟踪”。对比单部雷达跟踪、不采用和采用信息熵的联合跟踪效果，结果如图3和图4所示。

图 3 目标位置跟踪精度对比 Fig.3 Comparison of target position RMSE

图 4 目标速度跟踪精度对比 Fig.4 Comparison of target velocity RMSE

由图3和图4可知，采用基于两部联合信息量最大选出的雷达进行融合跟踪，得到的位置精度和速度精度最好，其次是不采用基于信息熵的任意两部雷达融合跟踪的平均效果，而单雷达跟踪效果最差。

5 结束语

为了满足现代复杂战场动态作战需求，针对单雷达站信息量少跟踪精度不高，而多雷达系统中不同雷达、不同时刻获得目标信息量的多少不同的问题，提出一种基于信息熵的雷达动态自适应选择跟踪方法。该方法使用信息熵定量刻画了由多雷达极坐标观测获得目标直角坐标位置的信息量，并给出了其下界。进而，通过最小化雷达观测目标的信息熵下界，理论推导了每个时刻实时最优化选取目标信息含量高的雷达站进行跟踪的方法，具有良好的目标跟踪效果。

参考文献

[1]	Bar-Shalom Y and Li X R. Multitarget-Multisensor Tracking: Principles and Techniques[M]. Storrs, CT: YBS Publishing, 1995. (0)
[2]	Koch W. Tracking and Sensor Data Fusion[M]. Berlin, Heidelberg: Springer, 2014. (0)
[3]	Kalandros M. Covariance control for multisensor systems[J]. IEEE Transactions on Aerospace and Electronic Systems, 2002, 38(4): 1138-1157. DOI:10.1109/TAES.2002.1145739 (0)
[4]	Yang C, Kaplan L and Blasch E. Performance measures of covariance and information matrices in resource management for target state estimation[J]. IEEE Transactions on Aerospace and Electronic Systems, 2012, 48(3): 2594-2613. DOI:10.1109/TAES.2012.6237611 (0)
[5]	Jenkins K L and Castañón D A. Information-based adaptive sensor management for sensor networks[C]. Proceedings of 2011 IEEE American Control Conference, San Francisco, CA, 2011: 4934–4940. (0)
[6]	Kay S M. Fundamentals of Statistical Signal Processing, Volume I: Estimation Theory[M]. Englewood Cliffs, N. J.: PTR Prentice hall, 1993. (0)
[7]	Hall D L and McMullen S A H. Mathematical Techniques in Multisensor Data Fusion[M]. Second Edition, Norwood, MA: Artech House, 2004. (0)
[8]	李春霞. 宽带雷达空间目标及目标群跟踪方法研究[D]. [博士论文], 北京理工大学, 2015. Li Chun-xia. Research on space target and targets group tracking methods of wideband radar[D]. [Ph.D. dissertation], Beijing Institute of Technology, 2015. (0)
[9]	Zhang Z T and Zhang J S. A novel strong tracking finite-difference extended Kalman filter for nonlinear eye tracking[J]. Science in China Series F: Information Sciences, 2009, 52(4): 688-694. DOI:10.1007/s11432-009-0081-1 (0)
[10]	武勇, 王俊. 混合卡尔曼滤波在外辐射源雷达目标跟踪中的应用[J]. 雷达学报, 2014, 3(6): 652-659. Wu Yong and Wang Jun. Application of mixed Kalman filter to passive radar target tracking[J]. Journal of Radars, 2014, 3(6): 652-659. DOI:10.12000/JR14113 (0)
[11]	Rao B, Xiao S P and Wang X S. Joint tracking and discrimination of exoatmospheric active decoys using nine-dimensional parameter-augmented EKF[J]. Signal Processing, 2011, 91(10): 2247-2258. DOI:10.1016/j.sigpro.2011.04.005 (0)
[12]	Liu C Y, Shui P L and Li S. Unscented extended Kalman filter for target tracking[J]. Journal of Systems Engineering and Electronics, 2011, 22(2): 188-192. DOI:10.3969/j.issn.1004-4132.2011.02.002 (0)
[13]	Han Y B. A rao-blackwellized particle filter for adaptive beamforming with strong interference[J]. IEEE Transactions on Signal Processing, 2012, 60(6): 2952-2961. DOI:10.1109/TSP.2012.2189764 (0)
[14]	李洋漾, 李雯, 易伟, 等. 基于DP-TBD的分布式异步迭代滤波融合算法研究[J]. 雷达学报, 2018, 待出版. DOI: 10.12000/JR17057. Li Yangyang, Li Wen, Yi Wei, et al.. A distributedasynchronous recursive filtering fusion algorithm via DPTBD[J]. Journal of Radars, 2018, accepted. DOI: 10.12000/JR17057. (0)