
张翼鹏 卢东东 仇晓兰 李飞

基金项目: 国家自然科学基金(61991421, 62022082)




    李 飞,硕士,研究员,硕士生导师,主要研究方向为智能信息终端、智能信息处理


    卢东东 ludongdong@tju.edu.cn

Few-shot Ship Classification of SAR Images via Scattering Point Topology and Dual-branch Convolutional Neural Network

Funds: The National Natural Science Foundation of China (61991421, 62022082)
  • 摘要: 随着合成孔径雷达(SAR)图像在舰船检测和识别领域的广泛应用,准确而高效地进行舰船分类已经成为一个亟待解决的问题。在小样本学习场景下,一般的方法面临着泛化能力不足的问题,因此该文引入了额外的信息和特征,旨在增加模型对目标的理解和泛化能力。该文通过散射关键点构建拓扑结构以表征舰船目标的结构和形状特征,并计算拓扑结构的拉普拉斯矩阵,将散射点之间的拓扑关系转化为矩阵形式,最后将SAR图像和拉普拉斯矩阵分别作为双分支网络的输入进行特征提取。在网络结构方面,该文设计了一个由两个独立的卷积分支组成的双分支卷积神经网络,分别负责处理视觉特征和拓扑特征,并用两个交叉融合注意力模块分别对两个分支的特征进行交互融合。该方法有效地将目标散射点拓扑关系与网络的自动学习过程相结合,从而增强模型的泛化能力并提高分类精度。实验结果表明,在OpenSARShip数据集上,所提方法在1-shot和5-shot任务的平均准确率分别为53.80%和73.00%。而在FUSAR-Ship数据集上,所提方法分别取得了54.44%和71.36%的平均准确率。所提方法在1-shot和5-shot的设置下相比基础方法准确率均提升超过15%,证明了散射点拓扑的应用对SAR图像小样本舰船分类的有效性。


  • 图  1  训练和测试的设置

    Figure  1.  Training and testing setup

    图  2  整体网络架构

    Figure  2.  Overall architecture of our method

    图  3  散射特征点

    Figure  3.  Scattering feature points

    图  4  散射点拓扑

    Figure  4.  Scattering point topology

    图  5  交叉融合注意力机制

    Figure  5.  Cross fusion attention mechanism

    图  6  本文方法和Baseline模型在OpenSARShip数据集上的混淆矩阵实验结果对比

    Figure  6.  Comparison of experimental results of the proposed method and Baseline model on the OpenSARShip dataset

    图  7  散射点拓扑参数k对准确率的影响

    Figure  7.  The effect of scattering point topology parameter k on the accuracy

    图  8  具有不同数量散射关键点的散射点拓扑可视化

    Figure  8.  Visualization of the scattering point topology with different number of scattering key points

    图  9  不同方法提取散射关键点的散射点拓扑可视化

    Figure  9.  Visualization of scattering point topology using different methods to extract scattering key points

    图  10  不同方法对应的视觉信息提取分支的卷积层输出特征图可视化

    Figure  10.  Visualization of convolutional layer output feature maps of visual information extraction branch corresponding to different methods

    表  1  实验数据集设置

    Table  1.   The dataset settings in our experiment

    数据集 基础类别 样本数量 新颖类别 样本数量
    Cargo 8240 Dredgin 80
    OpenSARShip Fishing 126 Passeng 38
    Tanker 1670 Pilot 14
    Tug 176 Search 24
    合计 10212 合计 156
    Cargo 1289 HighSpeedCraft 15
    Dredger 51 LawEnforce 27
    FUSAR-Ship Fishing 563 Reserved 28
    Tanker 157 Passenger 31
    Unspecified 111 Tug 44
    合计 2171 合计 145
    表  2  实验数据设置

    Table  2.   Experimental data setting

    数据集 1-shot 5-shot
    支持集 查询集 支持集 查询集
    OpenSARShip 1×4 5 5×4 5
    FUSAR-Ship 1×5 5 5×5 5
    表  3  本文方法和其他方法性能的对比(%)

    Table  3.   Comparison of performance of our method and other methods (%)

    方法 OpenSARShip FUSAR-Ship
    1-shot 5-shot 1-shot 5-shot
    MatchingNet[16] 30.20±1.66 33.30±1.70 31.88±1.96 34.00±1.44
    ProtoNet[14] 32.00±1.97 37.35±2.19 30.64±2.01 35.40±1.68
    RelationNet[15] 29.64±2.04 30.60±1.73 31.12±1.53 31.12±1.53
    MAML[13] 29.60±2.13 33.10±1.87 31.32±1.81 32.40±1.71
    Baseline[18] 35.85±2.00 43.40±2.04 31.68±1.56 37.32±2.00
    Baseline++[18] 35.35±2.09 40.90±1.84 31.96±1.79 35.64±1.83
    NegMargin[34] 36.15±2.15 41.05±1.86 30.68±1.91 35.68±1.89
    MetaBaseline[19] 32.51±2.03 38.60±1.86 30.32±1.88 34.52±1.83
    基于GCN的方法 47.50±2.47 71.05±2.48 55.76±2.28 68.04±1.64
    本文方法 53.80±2.28 73.00±2.21 54.44±2.02 71.36±1.75
    表  4  不同最近邻数量k对模型的影响(%)

    Table  4.   The effect of different nearest neighbor number k on the model (%)

    k OpenSARShip FUSAR-Ship
    1-shot 5-shot 1-shot 5-shot
    1 38.85±2.61 52.85±2.24 47.64±1.73 60.76±1.75
    2 37.25±2.23 48.00±2.24 59.48±1.92 63.04±1.78
    3 41.50±2.22 59.75±2.14 51.32±2.34 73.44±1.61
    4 47.45±2.49 67.45±2.31 49.68±2.18 66.36±1.95
    5 49.80±2.30 74.82±2.22 53.40±2.16 71.84±1.76
    6 51.75±2.41 69.50±2.28 50.76±2.03 66.56±1.84
    7 49.05±2.60 72.30±2.45 49.76±1.91 70.12±1.79
    8 53.80±2.28 73.00±2.21 54.44±2.02 71.36±1.75
    9 50.35±2.63 72.40±2.16 49.28±2.34 71.12±1.64
    10 51.00±2.27 70.05±2.20 50.36±2.13 71.16±1.77
    表  5  拓扑特征支路和视觉特征支路消融(%)

    Table  5.   Topological feature branch and visual feature branch ablation (%)

    分支1 分支2 OpenSARShip FUSAR-Ship
    1-shot 5-shot 1-shot 5-shot
    图像特征 35.85±2.00 43.40±2.04 31.68±1.56 37.32±2.00
    图像特征 图像特征 42.20±2.21 69.60±2.16 43.88±2.31 62.92±1.87
    拓扑特征 拓扑特征 35.50±2.30 44.85±1.40 21.80±1.05 28.52±1.64
    图像特征 拓扑特征 53.80±2.28 73.00±2.21 54.44±2.02 71.36±1.75
    表  6  交叉融合注意力机制对模型的影响(%)

    Table  6.   The effect of cross-fusion attention mechanism on the model (%)

    注意力1 注意力2 OpenSARShip FUSAR-Ship
    1-shot 5-shot 1-shot 5-shot
    × × 34.45±1.95 41.20±2.14 30.24±1.75 35.48±1.75
    × 47.45±2.57 64.65±2.14 38.72±2.19 53.52±2.02
    53.80±2.28 73.00±2.21 54.44±2.02 71.36±1.75
图(10) / 表(6)
