Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

基于弱监督小波KAN网络的弱标注辐射源识别算法

刘康晟 凌青 闫文君 张立民 于柯远 刘恒燕

刘康晟, 凌青, 闫文君, 等. 基于弱监督小波KAN网络的弱标注辐射源识别算法[J]. 雷达学报(中英文), 2025, 14(2): 338–352. doi: 10.12000/JR24248
引用本文: 刘康晟, 凌青, 闫文君, 等. 基于弱监督小波KAN网络的弱标注辐射源识别算法[J]. 雷达学报(中英文), 2025, 14(2): 338–352. doi: 10.12000/JR24248
LIU Kangsheng, LING Qing, YAN Wenjun, et al. Weak labeling-specific emitter identification algorithm based on the weakly supervised Wav-KAN network[J]. Journal of Radars, 2025, 14(2): 338–352. doi: 10.12000/JR24248
Citation: LIU Kangsheng, LING Qing, YAN Wenjun, et al. Weak labeling-specific emitter identification algorithm based on the weakly supervised Wav-KAN network[J]. Journal of Radars, 2025, 14(2): 338–352. doi: 10.12000/JR24248

基于弱监督小波KAN网络的弱标注辐射源识别算法

DOI: 10.12000/JR24248 CSTR: 32380.14.JR24248
基金项目: 国家自然科学基金(62371465),泰山学者工程专项经费基金(ts201511020),山东省青创团队资助(2022KJ084)
详细信息
    作者简介:

    刘康晟,硕士生,主要研究方向为特定辐射源识别、信号智能处理

    凌 青,博士,教授,主要研究方向为信号智能处理

    闫文君,博士,副教授,主要研究方向为空时分组码检测、信号智能处理

    张立民,教授,博士生导师,主要研究方向为卫星信号处理及应用、信号智能处理

    于柯远,博士,讲师,主要研究方向为信号智能处理

    刘恒燕,博士,讲师,主要研究方向为LDPC译码

    通讯作者:

    凌青 linqing19870522@163.com

    闫文君 wj_yan@foxmail.com

  • 责任主编:朱卫纲 Corresponding Editor: ZHU Weigang
  • 中图分类号: TN911.7

Weak Labeling-specific Emitter Identification Algorithm Based on the Weakly Supervised Wav-KAN Network

Funds: The National Natural Science Foundation of China (62371465), The Taishan Scholars Project Special Fund (ts201511020), Youth Innovation Teams in Shandong Province Fund (2022KJ084)
More Information
  • 摘要: 当前辐射源个体识别技术多数基于有监督学习条件下开展,不适应由于采集环境(天气条件、地形和障碍物、干扰源)、器件性能(雷达分辨率、信号处理能力、硬件故障)、标注者水平等因素导致的大范围标签缺失的情形。该文提出了一种基于弱监督小波KAN (WSW-KAN)网络的弱标注辐射源识别算法。该算法首先结合KAN网络独有的边缘函数可学习特性和小波函数的多分辨率分析特性,构建WSW-KAN基线网络;然后将弱标注数据集拆分为小样本有标注数据集和大样本无标注数据集,利用小样本有标注数据集初步训练模型;最后在预训练模型基础上,基于自适应感知伪标签加权选择方法(APLWS),采用对比学习方法提取无标签数据特征并迭代训练,从而有效提高模型的泛化能力。基于真实采集雷达数据集验证,该文所提出的算法对特定辐射源个体识别精度达到95%左右,且算法效率高、参数规模小、适应能力强,能够满足实际场景的需求。

     

  • 辐射源个体识别(Specific Emitter Identification, SEI)是通过对截获的电磁信号进行外部特征测量来获取个体特征,从而实现对无线电辐射源个体识别的技术。SEI在电子情报、电子支援措施、认知无线电、无线网络身份认证等领域具有重要应用[13]。传统辐射源个体识别方法通常分为基于暂态信号和稳态信号两种思路,暂态信号虽然特征明显、易于识别,但对截获信号的质量要求高、对噪声的抵抗性能差。稳态信号具有隐蔽性高、环境适应性强等优点,但存在信号提取困难的不足。随着电磁环境的信号噪声日益复杂、雷达体制的日趋多样化,传统的参数匹配法通过比较接收信号与数据库中已有信号的参数特征来识别辐射源,存在对数据库依赖性强、适应性差、受噪声干扰大、非线性和多径效应处理性能差等不足[4]

    现阶段,深度学习技术在自然语言处理(Natural Language Processing, NLP)、计算机视觉(Computer Vision, CV)等领域应用广泛,在雷达辐射源识别领域也逐渐成为研究的焦点[5]。目前的SEI方案通常是在可靠数据集支持下的有监督学习,但在实际应用场景中由于实际辐射源的非平稳性、噪声干扰、操作人员水平等因素制约,所得到的数据集常常是弱标注的,这导致原有的监督学习算法不能很好地适应现实工程需求。

    弱监督学习充分利用数据本身的结构信息,通过数据增强技术(如旋转、缩放、裁剪)生成合成数据,为SEI任务提供额外的监督信息,从而提升模型的特征提取能力[6]。在弱监督学习领域,Chen等人[7]提出了一种弱监督图像特定原型探索(Weakly Supervised Image-specific Prototype Exploration, WSIPE)方法,该方法通过图像特定原型探索(Image Prototype Exploration, IPE)和一般与特定一致性(General and Specific Consistency, GSC)损失来优化特征表示,并增强了原型探索的自我纠正能力。但图像特定原型的计算和更新增加了模型的计算负担,尤其在处理大规模数据集时,存在训练时间和资源消耗较大的问题。Du等人[8]提出了一种基于像素到原型对比的弱监督语义分割方法,通过跨视图和单视图内的特征一致性正则化,以及特征空间内类间紧凑性的促进,显著提高了分割质量。但所提出方法只在一定程度上解决了弱标注问题,模型仅依赖图像级标签,缺乏像素级标注,可能无法准确定位目标边界,导致分割结果粗糙,同时生成伪标签质量仍有待提高。Jiang等人[9]提出了一个简单的局部到全局知识转移框架,用于高质量的目标注意力挖掘,该框架在PASCAL VOC 2012和MS COCO 2014数据集上取得了显著的性能提升。但模型在跨数据集或跨领域场景下可能泛化能力不足,限制了其实际应用。Lee等人[10]提出了对抗类激活映射(Adversarial Class Activation Mapping, AdvCAM)技术,通过迭代操纵图像,迫使非歧视区域参与分类,生成能够识别目标对象更多区域的属性图。但是该文在应用归因方法时存在局限性,归因图通常依赖于模型的梯度信息,可能无法准确反映模型的决策过程,并且可能易受到输入噪声或模型内部噪声的影响,导致生成的伪标签不够准确。在文献[11]中,Lee等人探讨了深度学习神经网络中的信息瓶颈现象,并提出了一种通过移除最后一层激活函数和引入新的池化方法来减少信息瓶颈的方法,实验证明可显著提高分类器获得的定位图质量。但该方法不可避免边界模糊问题:显著性图通常无法精确捕捉目标边界,导致生成的伪标签在边界区域不够准确,影响分割结果的精细度。Zhou等人[12]提出了区域语义对比和聚合(Regional Semantic Contrast and Aggregation, RCA)算法,通过区域记忆库存储训练数据中出现的大量、多样化的对象模式,作为探索数据集级别语义结构的强支持。但是区域语义对比通常只能提供目标区域的粗略定位,无法提供具体的类别信息,这限制了模型在多类别分割任务中的表现,尤其是在目标类别相似或重叠的情况下。综上所述,这些方法多数依赖传统卷积神经网络,通常不可避免地存在标签噪声敏感、泛化能力受限、过拟合风险增加、模型复杂度高、训练成本过高等问题,因此面对标签严重缺失情况表现一般。

    对比学习是一种通过构建正负样本对、优化表征空间中的相似性度量,以最大化数据内在结构信息并生成判别性表征的自监督学习方法。其数学本质是隐式或显式地最大化正样本对的互信息,同时最小化负样本对的互信息[13]

    文献[14]针对数据有限条件下的SEI问题,提出了一种非辅助数据增强方法来获取扩展数据集,包括旋转、翻转、添加高斯噪声和移位等方法,但文中仅使用基础增强方法(如加噪、时频变换),可能无法充分模拟真实场景中的复杂信道变化(如多径衰落、动态干扰)。Chen等人[15]探讨了在时域偏移场景下利用无监督对比学习实现射频设备指纹(Radio Frequency Fingerprinting, RFF)识别的方法,但考虑到射频信号的时域偏移可能导致增强样本与原始样本的语义不一致(例如,同一设备在不同时域偏移下的信号可能被误判为不同类别),若未设计鲁棒的伪标签生成机制,对比学习可能收敛到次优解。Zhan等人[16]提出了一种基于元对比学习的RFF方法(Meta Contrastive Learning Radio Frequency Fingerprinting, MCRFF),理论上作为一种与模型无关的训练程序,MCRFF可以应用于几乎所有RFF模型。但该文仅在LoRa和Wi-Fi设备上进行了实验,其在实际应用中泛化性如何不得而知。文献[17]提出了一种基于对比度的策略,用于提高较低信噪比(Signal-to-Noise Ratio, SNR)数据集的可转移性,但与文献[14]一样存在信道模拟的局限性。综上所述,对比学习在处理SEI任务中潜力巨大,但现有方法仍存在伪标签噪声敏感、实际应用场景泛化性差等不足。

    考虑到在1.1节和1.2节中相关工作的不足之处,本文尝试在神经网络模型选择和对比学习具体策略选择上入手提出解决弱标注问题的新方案。在神经网络模型的选择上,传统多层感知机(Multilayer Perception, MLP)网络存在训练效率较低、参数量需求较大、泛化能力有限、数据依赖性强、特征提取能力有限和超参数调优复杂等问题,特别是其可解释性较差,作为典型的“黑盒模型”,MLP内部的权重和激活值难以解释,使得模型处理过程不透明。Liu等人[18]受Kolmogorov-Arnold定理的启发,创新提出KAN (Kolmogorov-Arnold)网络作为MLP的替代品。MLP在节点神经元上有固定的激活函数,而KAN在边缘权重上有可学习的激活函数。实验证明,这一改变使得KAN网络在准确性和可解释性方面显著优于MLP。Bozorgasl等人[19]通过将小波函数替代样条函数,提出了Wav-KAN网络,使网络能够有效捕获输入数据的高频和低频分量,从而进一步提高原始KAN网络在可解释性、训练速度、鲁棒性和计算效率等方面的表现。在对比学习具体策略选择上,考虑到传统伪标签方法易受到信道噪声影响,本文着重针对此问题改进了伪标签算法。

    基于此,本文提出一种基于弱监督小波KAN (Weakly Supervised Wav-KAN)(WSW-KAN)网络的弱监督对比学习的SEI方法。该方法使用Wav-KAN网络作为主体,结合KAN网络独有的边缘函数可学习特性和小波函数的多分辨率分析特点,从而减少模型参数规模,提升算法运行效率,并有效提高算法可解释性。在判别网络中,采用对比学习方法,利用自适应感知伪标签加权选择算法扩充数据集,辅助模型提取学习多样化特征参数。实验结果表明,该算法有效提高了弱标注样本的利用效率,所使用的网络有效提高了运行效率。

    假定接收雷达辐射源信号已分选为单个辐射源个体信号,辐射源的物理层特征主要来源于功率放大器的非线性系统响应,输入功放的高频待辐射信号$ s(nT) $可表示为

    s(nT)=m(nT)ej2pnfcfs (1)

    其中,$ m(nT) $表示来自基带的已调制信号,$ {f_{\rm c}} $和$ {f_{\rm s}} $分别表示载频和采样频率,引入泰勒多项式对功放的特异性进行描述,功放输出$ {T^{(i)}}(s(nT)) $可表示为

    T(i)(s(nT))=Mm=1a(i)ms(nT)m,i=1,2,,K (2)

    其中,$ a_m^{(i)} $为泰勒多项式系数,M为多项式的阶数,接收机截获的来自第i个辐射源的采样信号${R^{(i)}}(nT)$可表示为

    R(i)(nT)=T(i)(s(nT))h(i)(nT)+w(i)(nT),n=1,2,,N,i=1,2,,K (3)

    其中,$ {h^{(i)}} (nT) $为发射端到接收机的衰落系数,$ {w^{(i)}} (nT) $为信道加性噪声,接收信号${R^{(i)}}(nT)$可表示为

    R(i)(nT)=Mm=1a(i)ms(nT)mh(i)(nT)+w(i)(nT),n=1,2,,N,i=1,2,,K (4)

    Kolmogorov-Arnold表示定理明确指出,任何多变量连续函数都可以表示为有限数量的单变量连续函数的组合。MLP通常在节点神经元上有固定的激活函数,而KAN网络在边缘权重实现可学习的激活函数功能。MLP和KAN网络的对比图如图1所示。

    图  1  MLP与KAN网络结构对比
    Figure  1.  Comparison of MLP and KAN network structure

    KAN网络[18]一般形式可表示为

    KAN(x)=f(x1,x2,,xn)=2nq=0Φq(np=1fq,p(xp)) (5)

    其中,${\varPhi _q}$是聚合单变量函数输出的高级函数,$ {f_{q,p}} $表示映射输入变量的单变量函数,$ {f_{q,p}}({x_p}) $表示可训练的激活函数。

    Wav-KAN网络是KAN网络的变体,具体以参数化为小波函数的单变量函数取代原有的线性权重,从而能够使网络在保持原有灵活性的同时,以较少参数实现对复杂网络结构的拟合(具体取代位置为图1(b)可学习激活函数处)。

    假设输入特征维度用${z_{\rm{in}}}$表示,输出维度特征维度用${z_{\rm{out}}}$表示,对于一个输入维度${z_{\rm{in}}}$输出维度${z_{\rm{out}}}$的KAN层可以用矩阵${\boldsymbol{\varPhi}} $表示:

    Φ={fq,p},p=1,2,,zin,q=1,2,,zout (6)

    输入向量用x表示,具体可以表示为

    x=[x1,x2,,xi,,xzin] (7)

    输出层用向量y表示,具体可以表示为

    y=[y1,y2,,yj,,yzout] (8)

    因此,${y_j}$可以表示为

    yj=zini=1˜xj,i=zini=1fj,i(xi),j=1,2,,zout (9)

    用矩阵形式表示输出层与输入层的关系为

    yT=[ϕ1,1ϕ1,2ϕ1,zinϕ2,1ϕ2,2ϕ2,zinϕzout,1ϕzout,2ϕzout,zin]xT (10)

    其中,$ \phi $应代入具体的小波函数形式。

    文献[19]提出Wav-KAN网络并将其应用在图像识别领域中,取得了较好的效果。针对SEI弱标注问题,本文尝试在Wav-KAN框架中探索弱标注问题的解决方案,提出了一种弱标注条件下基于WSW-KAN网络的辐射源个体识别框架(WSW-KAN),以改善在样本类别标签有限情况下的辐射源个体分类性能。

    假定本问题辐射源数量为$ {N} $,对于原始弱标注数据集,预先将其分为有标注小样本数据集$ {D_{{\mathrm{U,labeled}}}} = \{ ({x^{(i)}},{y^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,labeled}}}}} $和无标注大样本数据集$ {D_{{\mathrm{U,unlabeled}}}} = \{ ({x^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,unlabeled}}}}} $,总共包含$ {N_{\mathrm{U}}} = {N_{{\mathrm{U,labeled}}}} + {N_{{\mathrm{U,unlabeled}}}} $个样本数据,$ {x^{(i)}} $表示样本,而$ {y^{(i)}} = [y_1^{(i)},y_2^{(i)}, \cdots ,y_N^{(i)}] \subseteq {\{ 0,1\} ^N} $是对应N类分类目录的标签。对于样本序号为i的样本,$ y_{{C}}^{(i)} = 1 $表示输入样本对应类别C,$ y_{{C}}^{(i)} = 0 $表示输入样本不对应类别C

    本文算法结构分为预训练阶段、对比学习阶段和输出阶段。经过实验测试,选定DOG (Derivative of Gaussian)小波作为网络的小波基函数。首先预训练模型加载预训练有标注数据集$ {D_{{\mathrm{U,labeled}}}} = \{ ({x^{(i)}},{y^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,labeled}}}}} $,利用基线网络通过已有数据样本进行初步训练,得到基于WSW-KAN网络的预训练模型。对比学习阶段将针对该预训练模型调整。在对比学习阶段中,为了有效处理实际大样本无标注数据集$ {D_{{\mathrm{U,unlabeled}}}} = \{ ({x^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,unlabeled}}}}} $,采用正负伪标签标注方法,提取目标数据的特征,得到伪标签筛选标注的数据集$ {D_{{\mathrm{U,selected}}}} = \{ ({x^{(i)}},{\hat y^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,selected}}}}} $,该伪标签数据集$ {D_{{\mathrm{U,selected}}}} $仍存在噪声影响,依据本文提出的自适应感知伪标签加权选择算法,通过自适应样本选择迭代(一级过滤)和伪标签样本加权筛选(二级过滤)处理后,调整代价函数,并进一步调整模型参数$ \omega $,不断提高模型的实际泛化能力。特别指出,在仿真实验中,考虑到算法计算复杂度,我们冻结前序连接层参数,不需要重新训练只需对某几层参数进行调整优化并进行对比学习就能实现在实际采样数据集上的应用。最后在输出阶段中,输出混淆矩阵、训练损失数据等信息。综上所述,WSW-KAN模型整体结构如图2所示。

    图  2  基于WSW-KAN网络的弱标注辐射源识别算法整体结构
    Figure  2.  Overall structure of weak label emitter identification algorithm based on WSW-KAN network

    在前端数据预处理过程中,对所采集的原始IQ信号数据进行傅里叶变换,同时为了方便后续网络的训练,统一截取对齐长度为256,将此1×256维的频域信号输入判别网络,经过全连接层和维度变换后输出2×128×1的三维张量便于进行二维卷积操作。输入特征数据首先经过两层卷积层和池化层,在数据处理的开端初步提取特征,降低特征的维度,减少参数数量,从而减少计算量和防止过拟合。通过池化操作,进一步提取输入数据的特征,减少特征图尺寸,通过聚合局部区域内的特征减少噪声影响,从而有效提升模型的鲁棒性。卷积层后加入批归一化(Batch Normalization, BN)层和修正线性单元(Rectified Linear Unit, ReLU)层以防止梯度爆炸,卷积步长设置为1用于保留高维特征映射。MLP等传统模型采用多层堆叠的方式,可以学习数据的更深层次特征表示,有助于增强网络的非线性建模能力,捕捉更复杂的数据关系和模式。同时,多层结构有助于防止训练过程过拟合,提高模型的泛化能力[20],基于此,每个WSW-KAN网络结构均包含3个Wav-KAN层,结合KAN网络独有的边缘函数可学习特性和小波函数的多分辨率分析特点,在前序卷积池化层的基础上捕获更高维的复杂特征信息,进一步提升网络的特征提取能力。在前序卷积池化层间和后续Wav-KAN层间,为了减少过拟合的风险,均应用了Dropout正则化技术。由Wav-KAN层提取的特征经过全连接层进一步整合后得到的特征向量经过展平操作后由Softmax层完成最终模型分类工作。预训练和对比学习阶段算法均在此基线网络框架下进行。WSW-KAN网络结构图如图3所示。

    图  3  WSW-KAN网络结构
    Figure  3.  WSW-KAN network structure

    在对比学习阶段中,首先通过数据增强扩充原始无标注数据集。数据增强旨在提高神经网络的泛化能力和鲁棒性。在计算机视觉中,常见的数据增强方法包括随机裁剪、翻转、旋转、添加噪声、颜色抖动和亮度调整。图像和信号在数据表示与特征方面存在差异,因此针对图像的数据增强方法通常不能直接应用于雷达信号。对于雷达信号,主要的数据增强方法包括旋转、翻转和混合方法[21]。在本文中,采取的是旋转方法。对于旋转变换,假设原始信号可表示为$ {\boldsymbol{X}} = {[I,Q]^{\mathrm{T}}} $,其中IQ分别表示同向分量和正交分量,通过逆时针旋转角度$ \theta $,可以得到增强信号:

    X=(cosθsinθsinθcosθ)[I,Q]T (11)

    伪标签标注方法是一种同时从未标记数据和标记数据中学习的监督范式,将具有最大预测概率的类别标签作为伪标签。根据弱监督学习的假设,决策边界应该尽可能通过数据较为稀疏的区域,即低密度区域,从而避免把密集的样本数据点分布到决策边界的两侧,从而实现模型对未标记数据做出低熵预测,即熵最小化。设$ {p^{(i)}} $为样本$ {x^{(i)}} $上经过训练网络的概率输出,对应第C类辐射源的概率记为$ p_{C}^{(i)} $。利用这些输出概率,可以为$ {x^{(i)}} $生成伪标签:

    ˆy(i)C=1,ifp(i)Cμ (12)
    ˆy(i)C=0,ifp(i)Cλ (13)

    其中,$ \lambda ,\mu \in (0,1) $,分别是正标签阈值和负标签阈值,从而完成数据集的筛选。

    在伪标签的选取上,考虑到在模型训练期间容易使用大量错误的伪标签样本。因此,我们的目标是减少训练中产生的噪声干扰,以期提高整体表现。这可以通过智能决策选择噪声较小的伪标签子集来实现,我们选择置信度显著高于对应阈值的作为正样本,选择置信度显著低于对应阈值的作为负样本。

    令$ {g^{(i)}} = [g_1^{(i)},g_2^{(i)}, \cdots ,g_{\mathrm{c}}^{(i)}] \subseteq {\left\{ {0,1} \right\}^{{C}}} $表示类别i中所选伪标签的二进制向量,其中$ g_{\mathrm{c}}^{(i)} = 1 $表示对应标签被选中进入数据集$ {D_{{\mathrm{U,selected}}}} $,而$ g_{\mathrm{c}}^{(i)} = 0 $表示对应标签被选中未进入数据集$ {D_{{\mathrm{U,selected}}}} $。对于单标签分类,交叉熵损失是在具有正伪标签的样本上训练的,如果未选择正标签,则使用负交叉熵损失执行负学习:

    LNCE(ˆy(i),˜y(i),g(i))=1s(i)Cc=1g(i)c(1ˆy(i))log(1˜y(i)) (14)

    其中,${s^{(i)}} = \displaystyle\sum\nolimits_{C} {{g_{\rm c}}^{(i)}} $为样本i选择的伪标注个数。

    考虑到在进行伪标签标注后,由于预测通常不是来自无误差的神经网络,使用上述伪标签数据集$ {D_{\rm{U,selected}}} $将导致最终模型性能的降低。基于此,受文献[22]的启发,本文设计了自适应感知伪标签加权选择(Adaptive Pseudo-Label Weighted Selection, APLWS)的筛选方案,在文献[22]所提出的自适应样本选择(APS)算法基础上加入伪标签数据集二级加权过滤机制,以期提高原始伪标签数据集$ {D_{\rm{U,selected}}} $的数据纯度。

    由于同一类中存在相似的特征,特征空间$ g({x_t}) $中易于聚类的样本包含更高程度的域共享信息,考虑由于域之间的分布变化导致较多不确定样本位于聚类中心之间,在APLWS中,我们设计第1层样本过滤机制,通过自适应样本选择迭代估计样本的不确定性[22]。对于每一类样本$ {x_t} $,APLWS根据特征空间中的成对余弦距离构造K个相似样本对$ {N_t} $。同时利用相似样本对进行基于距离的预测,并估计样本类$ {x_t} $的后验概率${\hat p_t}$为

    ˆpt=1KKk=1,xkNtd(g(xt),g(xk))eˆyk (15)

    其中,$ {N_t} $表示相似样本对,K是相似样本对的总个数,${x_k} \in {N_t}$是相似样本,$d( \cdot )$为余弦相似度度量函数,$ {e_{{{\hat y}_k}}} $表示临时伪标签$ {\hat y_k} $的one-hot向量。并使用式(16)更新所有目标样本的临时伪标签$ {\hat y_t} $:

    ˆyt=argmax (16)

    其中,下标c表示从第c个类别中获取值。$ {\hat p_t} $的估计通过更新$ {\hat y_t} $迭代执行,在完成估计后为了筛选数据进入二级过滤,定义置信度分数$ {q_t} $:

    {q_t} = \frac{1}{K}\sum\limits_{k = 1}^K {\chi ({{\hat y}_k} = } {\hat y_l})d(g({x_l}),g({x_k})) (17)

    其中,对于样本${x_t}$,只有那些与末尾标号相同的最近邻(记为$\chi ({\hat y_k} = {\hat y_l})$),才会对${q_t}$有贡献。最后依据模型预测不确定性假设和预先设置的伪标签阈值,并避免在伪标签选择上遗漏类别,依据置信度分数排序选择固定比例的一级过滤伪标签数据集$ {D_{{\mathrm{U,first}}\_{\mathrm{filter}}}} $。具体来说,对于正伪标签,置信度分数越高,说明其质量越好,越可能在排序中排在前面进入二级过滤;而对于负伪标签,置信度分数越低,说明其质量越好,则越可能进入二级过滤。

    接下来,针对一级过滤伪标签数据集$ {D_{{\mathrm{U,first}}\_{\mathrm{filter}}}} $,利用前序计算的置信度分数对伪标签样本加权筛选。本文提出的二级加权方案旨在为可能错误的伪标签分配较小的权重,从而减少训练中嘈杂伪标签的贡献。对应损失定义为

    {l^i} = {w^i} \cdot (\alpha {l_{{\mathrm{ce}}}}({p^i},{\hat y_k}) + \beta {l_{{\mathrm{ce}}}}({\hat y_k},{p^i})) (18)

    其中,$ \alpha $和$ \beta $为平衡系数,$ {p^i} $是模型对原始标签$ {x_k} $的预测,$ {\hat y_k} $是当前研究的伪标签,${l_{{\mathrm{ce}}}}$表示交叉熵损失函数,其标准形式为(${a_{c}}$为目标分布,${b_{c}}$为预测分布)

    {l_{\rm{ce}}}(a,b) = - \sum\limits_{c} {{a_{c}}\log{b_{c}}} (19)

    式(18)和式(19)中$ {l_{\rm{ce}}}({p^i},{\hat y_k}) $和$ {l_{\rm{ce}}}({\hat y_k},{p^i}) $参数顺序调换,表示对两个方向交叉熵的加权组合。$ {l_{\rm{ce}}}({p^i},{\hat y_k}) $为前向交叉熵,用伪标签$ {\hat y_k} $作为目标,监督模型预测$ {p^i} $;$ {l_{\rm{ce}}}({\hat y_k},{p^i}) $为后向交叉熵,用模型预测$ {p^i} $作为目标,约束伪标签$ {\hat y_k} $。其中后向交叉熵可视为对伪标签的置信度校准,增强鲁棒性。这样通过双向约束,可有效防止模型过拟合到噪声伪标签。

    式(18)动态权重$ {w^i} $由式(17)所定义的置信度分数决定:

    \left\{\begin{aligned} & {w}_{i,k}={q}_{t,\max}\cdot \frac{{q}_{t,k}}{{\displaystyle \sum _{k=1}^{N}{q}_{t,k}}},正伪标签情形\\ & {w}_{i,k}=1-{q}_{t,\min}\cdot \frac{{q}_{t,k}}{{\displaystyle \sum _{k=1}^{N}{q}_{t,k}}},负伪标签情形 \end{aligned} \right. (20)

    其中,N为一级自适应选择样本过滤后的伪标签数据集$ {D_{{\mathrm{U,first}}\_{\mathrm{filter}}}} $长度。

    综上,本节算法的伪代码如算法1所示。

    1  对比学习阶段自适应感知伪标签加权选择算法
    1.  Adaptive sensing pseudo label weighted selection algorithm in contrastive learning phase
     1. 针对对比学习阶段数据流$ {D_{{\mathrm{U,unlabeled}}}} = \{ ({x^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,unlabeled}}}}} $
     利用自适应感知伪标签加权选择算法调整代价函数。
     2. for $j = 1,2, \cdots ,50$ do 迭代条件
     3.  对于每一类样本$ {x_t} $,计算特征空间中的成对余弦距离;
     4.  构造相似样本对$ {N_t} $;
     5.  计算样本类$ {x_t} $的后验概率${\hat p_t}$;
     6.  更新样本临时伪标签$ {\hat y_t} $;
     7.  计算置信度分数$ {q_t} $,并对置信度分数排序,依据所设定的
       阈值比例过滤伪标签;
     8.  根据置信度分数$ {q_t} $计算动态权重$ {w^i} $;
     9.  计算损失${l^i}$,并调整网络的代价函数;
     10. end
    下载: 导出CSV 
    | 显示表格

    本文采集的雷达个体信号来自X波段对海导航雷达,调制样式为LFM方式。分别部署在渤海湾的烟台养马岛、岱王山、芝罘岛、第一海水浴场、第二海水浴场和烟台港等场地,参数如表1所示[23]

    表  1  雷达型号参数
    Table  1.  Radar type parameters
    技术指标 参数值
    工作频段 X
    工作频段范围(GHz) 9.3~9.5
    量程(nm) 0.0625~96.0000
    扫描带宽(MHz) 25
    距离分辨率(m) 6
    脉冲重复频率 1.6 K, 3.0 K, 5.0 K和10.0 K
    发射峰值功率(W) 50
    天线转速(r/min) 2, 12, 24, 48
    天线长度(m) 1.8
    天线工作模式 凝视、圆周扫描
    天线极化方式 HH
    天线水平波束宽度(°) 1.2
    天线垂直波束宽度(°) 22
    下载: 导出CSV 
    | 显示表格

    以位于渤海湾的烟台养马岛、滨海东路设计公园、芝罘岛三地部署雷达为例,如图4所示,三地及周边不在航道上,船舶较少,受环境干扰较小。接收机采用便携式超宽带实时频谱分析仪,接收机接收瞬时带宽为80 MHz。以同时安排3部同型号雷达开机为例,采集地点距离设计公园部署雷达2.1 km,距离养马岛8.6 km,距离芝罘岛19.0 km。采集位置场景为:某一辐射源信号较强,其余辐射源信号信噪比较弱。

    图  4  采集环境设计
    Figure  4.  Acquisition environment design

    收集的数据是实际测量数据,其中信噪比因频谱条件和接收器灵敏度等因素而变化。在本文中,使用文献[24]描述的方法计算信噪比,来自数据集的信噪比值分布如图5所示。信噪比范围主要在1~17 dB,其中显著集中在8 dB左右。

    图  5  实验数据集信噪比值分布
    Figure  5.  SNR distribution in experimental data sets

    原始数据为2023年5月采集,同样采集了7部同型号雷达辐射源的数据,对该数据集分类后得到的预训练阶段数据集和对比学习阶段数据集具体如表2所示。

    表  2  预训练阶段和对比学习阶段数据情况(表中为接收到的辐射源脉冲数量)
    Table  2.  Data of pre-training stage and comparative learning stage (the number of emitter pulses received is shown in the table)
    类型预训练阶段对比学习阶段
    辐射源A5000100000
    辐射源B450096890
    辐射源C498795678
    辐射源D432198978
    辐射源E390798765
    辐射源F467890780
    辐射源G418796789
    下载: 导出CSV 
    | 显示表格

    需要说明的是:如表2所示,采集了7部同型号雷达的数据,并命名为辐射源A—辐射源G,表2中数量为脉冲数量。预训练阶段数据是带有标签的,而在训练时对比学习阶段数据将人为地去掉标签,在后续测试模型时则将使用对比学习阶段的这些标签。

    本文模型搭建是在pytorch2.3.0框架下实现的,操作系统为Windows10,显卡NVIDIA RTX A6000,CPU为Intel(R) Core(TM) i9-10900K,运行内存96 GB。一般情况下,在实验中神经网络参数设为:iterations=50, batchsize=256,初始学习率设为$ {\mathrm{lr}} = 0.001 $。预训练和对比学习阶段样本数据情况见表2,正标签阈值设置$ \mu = 0.8 $,负标签阈值设置为$ \lambda = 0.05 $,伪标签平衡系数设置为$\alpha = 0.33$和$\beta = 0.66$。

    4.3.1   算法识别精度提升

    (1) 基线网络更换对识别精度提升效果分析

    多项研究证实,众多传统深度学习网络在分类问题上良好表现[2527]。由于弱标注数据集监督数据少,对模型特征提取分类能力要求较高,因此分析比较不同类别模型的性能十分必要。将本文模型中的基线网络替换为其他深度学习基线网络,并进行对比实验,具体网络参数设置情况如表3。数据处理步骤与4.1节中描述的一致。

    表  3  不同网络参数设置情况
    Table  3.  Different network parameter settings
    类别 网络层数 网络层类型 网络层设置 残差块 激活函数 批归一化 叠加层 小波变换 具体参数
    Wav-KAN 5 Wav-KANLinear层、
    叠加层
    小波变换、一维卷积核、
    叠加函数
    ReLU 小波基选择(DOG),一维卷积核,滤波器数量64
    KAN 5 KANLinear层、
    叠加层
    一维卷积核、叠加
    函数
    ReLU 一维卷积核,滤波器数量64
    CNN-13 13 卷积层、池化层、
    全连接层
    卷积核、激活函数 ReLU 3$ \times $3卷积核,滤波器64,步幅1
    Wideresnet 15 卷积层、残差连接 残差块、宽卷积核、
    激活函数
    ReLU 16-4(16基本通道数,
    宽度乘数4)
    下载: 导出CSV 
    | 显示表格

    在预训练阶段中,迭代次数设定为50次,不同网络识别性能提升数据如表4所示,迭代次数与识别精度关系曲线图如图6所示,各网络实验混淆矩阵如图7所示。

    表  4  预训练阶段不同识别网络识别性能
    Table  4.  Identification performance of different identification networks in pre-training stage
    迭代次数 WSW-KAN (%) Wav-KAN (%) KAN (%) CNN-13 (%) Wideresnet (%)
    1 50.44 46.23 46.14 47.16 47.62
    2 58.87 56.11 53.14 54.37 53.88
    3 66.14 60.87 61.77 58.89 57.10
    4 70.88 64.50 63.99 61.41 59.14
    5 73.11 67.34 65.98 63.76 62.02
    6 75.27 69.78 67.77 64.18 64.89
    7 77.84 72.66 69.08 65.66 66.67
    8 79.91 75.90 71.67 66.94 68.11
    9 81.07 77.36 73.20 67.20 69.56
    46 88.74 87.36 84.09 76.05 78.60
    47 88.74 87.36 84.09 76.05 78.60
    48 88.75 87.36 84.09 76.05 78.60
    49 88.75 87.36 84.09 76.05 78.60
    50 88.75 87.36 84.09 76.05 78.60
    下载: 导出CSV 
    | 显示表格
    图  6  预训练阶段不同网络模型的迭代次数与识别精度关系曲线图
    Figure  6.  The relationship between the number of iterations and the identification accuracy of different network models in the pre-training stage
    图  7  预训练阶段各网络混淆矩阵
    Figure  7.  Network confusion matrixs in pre-training stage

    分析预训练阶段的结果可以看出,经过50次迭代,几个不同网络识别性能均已收敛。WSW-KAN网络的识别精度从50.44%提升到88.75%,Wav-KAN网络的识别精度从46.23%提升到87.36%,KAN网络的识别精度从46.14%提升到86.09%,CNN-13网络的识别精度从47.16%提升到75.06%,Wideresnet网络的识别精度从47.62%提升到78.60%。

    重复50次实验,取每次迭代后的识别精度终值平均值,计算得到WSW-KAN网络的识别精度平均值为88.69%,Wav-KAN网络的识别精度平均值为87.37%,KAN网络的识别精度平均值为86.09%,CNN-13网络的识别精度平均值为75.09%,Wideresnet网络的识别精度平均值为78.61%。5种网络对比来看,WSW-KAN网络的性能是最优的。

    在对比学习阶段,针对$ {D_{{\mathrm{U,unlabeled}}}} = \{ ({x^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,unlabeled}}}}} $数据集,经过试验设置迭代次数为50次,不同网络识别性能提升数据如表5所示,迭代次数与识别精度关系曲线图如图8所示,各网络实验混淆矩阵如图9所示。

    表  5  对比学习阶段不同识别网络识别性能
    Table  5.  Identification performance of different identification networks in contrastive learning stage
    迭代次数 WSW-KAN (%) Wav-KAN (%) KAN (%) CNN-13 (%) Wideresnet (%)
    1 79.33 77.18 76.08 69.49 70.80
    2 82.27 80.00 79.80 72.81 75.91
    3 84.11 82.30 81.01 74.40 77.14
    4 86.84 84.23 82.77 77.21 78.81
    5 88.58 85.98 83.66 79.31 80.10
    6 89.98 86.89 84.49 80.90 81.71
    7 90.50 88.10 85.31 81.77 82.61
    8 91.21 89.87 86.02 82.68 83.27
    9 91.61 90.40 86.80 83.51 84.50
    46 94.98 93.16 92.29 85.59 87.20
    47 94.99 93.16 92.29 85.59 87.21
    48 94.99 93.16 92.29 85.59 87.21
    49 94.99 93.16 92.29 85.59 87.21
    50 94.99 93.16 92.29 85.59 87.21
    下载: 导出CSV 
    | 显示表格
    图  8  对比学习阶段不同网络模型的迭代次数与识别精度关系曲线图
    Figure  8.  The relationship between the number of iterations and the identification accuracy of different network models in the contrastive learning stage
    图  9  对比学习阶段各网络混淆矩阵
    Figure  9.  Network confusion matrixs in contrastive learning stage

    重复上述实验50次,取迭代精度终值的平均值,分析对比学习阶段的结果可知5种模型的识别精度分别为95.02%, 93.17%, 92.28%, 85.55%, 87.25%,说明在处理弱标注数据集情形中,本文所采取的WSW-KAN网络性能优于已有网络模型。

    (2) 自适应感知伪标签加权选择算法对识别精度提升效果分析

    为了更充分地验证本文针对弱标注问题采取的自适应感知伪标签加权选择算法的合理性,我们进行了消融实验。实验证明,不采用自适应感知伪标签加权选择算法,单纯采用传统伪标签算法处理时,所得到的模型识别精度为83.69%(其余实验条件设置完全一样),与本文算法在识别精度上存在11.30%的差距。当完全不采用伪标签处理时,所得到模型识别精度为72.45%(其余实验条件设置完全一样),与本文算法在识别精度上存在22.54%的差距。自适应感知伪标签加权选择算法消融实验数据如表6所示,迭代次数和识别精度曲线图如图10所示,混淆矩阵如图11所示。

    表  6  自适应感知伪标签加权选择算法消融实验数据
    Table  6.  Adaptive pseudo-label weighted selection algorithm ablation study data
    迭代次数 本文算法处理
    情形(%)
    传统伪标签处理
    情形(%)
    无伪标签处理
    情形(%)
    1 79.33 61.45 54.47
    2 82.27 68.06 59.03
    3 84.11 73.15 61.95
    4 86.84 75.06 63.89
    5 88.58 77.35 65.71
    6 89.98 79.03 67.11
    7 90.50 80.50 68.97
    8 91.21 81.22 69.70
    9 91.61 81.90 70.40
    46 94.98 83.60 72.45
    47 94.99 83.60 72.45
    48 94.99 83.60 72.45
    49 94.99 83.60 72.45
    50 94.99 83.60 72.45
    下载: 导出CSV 
    | 显示表格
    图  10  自适应感知伪标签加权选择算法消融实验迭代次数与识别精度关系曲线图
    Figure  10.  The relationship between the number of iterations and the identification accuracy of adaptive pseudo-label weighted selection algorithm ablation study
    图  11  各算法处理情形混淆矩阵
    Figure  11.  Confusion matrixs of all algorithm processing cases
    4.3.2   算法时间复杂度和空间复杂度提升

    预训练阶段和对比学习阶段的算法时间复杂度和空间复杂度对比数据如表7表8所示,实验中采用的数据集和实验参数设置见4.1节和4.2节。具体分析指标从不同网络模型的运行耗时、参数数量和对应的识别精度入手。

    表  7  预训练阶段不同识别网络算法复杂度对比
    Table  7.  Comparison of the complexity of different identification network algorithms in pre-training stage
    网络模型耗时(s)参数数量(个)识别精度(%)
    WSW-KAN246.5641993588.75
    Wav-KAN280.8843997887.36
    KAN312.7370211884.09
    CNN-13408.68315099076.05
    Wideresnet379.03146693578.60
    下载: 导出CSV 
    | 显示表格
    表  8  对比学习阶段不同识别网络算法时间复杂度和空间复杂度对比
    Table  8.  Comparison of the complexity of different identification network algorithms in contrastive learning stage
    网络模型耗时(s)参数数量(个)识别精度(%)
    WSW-KAN356.7841993594.99
    Wav-KAN392.4543997893.16
    KAN430.9870211892.29
    CNN-13544.23315099085.59
    Wideresnet487.78146693587.21
    下载: 导出CSV 
    | 显示表格

    无论对于预训练阶段还是对比学习阶段,由表7表8可以分析得到,从耗时方面分析,本文所提出的WSW-KAN网络耗时最小,Wav-KAN, KAN, CNN-13和Wideresnet网络耗时依次增加;从参数数量分析,WSW-KAN网络参数数量最小,Wav-KAN, KAN, Wideresnet和CNN-13参数数量依次增加;从识别精度方面分析,WSW-KAN网络最高,Wav-KAN, KAN, Wideresnet, CNN-13依次递减。

    根据文献[19]关于Wav-KAN网络的分析,相比于原始的KAN网络,由于小波函数可以同时捕获信号的低频和高频特征,采用小波函数作为非线性函数后的Wav-KAN网络训练参数得以大幅精简。相比于普通的CNN-13和Wideresnet网络,WSW-KAN继承了Wav-KAN网络的优势,并进一步优化网络模型,通过将大量待学习的权重参数替换为可学习的非线性小波函数,从而实现WSW-KAN在空间复杂度(参数数量)和时间复杂度(运行时长)的性能优化。

    4.3.3   不同小波基函数对网络的影响分析

    小波基函数作为小波变换的核心,不同的小波基函数适用于不同类型的信号分析。在本文中,选取多种常用小波基函数研究不同小波基函数对WSW-KAN网络模型性能的影响。本文实验所选用的小波基函数形式和参数如表9所示。

    表  9  小波基函数形式和参数对比
    Table  9.  The comparison of wavelet basis function form and parameters
    类型 小波基函数形式 参数
    Mexican hat $ \psi (t) = \dfrac{2}{{\sqrt 3 {p^{1/4}}}}({t^2} - 1){{\mathrm{e}}^{ - {\textstyle\frac{{{t^2}}}{2}}}} $ $ \tau ,s $
    Derivative of Gaussian (DOG) $ \psi (t) = - \dfrac{{\mathrm{d}}}{{{\mathrm{d}}t}}\left({{\mathrm{e}}^{ -\textstyle{ \frac{{{t^2}}}{2}}}}\right) $ $ \tau ,s $
    Shannon $ \psi (t) = {\mathrm{sinc}}(t/p) \cdot \omega (t) $ $ \tau ,s,w(t):矩形窗 $
    Meyer $ \psi (t) = \dfrac{1}{{2p}}\displaystyle\int_{ - \infty }^\infty {\hat \psi (\xi ){{\mathrm{e}}^{{\mathrm{i}}\xi t}}{\mathrm{d}}\xi } $ $ \tau ,s $
    下载: 导出CSV 
    | 显示表格

    设置iterations=50,在前序预训练阶段均使各小波基函数对应的网络识别精度达到40%,利用上述所选的4种小波基函数进行对比学习阶段实验,所得到的识别精度与迭代次数曲线如图12所示。可以观察到,在本SEI任务中,不同小波基函数的识别效果存在较大差异,采用DOG小波基识别精度最高,可达到90%以上(作为本文WSW-KAN网络的默认小波基函数),识别精度提升达到50%以上,而最差的Meyer网络则仅有60%左右的识别精度,识别精度提升仅20%左右。

    图  12  不同小波基函数效果对比
    Figure  12.  The comparison of the effect of different wavelet basis functions

    具体分析不同小波基函数所引起的较大性能差异,可以发现使用DOG和Mexican hat小波的网络识别性能最好,DOG和Mexican hat小波分别作为高斯函数的一阶和二阶导数,具有较好的局部化特性,适合用于检测边缘和局部特征。对比DOG和Mexican小波发现,DOG小波性能更好,DOG小波是高斯函数的一阶导数,它在时域上表现为一个有正负区域的脉冲,这使得它在捕捉信号的边缘和突变点方面非常有效。在本文实验条件下,DOG小波可以更好地捕捉到雷达信号中的关键特征,尤其是具有明显边缘或突变的特征。同时DOG小波作为高通滤波器,能够更好地提取某些高频特征。针对雷达辐射源信号,为了发挥局部化特性较好的小波函数的作用,本文在前端一维卷积采用的是差分核,保留了突变瞬态特征。基于此,本文选择DOG小波作为默认小波基函数。

    Shannon小波和Meyer小波识别性能相对较差,从局部化特性角度分析,Shannon小波是基于sinc函数的窗口化函数,它在时域上的衰减较慢,局部化能力较差,雷达信号中如果存在快速的突变,该小波无法很好地捕捉这些局部特征,导致性能不佳;Meyer小波虽然在频域上有较好的紧支性和正交性,但它在时域上的局部化特性相对较弱,对于需要捕捉瞬时变化的雷达信号,Meyer小波表现不如DOG和Mexican hat小波。从时频分辨率角度分析,Shannon小波的时频分辨率相对较差,因为它在时域上的衰减较慢,无法有效捕捉雷达信号中的快速变化;而Meyer小波虽然在频域上有较好的分辨率,但在时域上的分辨率较低,无法很好地捕捉雷达信号的瞬时特征。

    4.3.4   伪标签阈值参数的选择和鲁棒性分析

    本节实验验证本文提出算法对于伪标签阈值参数$ \lambda $和$ \mu $的鲁棒性,同时阐述实验中伪标签阈值参数的选择策略。实验中采用的数据集和实验参数设置见4.1节和4.2节。依据伪标签算法先验知识,正伪标签待定选择参数$\mu $可选为0.95, 0.90, 0.85, 0.80, 0.70, 0.60,负伪标签待定选择参数$\lambda $可选为0.01, 0.02, 0.05, 0.10, 0.15, 0.20,分别组合试验,观察识别精度影响情况,选择最优参数组合。根据实验结果图13表10可以发现,当$\mu $低于0.80或者$\lambda $高于0.05时,识别精度都将明显降低。综上所述,在利用正负伪标签进行无监督学习的过程中,合理设置正负伪标签的阈值参数十分重要,在本文中,所选定的默认阈值参数为$ \mu = 0.80 $及$ \lambda = 0.05 $。

    表  10  不同伪标签阈值参数识别性能(%)
    Table  10.  The identification performance of different pseudo-label threshold parameters (%)
    $\lambda $ $\mu $
    0.01 0.02 0.05 0.10 0.15 0.20
    0.95 95.12 95.12 95.04 94.03 92.79 89.45
    0.90 95.02 95.02 95.02 93.99 92.03 89.21
    0.85 94.99 95.00 94.99 93.86 91.56 87.79
    0.80 94.99 94.99 94.99 93.14 90.34 86.34
    0.70 91.78 91.58 90.89 90.82 87.45 84.45
    0.60 87.34 87.13 86.88 86.34 85.56 82.98
    下载: 导出CSV 
    | 显示表格
    图  13  伪标签阈值参数对识别精度的影响
    Figure  13.  The effect of identification accuracy of pseudo-label threshold parameters
    4.3.5   伪标签平衡系数的选择和鲁棒性分析

    本节实验说明本文提出算法关于伪标签平衡系数$\alpha $和$\beta $的鲁棒性,同时阐述实验中伪标签平衡系数的选择策略。实验中采用的数据集和实验参数设置见4.1节和4.2节。约束两个平衡系数满足$\alpha + \beta = 1$,分别设置两者比例$\alpha /\beta $为4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4,采集数据绘制不同平衡系数比例识别精度与迭代次数关系曲线图如图14所示。

    图  14  不同平衡系数比例情况下识别精度与迭代次数关系曲线图
    Figure  14.  The relationship between the identification accuracy and the number of iterations under different balance coefficients

    可以看到,当$\alpha /\beta $取值为1:2时,识别精度最高。偏离这个比例,自适应感知伪标签加权选择算法都将无法达到最大精度,这说明后向交叉熵相对于前向交叉熵具有更加重要的地位,通过适当提高后向交叉熵的权重,可以有效校准伪标签的置信度,增强鲁棒性。

    针对样本标签稀缺导致的辐射源个体识别性能受限的问题,本文提出了一种基于WSW-KAN网络的辐射源个体识别方法。该方法结合了KAN网络独有的边缘函数可学习特性和小波函数的多分辨率分析特点,从而减少模型参数规模,提升算法运行效率,并有效提高算法可解释性。针对弱标注问题,通过自适应感知伪标签加权选择,采用对比学习方法提取特征并迭代训练。同时考虑到算法计算复杂度,采用将标注筛选的样本通过对比学习融入到预训练模型中,不需要重新训练只需对某几层参数进行调整优化并进行对比学习就能实现针对实际应用问题的有效迁移。通过实验验证,本文所提出的算法有效解决了传统识别方法可解释性差的不足,在识别性能和时间空间复杂度上均有较好的表现,同时在伪标签阈值参数和平衡系数的选择上也有较好的鲁棒性。

  • 图  1  MLP与KAN网络结构对比

    Figure  1.  Comparison of MLP and KAN network structure

    图  2  基于WSW-KAN网络的弱标注辐射源识别算法整体结构

    Figure  2.  Overall structure of weak label emitter identification algorithm based on WSW-KAN network

    图  3  WSW-KAN网络结构

    Figure  3.  WSW-KAN network structure

    图  4  采集环境设计

    Figure  4.  Acquisition environment design

    图  5  实验数据集信噪比值分布

    Figure  5.  SNR distribution in experimental data sets

    图  6  预训练阶段不同网络模型的迭代次数与识别精度关系曲线图

    Figure  6.  The relationship between the number of iterations and the identification accuracy of different network models in the pre-training stage

    图  7  预训练阶段各网络混淆矩阵

    Figure  7.  Network confusion matrixs in pre-training stage

    图  8  对比学习阶段不同网络模型的迭代次数与识别精度关系曲线图

    Figure  8.  The relationship between the number of iterations and the identification accuracy of different network models in the contrastive learning stage

    图  9  对比学习阶段各网络混淆矩阵

    Figure  9.  Network confusion matrixs in contrastive learning stage

    图  10  自适应感知伪标签加权选择算法消融实验迭代次数与识别精度关系曲线图

    Figure  10.  The relationship between the number of iterations and the identification accuracy of adaptive pseudo-label weighted selection algorithm ablation study

    图  11  各算法处理情形混淆矩阵

    Figure  11.  Confusion matrixs of all algorithm processing cases

    图  12  不同小波基函数效果对比

    Figure  12.  The comparison of the effect of different wavelet basis functions

    图  13  伪标签阈值参数对识别精度的影响

    Figure  13.  The effect of identification accuracy of pseudo-label threshold parameters

    图  14  不同平衡系数比例情况下识别精度与迭代次数关系曲线图

    Figure  14.  The relationship between the identification accuracy and the number of iterations under different balance coefficients

    1  对比学习阶段自适应感知伪标签加权选择算法

    1.   Adaptive sensing pseudo label weighted selection algorithm in contrastive learning phase

     1. 针对对比学习阶段数据流$ {D_{{\mathrm{U,unlabeled}}}} = \{ ({x^{(i)}})\} _{i = 1}^{{N_{{\mathrm{U,unlabeled}}}}} $
     利用自适应感知伪标签加权选择算法调整代价函数。
     2. for $j = 1,2, \cdots ,50$ do 迭代条件
     3.  对于每一类样本$ {x_t} $,计算特征空间中的成对余弦距离;
     4.  构造相似样本对$ {N_t} $;
     5.  计算样本类$ {x_t} $的后验概率${\hat p_t}$;
     6.  更新样本临时伪标签$ {\hat y_t} $;
     7.  计算置信度分数$ {q_t} $,并对置信度分数排序,依据所设定的
       阈值比例过滤伪标签;
     8.  根据置信度分数$ {q_t} $计算动态权重$ {w^i} $;
     9.  计算损失${l^i}$,并调整网络的代价函数;
     10. end
    下载: 导出CSV

    表  1  雷达型号参数

    Table  1.   Radar type parameters

    技术指标 参数值
    工作频段 X
    工作频段范围(GHz) 9.3~9.5
    量程(nm) 0.0625~96.0000
    扫描带宽(MHz) 25
    距离分辨率(m) 6
    脉冲重复频率 1.6 K, 3.0 K, 5.0 K和10.0 K
    发射峰值功率(W) 50
    天线转速(r/min) 2, 12, 24, 48
    天线长度(m) 1.8
    天线工作模式 凝视、圆周扫描
    天线极化方式 HH
    天线水平波束宽度(°) 1.2
    天线垂直波束宽度(°) 22
    下载: 导出CSV

    表  2  预训练阶段和对比学习阶段数据情况(表中为接收到的辐射源脉冲数量)

    Table  2.   Data of pre-training stage and comparative learning stage (the number of emitter pulses received is shown in the table)

    类型预训练阶段对比学习阶段
    辐射源A5000100000
    辐射源B450096890
    辐射源C498795678
    辐射源D432198978
    辐射源E390798765
    辐射源F467890780
    辐射源G418796789
    下载: 导出CSV

    表  3  不同网络参数设置情况

    Table  3.   Different network parameter settings

    类别 网络层数 网络层类型 网络层设置 残差块 激活函数 批归一化 叠加层 小波变换 具体参数
    Wav-KAN 5 Wav-KANLinear层、
    叠加层
    小波变换、一维卷积核、
    叠加函数
    ReLU 小波基选择(DOG),一维卷积核,滤波器数量64
    KAN 5 KANLinear层、
    叠加层
    一维卷积核、叠加
    函数
    ReLU 一维卷积核,滤波器数量64
    CNN-13 13 卷积层、池化层、
    全连接层
    卷积核、激活函数 ReLU 3$ \times $3卷积核,滤波器64,步幅1
    Wideresnet 15 卷积层、残差连接 残差块、宽卷积核、
    激活函数
    ReLU 16-4(16基本通道数,
    宽度乘数4)
    下载: 导出CSV

    表  4  预训练阶段不同识别网络识别性能

    Table  4.   Identification performance of different identification networks in pre-training stage

    迭代次数 WSW-KAN (%) Wav-KAN (%) KAN (%) CNN-13 (%) Wideresnet (%)
    1 50.44 46.23 46.14 47.16 47.62
    2 58.87 56.11 53.14 54.37 53.88
    3 66.14 60.87 61.77 58.89 57.10
    4 70.88 64.50 63.99 61.41 59.14
    5 73.11 67.34 65.98 63.76 62.02
    6 75.27 69.78 67.77 64.18 64.89
    7 77.84 72.66 69.08 65.66 66.67
    8 79.91 75.90 71.67 66.94 68.11
    9 81.07 77.36 73.20 67.20 69.56
    46 88.74 87.36 84.09 76.05 78.60
    47 88.74 87.36 84.09 76.05 78.60
    48 88.75 87.36 84.09 76.05 78.60
    49 88.75 87.36 84.09 76.05 78.60
    50 88.75 87.36 84.09 76.05 78.60
    下载: 导出CSV

    表  5  对比学习阶段不同识别网络识别性能

    Table  5.   Identification performance of different identification networks in contrastive learning stage

    迭代次数 WSW-KAN (%) Wav-KAN (%) KAN (%) CNN-13 (%) Wideresnet (%)
    1 79.33 77.18 76.08 69.49 70.80
    2 82.27 80.00 79.80 72.81 75.91
    3 84.11 82.30 81.01 74.40 77.14
    4 86.84 84.23 82.77 77.21 78.81
    5 88.58 85.98 83.66 79.31 80.10
    6 89.98 86.89 84.49 80.90 81.71
    7 90.50 88.10 85.31 81.77 82.61
    8 91.21 89.87 86.02 82.68 83.27
    9 91.61 90.40 86.80 83.51 84.50
    46 94.98 93.16 92.29 85.59 87.20
    47 94.99 93.16 92.29 85.59 87.21
    48 94.99 93.16 92.29 85.59 87.21
    49 94.99 93.16 92.29 85.59 87.21
    50 94.99 93.16 92.29 85.59 87.21
    下载: 导出CSV

    表  6  自适应感知伪标签加权选择算法消融实验数据

    Table  6.   Adaptive pseudo-label weighted selection algorithm ablation study data

    迭代次数 本文算法处理
    情形(%)
    传统伪标签处理
    情形(%)
    无伪标签处理
    情形(%)
    1 79.33 61.45 54.47
    2 82.27 68.06 59.03
    3 84.11 73.15 61.95
    4 86.84 75.06 63.89
    5 88.58 77.35 65.71
    6 89.98 79.03 67.11
    7 90.50 80.50 68.97
    8 91.21 81.22 69.70
    9 91.61 81.90 70.40
    46 94.98 83.60 72.45
    47 94.99 83.60 72.45
    48 94.99 83.60 72.45
    49 94.99 83.60 72.45
    50 94.99 83.60 72.45
    下载: 导出CSV

    表  7  预训练阶段不同识别网络算法复杂度对比

    Table  7.   Comparison of the complexity of different identification network algorithms in pre-training stage

    网络模型耗时(s)参数数量(个)识别精度(%)
    WSW-KAN246.5641993588.75
    Wav-KAN280.8843997887.36
    KAN312.7370211884.09
    CNN-13408.68315099076.05
    Wideresnet379.03146693578.60
    下载: 导出CSV

    表  8  对比学习阶段不同识别网络算法时间复杂度和空间复杂度对比

    Table  8.   Comparison of the complexity of different identification network algorithms in contrastive learning stage

    网络模型耗时(s)参数数量(个)识别精度(%)
    WSW-KAN356.7841993594.99
    Wav-KAN392.4543997893.16
    KAN430.9870211892.29
    CNN-13544.23315099085.59
    Wideresnet487.78146693587.21
    下载: 导出CSV

    表  9  小波基函数形式和参数对比

    Table  9.   The comparison of wavelet basis function form and parameters

    类型 小波基函数形式 参数
    Mexican hat $ \psi (t) = \dfrac{2}{{\sqrt 3 {p^{1/4}}}}({t^2} - 1){{\mathrm{e}}^{ - {\textstyle\frac{{{t^2}}}{2}}}} $ $ \tau ,s $
    Derivative of Gaussian (DOG) $ \psi (t) = - \dfrac{{\mathrm{d}}}{{{\mathrm{d}}t}}\left({{\mathrm{e}}^{ -\textstyle{ \frac{{{t^2}}}{2}}}}\right) $ $ \tau ,s $
    Shannon $ \psi (t) = {\mathrm{sinc}}(t/p) \cdot \omega (t) $ $ \tau ,s,w(t):矩形窗 $
    Meyer $ \psi (t) = \dfrac{1}{{2p}}\displaystyle\int_{ - \infty }^\infty {\hat \psi (\xi ){{\mathrm{e}}^{{\mathrm{i}}\xi t}}{\mathrm{d}}\xi } $ $ \tau ,s $
    下载: 导出CSV

    表  10  不同伪标签阈值参数识别性能(%)

    Table  10.   The identification performance of different pseudo-label threshold parameters (%)

    $\lambda $ $\mu $
    0.01 0.02 0.05 0.10 0.15 0.20
    0.95 95.12 95.12 95.04 94.03 92.79 89.45
    0.90 95.02 95.02 95.02 93.99 92.03 89.21
    0.85 94.99 95.00 94.99 93.86 91.56 87.79
    0.80 94.99 94.99 94.99 93.14 90.34 86.34
    0.70 91.78 91.58 90.89 90.82 87.45 84.45
    0.60 87.34 87.13 86.88 86.34 85.56 82.98
    下载: 导出CSV
  • [1] 吴琼. 基于改进CNN的雷达辐射源识别算法研究[D]. [硕士论文], 西安电子科技大学, 2019: 1–4. doi: 10.7666/d.D01905147.

    WU Qiong. Research on radar emitter recognition algorithm based on improved CNN[D]. [Master dissertation], Xidian University, 2019: 1–4. doi: 10.7666/d.D01905147.
    [2] TAN Kaiwen, YAN Wenjun, ZHANG Limin, et al. Specific emitter identification based on software-defined radio and decision fusion[J]. IEEE Access, 2021, 9: 86217–86229. doi: 10.1109/ACCESS.2021.3088542.
    [3] 王艺卉, 闫文君, 凌青, 等. 基于置信学习的低标注率辐射源个体识别算法[J]. 兵器装备工程学报, 2024, 45(5): 267–275. doi: 10.11809/bqzbgcxb2024.05.037.

    WANG Yihui, YAN Wenjun, LING Qing, et al. Low labeling rate specific emitter identification algorithm based on confidence learning[J]. Journal of Ordnance Equipment Engineering, 2024, 45(5): 267–275. doi: 10.11809/bqzbgcxb2024.05.037.
    [4] 张顺生, 丁宦城, 王文钦. 面向辐射源识别的多尺度特征提取与特征选择网络[J]. 国防科技大学学报, 2024, 46(6): 141–148. doi: 10.11887/j.cn.202406015.

    ZHANG Shunsheng, DING Huancheng, and WANG Wenqin. Multi-scale feature extraction and feature selection network for radiation source identification[J]. Journal of National University of Defense Technology, 2024, 46(6): 141–148. doi: 10.11887/j.cn.202406015.
    [5] XING Yuexiu, HU Aiqun, ZHANG Junqing, et al. Design of a robust radio-frequency fingerprint identification scheme for multimode LFM radar[J]. IEEE Internet of Things Journal, 2020, 7(10): 10581–10593. doi: 10.1109/JIOT.2020.3003692.
    [6] 李昕. 基于无监督学习的通信辐射源个体识别技术研究[D]. [硕士论文], 国防科技大学, 2019: 1–10. doi: 10.27052/d.cnki.gzjgu.2019.000718.

    LI Xin. Research on individual communication transmitter identification based on unsupervised learning[D]. [Master dissertation], National University of Defense Technology, 2019: 1–10. doi: 10.27052/d.cnki.gzjgu.2019.000718.
    [7] CHEN Qi, YANG Lingxiao, LAI Jianhuang, et al. Self-supervised image-specific prototype exploration for weakly supervised semantic segmentation[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, 2022: 4278–4288. doi: 10.1109/CVPR52688.2022.00425.
    [8] DU Ye, FU Zehua, LIU Qingjie, et al. Weakly supervised semantic segmentation by pixel-to-prototype contrast[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, 2022: 4310–4319. doi: 10.1109/CVPR52688.2022.00428.
    [9] JIANG Pengtao, YANG Yuqi, HOU Qibin, et al. L2G: A simple local-to-global knowledge transfer framework for weakly supervised semantic segmentation[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, 2022: 16865–16875. doi: 10.1109/CVPR52688.2022.01638.
    [10] LEE J, KIM E, and YOON S. Anti-adversarially manipulated attributions for weakly and semi-supervised semantic segmentation[C]. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville, USA, 2021: 4070–4078. doi: 10.1109/CVPR46437.2021.00406.
    [11] LEE S, LEE M, LEE J, et al. Railroad is not a train: Saliency as pseudo-pixel supervision for weakly supervised semantic segmentation[C]. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville, USA, 2021: 5491–5501. doi: 10.1109/CVPR46437.2021.00545.
    [12] ZHOU Tianfei, ZHANG Meijie, ZHAO Fand, et al. Regional semantic contrast and aggregation for weakly supervised semantic segmentation[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, 2022: 4289–4299. doi: 10.1109/CVPR52688.2022.00426.
    [13] HE Kaiming, FAN Haoqi, WU Yuxin, et al. Momentum contrast for unsupervised visual representation learning[C]. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, 2020: 9726–9735. doi: 10.1109/CVPR42600.2020.00975.
    [14] PENG Yang, HOU Changbo, ZHANG Yibin, et al. Supervised contrastive learning for RFF identification with limited samples[J]. IEEE Internet of Things Journal, 2023, 10(19): 17293–17306. doi: 10.1109/JIOT.2023.3272628.
    [15] CHEN Jun, WONG W K, and HAMDAOUI B. Unsupervised contrastive learning for robust RF device fingerprinting under time-domain shift[C]. ICC 2024 - IEEE International Conference on Communications, Denver, USA, 2024: 3567–3572. doi: 10.1109/ICC51166.2024.10622173.
    [16] ZHAN Mengqi, LI Yang, CUI Huajun, et al. MCRFF: A meta-contrastive learning-based RF fingerprinting method[C]. MILCOM 2023 - 2023 IEEE Military Communications Conference (MILCOM), Boston, USA, 2023: 391–396. doi: 10.1109/MILCOM58377.2023.10356211.
    [17] DU Mingyang, PAN Jifei, and BI Daping. A contrastive learner for automatic modulation classification[J]. IEEE Transactions on Wireless Communications, in press. doi: 10.1109/TWC.2025.3532438.
    [18] LIU Ziming, WANG Yixuan, VAIDYA S, et al. KAN: Kolmogorov-Arnold networks[EB/OL]. https://arxiv.org/abs/2404.19756, 2024.
    [19] BOZORGASL Z and CHEN Hao. Wav-KAN: Wavelet Kolmogorov-Arnold networks[EB/OL]. https://arxiv.org/abs/2405.12832, 2024.
    [20] PERSONS J B, WONG L J, MOORE M O, et al. Classification of radio signals using truncated Gaussian discriminant analysis of convolutional neural network-derived features[C]. MILCOM 2022 - 2022 IEEE Military Communications Conference (MILCOM), Rockville, USA, 2022: 304–310. doi: 10.1109/MILCOM55135.2022.10017724.
    [21] ZHENG Qinghe, ZHAO Penghui, LI Yang, et al. Spectrum interference-based two-level data augmentation method in deep learning for automatic modulation classification[J]. Neural Computing and Applications, 2021, 33(13): 7723–7745. doi: 10.1007/s00521-020-05514-1.
    [22] CHEN Xi, YANG Haosen, ZHANG Huicong, et al. Uncertainty-aware pseudo-label filtering for source-free unsupervised domain adaptation[J]. Neurocomputing, 2024, 575: 127190. doi: 10.1016/j.neucom.2023.127190.
    [23] 刘宁波, 丁昊, 黄勇, 等. X波段雷达对海探测试验与数据获取年度进展[J]. 雷达学报, 2021, 10(1): 173–182. doi: 10.12000/JR21011.

    LIU Ningbo, DING Hao, HUANG Yong, et al. Annual progress of the sea-detecting X-band radar and data acquisition program[J]. Journal of Radars, 2021, 10(1): 173–182. doi: 10.12000/JR21011.
    [24] ALBATINEH A N, BOUBAKARI I, and KIBRIA B M G. New confidence interval estimator of the signal-to-noise ratio based on asymptotic sampling distribution[J]. Communications in Statistics - Theory and Methods, 2017, 46(2): 574–590. doi: 10.1080/03610926.2014.1000498.
    [25] ZAGORUYKO S and KOMODAKIS N. Wide residual networks[C]. British Machine Vision Conference 2016, York, UK, 2016.
    [26] 谭凯文, 张立民, 闫文君, 等. 面向非均衡类别的半监督辐射源识别方法[J]. 雷达学报, 2022, 11(4): 713–727. doi: 10.12000/JR22043.

    TAN Kaiwen, ZHANG Limin, YAN Wenjun, et al. A semi-supervised emitter identification method for imbalanced category[J]. Journal of Radars, 2022, 11(4): 713–727. doi: 10.12000/JR22043.
    [27] 王程昱, 凌青, 闫文君. 基于DCGAN的雷达辐射源信号个体识别算法[J]. 测控技术, 2024, 43(7): 17–22, 64. doi: 10.19708/j.ckjs.2024.04.222.

    WANG Chengyu, LING Qing, and YAN Wenjun. Individual identification algorithm for radar emitter signal based on DCGAN[J]. Measurement and Control Technology, 2024, 43(7): 17–22, 64. doi: 10.19708/j.ckjs.2024.04.222.
  • 加载中
图(14) / 表(11)
计量
  • 文章访问数: 35
  • HTML全文浏览量: 8
  • PDF下载量: 8
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-12-11
  • 修回日期:  2025-03-04
  • 网络出版日期:  2025-03-25

目录

/

返回文章
返回