
张锐 龚汉钦 宋瑞源 李亚东 卢智 张东恒 胡洋 陈彦

张锐, 龚汉钦, 宋瑞源, 等. 基于4D成像雷达的隔墙人体姿态重建与行为识别研究[J]. 雷达学报(中英文), 2025, 14(1): 44–61. doi: 10.12000/JR24132
引用本文: 张锐, 龚汉钦, 宋瑞源, 等. 基于4D成像雷达的隔墙人体姿态重建与行为识别研究[J]. 雷达学报(中英文), 2025, 14(1): 44–61. doi: 10.12000/JR24132
ZHANG Rui, GONG Hanqin, SONG Ruiyuan, et al. Through-wall human pose reconstruction and action recognition using four-dimensional imaging radar[J]. Journal of Radars, 2025, 14(1): 44–61. doi: 10.12000/JR24132
Citation: ZHANG Rui, GONG Hanqin, SONG Ruiyuan, et al. Through-wall human pose reconstruction and action recognition using four-dimensional imaging radar[J]. Journal of Radars, 2025, 14(1): 44–61. doi: 10.12000/JR24132


DOI: 10.12000/JR24132
基金项目: 国家自然科学基金(62172381, 62201542)

    张 锐,博士生,主要研究方向为人体感知、视频图像去噪




    卢 智,博士后,主要研究方向为无线感知


    胡 洋,博士,副教授,主要研究方向为计算机视觉、多媒体信号处理和多模态感知

    陈 彦,博士,教授,主要研究方向为多模态感知、多媒体信号处理和数字健康


    陈彦 eecyan@ustc.edu.cn

  • 责任主编:丁一鹏 Corresponding Editor: DING Yipeng
  • 中图分类号: TN957.51

Through-wall Human Pose Reconstruction and Action Recognition Using Four-dimensional Imaging Radar

Funds: The National Natural Science Foundation of China (62172381, 62201542)
More Information
  • 摘要: 隔墙人体姿态重建和行为识别在智能安防和虚拟现实等领域具有广泛应用前景。然而,现有隔墙人体感知方法通常忽视了对4D时空特征的建模以及墙体对信号的影响,针对这些问题,该文创新性地提出了一种基于4D成像雷达的隔墙人体感知新架构。首先,基于时空分离的分步策略,该文设计了ST2W-AP时空融合网络,解决了由于主流深度学习库缺少4D卷积而无法充分利用多帧3D体素时空域信息的问题,实现了保留3D空域信息的同时利用长序时域信息,大幅提升姿态估计任务和行为识别任务的性能。此外,为抑制墙体对信号的干扰,该文利用深度学习强大的拟合性能和并行输出的特点设计了深度回波域补偿器,降低了传统墙体补偿方法的计算开销。大量的实验结果表明,相比于现有最佳方法,ST2W-AP将平均关节位置误差降低了33.57%,并且将行为识别的F1分数提高了0.51%。


  • 图  1  穿墙姿态估计和行为识别框架流程

    Figure  1.  Pipeline of the proposed through-wall pose estimation and activity recognition framework

    图  2  实验场景和无线信号传播路径

    Figure  2.  Experiment scenario and RF propagation path

    图  3  墙体补偿器结构图

    Figure  3.  Structural diagram of wall compensator

    图  4  不带墙体补偿和带墙体补偿的隔墙成像

    Figure  4.  BP imaging w/o and w/compensating

    图  5  网络结构图及P4D模块的3种设计(B为批大小,T为时域序列长度,C为输入通道数,H为高度,W为宽度,以及D为深度。C1, C2为卷积输入通道,S为步长)

    Figure  5.  Network structure diagram and three designs of the pseudo P4D module (B represents the batch size, T denotes the length of the temporal sequence, C indicates the number of input channels, H stands for height, W denotes width, and D represents depth. C1 and C2 represent the input channels for the convolution, while S denotes the stride)

    图  6  动态权重变化曲线

    Figure  6.  Dynamic weight variation curve

    图  7  不同场景姿态重建可视化

    Figure  7.  Visualization of pose reconstruction across different scenarios

    图  8  时间序列长度为12帧的4D成像结果

    Figure  8.  4D imaging results with a time series length of 12 frames

    图  9  不同方法在行为识别任务的混淆矩阵

    Figure  9.  Confusion matrices for activity recognition task across different methods

    图  10  特征t-SNE可视化

    Figure  10.  t-SNE visualization of the learned feature

    图  11  天线单元选取路径

    Figure  11.  Selection Path of Antenna Units

    表  1  雷达系统参数

    Table  1.   Key parameters of radar system

    参数 数值
    中心频率 1.8 GHz
    带宽 2.0 GHz
    频点 201
    帧率 12 帧/s
    发射天线阵列长度 59.4 cm
    接收天线阵列长度 59.4 cm
    下载: 导出CSV

    表  2  人体关节点重建误差定量评估结果(mm)

    Table  2.   Quantitative evaluation results of human body joint reconstruction error (mm)

    Dual-task Net[27]136.09104.37109.49129.81175.06100.3798.50113.55126.68117.09121.20
    下载: 导出CSV

    表  3  不同场景关节点重建误差定量评估结果(mm)

    Table  3.   Quantitative evaluation results of joint reconstruction error in different scenarios (mm)

    方法 行走 坐下 挥手 静止姿态
    RF-Pose3D[22] 96.74 76.28 58.77 51.08
    ResNet3D-50[39] 104.63 61.25 57.26 44.29
    Dual-task Net[27] 156.31 75.15 100.80 100.85
    RadarFormer[28] 545.00 194.29 98.12 216.34
    ST2W-AP 69.25 40.38 37.30 37.81
    下载: 导出CSV

    表  4  行为识别定量评估结果

    Table  4.   Quantitative evaluation results of behavior recognition

    方法 准确率 召回率 精确率 F1分数
    ResNet3D-50[39] 0.9967 0.9969 0.9930 0.9949
    Dual-task Net[27] 0.9984 0.9741 0.9823 0.9727
    RadarFormer[28] 0.9519 0.5066 0.4513 0.4502
    ST2W-AP 1.0000 1.0000 1.0000 1.0000
    下载: 导出CSV

    表  5  选择路径1下的补偿器RMSPE相对误差分布

    Table  5.   Distribution of compensator accuracy under selection path 1

    折次 12 24 30 40 60 120 无补偿
    第1折 0.00427 0.00476 0.00422 0.00399 0.00302 0.00235 0.01399
    第2折 0.00405 0.00385 0.00238 0.00211 0.00158 0.00127 0.01382
    第3折 0.00373 0.00362 0.00210 0.00194 0.00225 0.00124 0.01363
    第4折 0.00332 0.00290 0.00183 0.00181 0.00218 0.00125 0.01335
    第5折 0.00370 0.00332 0.00224 0.00180 0.00161 0.00151 0.01315
    第6折 0.00473 0.00398 0.00342 0.00344 0.00258 0.00225 0.01294
    平均 0.00397 0.00374 0.00270 0.00252 0.00220 0.00165 0.01348
    下载: 导出CSV

    表  6  选择路径2下的补偿器RMSPE相对误差分布

    Table  6.   Distribution of compensator accuracy under selection path 2

    折次 12 24 30 40 60 120 无补偿
    第1折 0.00455 0.00492 0.00273 0.00315 0.00267 0.00201 0.01413
    第2折 0.00386 0.00492 0.00241 0.00225 0.00260 0.00149 0.01378
    第3折 0.00370 0.00305 0.00202 0.00283 0.00155 0.00130 0.01352
    第4折 0.00336 0.00347 0.00192 0.00209 0.00236 0.00137 0.01348
    第5折 0.00365 0.00333 0.00336 0.00349 0.00273 0.00188 0.01312
    第6折 0.00479 0.00507 0.00292 0.00312 0.00293 0.00215 0.01284
    平均 0.00399 0.00413 0.00256 0.00282 0.00247 0.00170 0.01348
    下载: 导出CSV

    表  7  计算时间开销对比

    Table  7.   Comparison of time overheads

    墙体补偿方法 推理时间(s)
    传统补偿方法[29] 15914.359
    深度回波域补偿器 9.066
    下载: 导出CSV

    表  8  自由空间行为识别和姿态重建定量评估结果

    Table  8.   Quantitative evaluation results of free-space behavior recognition and pose estimation

    MPJPE (mm)
    下载: 导出CSV

    表  9  行为识别和姿态重建定量评估结果

    Table  9.   Quantitative evaluation results of behavior recognition and pose estimation

    方法 准确率 召回率 精确率 F1分数 MPJPE (mm)
    ST2W-AP-PA 1.0000 1.0000 1.0000 1.0000 53.32
    ST2W-AP-PB 1.0000 1.0000 1.0000 1.0000 54.36
    ST2W-AP-PC 1.0000 1.0000 1.0000 1.0000 55.49
    ST2W-AP18 0.9973 0.9994 0.9917 0.9952 155.30
    ST2W-AP101 1.0000 1.0000 1.0000 1.0000 53.29
    ST2W-AP-50 w/o com 0.8952 0.7863 0.9004 0.8370 192.14
    ST2W-AP-50 w/o dw 0.9998 1.0000 1.0000 1.0000 54.46
    注:w/o com 表示去除墙体补偿,w/o dw表示去除动态权重调整策略。
    下载: 导出CSV
