侯志强 陈茂林 马靖媛 郭凡 余旺盛 马素刚

侯志强,陈茂林,马靖媛,等. 基于二阶注意力的Siamese网络视觉跟踪算法[J]. 北京航空航天大学学报,2024,50(3):739-747 doi: 10.13700/j.bh.1001-5965.2022.0373
HOU Z Q,CHEN M L,MA J Y,et al. Siamese network visual tracking algorithm based on second-order attention[J]. Journal of Beijing University of Aeronautics and Astronautics,2024,50(3):739-747 (in Chinese) doi: 10.13700/j.bh.1001-5965.2022.0373
doi: 10.13700/j.bh.1001-5965.2022.0373
基金项目: 国家自然科学基金(62072370)


  • 中图分类号: TP391.4

Siamese network visual tracking algorithm based on second-order attention

Funds: National Natural Science Foundation of China (62072370)
  • 图 1  本文算法总体框架

    Figure 1.  Overall framework of proposed algorithm

    图 2  残差二阶池化网络

    Figure 2.  Residual second-order pooling network

    图 3  二阶池化流程

    Figure 3.  Second-order pooling process

    图 4  二阶空间注意力网络

    Figure 4.  Second-order spatial attention network

    图 5  部分视频序列跟踪结果

    Figure 5.  Tracking results of partial video sequence

    图 6  OTB100数据集的定量对比结果

    Figure 6.  Quantitative comparison results of OTB100 dataset

    表  1  归一化参数对跟踪性能的影响

    Table  1.   Influence of normalization parameters on tracking performance

    C 精度 成功率
    0.5 0.806 0.597
    0.6 0.815 0.606
    0.7 0.818 0.609
    0.8 0.825 0.614
    0.9 0.821 0.612
    1.0 0.831 0.621
    2.0 0.843 0.629
    3.0 0.844 0.626
    4.0 0.830 0.623
    5.0 0.849 0.633
    6.0 0.845 0.638
    7.0 0.836 0.626
    8.0 0.846 0.633
    9.0 0.824 0.617
    10.0 0.830 0.621
    表  2  细化归一化参数平衡跟踪性能

    Table  2.   Refinement of normalization parameters to balance tracking performance

    C 精度 成功率
    5.0 0.849 0.633
    5.1 0.843 0.629
    5.2 0.832 0.629
    5.3 0.839 0.630
    5.4 0.842 0.629
    5.5 0.848 0.638
    5.6 0.836 0.625
    5.7 0.836 0.622
    5.8 0.829 0.628
    5.9 0.844 0.626
    6.0 0.845 0.638
    表  3  消融实验结果

    Table  3.   Ablation experiment results

    SiamFC VGG-Net SoA ResSoP DBR 精度 成功率 跟踪速度/(帧·s−1)
    0.777 0.580 58
    0.828 0.622 55
    0.845 0.638 53
    0.864 0.649 50
    0.877 0.676 48
    表  4  不同属性下算法的跟踪成功率对比结果

    Table  4.   Comparison results of tracking success rate of algorithms under different attributes

    算法 光照变化 平面外旋转 尺度变化 离开视野 目标形变 低分辨率 快速运动 目标遮挡 相似背景 平面内旋转 运动模糊
    本文算法 0.681 0.658 0.668 0.607 0.640 0.698 0.646 0.634 0.640 0.649 0.674
    SiamSE[26] 0.670 0.635 0.678 0.613 0.617 0.697 0.663 0.637 0.620 0.651 0.651
    ATOM[25] 0.679 0.643 0.681 0.612 0.630 0.693 0.662 0.648 0.631 0.650 0.658
    SiamDW-FC[18] 0.627 0.617 0.618 0.595 0.562 0.616 0.632 0.606 0.582 0.613 0.655
    TADT[24] 0.674 0.643 0.650 0.623 0.602 0.644 0.655 0.638 0.619 0.618 0.668
    GradNet[23] 0.643 0.628 0.614 0.583 0.572 0.669 0.624 0.616 0.611 0.627 0.646
    DaSiamRPN[8] 0.655 0.644 0.637 0.537 0.645 0.636 0.621 0.611 0.642 0.652 0.625
    SASiam[22] 0.644 0.642 0.642 0.611 0.590 0.692 0.636 0.629 0.634 0.626 0.651
    SiamRPN[7] 0.652 0.628 0.621 0.548 0.619 0.663 0.603 0.589 0.598 0.632 0.624
    SiamFC[6] 0.536 0.550 0.560 0.473 0.546 0.574 0.575 0.532 0.525 0.567 0.587
    表  5  VOT2018数据集实验对比结果

    Table  5.   VOT2018 dataset experimental comparison results

    算法 EAO 准确率 鲁棒性
    本文算法 0.265 0.534 0.389
    SiamSE[26] 0.270 0.538 0.432
    GradNet[23] 0.247 0.510 0.390
    SiamDW-FC[18] 0.230 0.500 0.490
    SiamRPN[7] 0.243 0.560 0.340
    SASiam[22] 0.236 0.500 0.459
    SiamFC-tri[29] 0.212 0.483 0.526
    DSiam[28] 0.196 0.512 0.646
    DCFNet[27] 0.182 0.470 0.543
    SiamFC[6] 0.188 0.500 0.590
