庞枫骞 赵鸿飞 康营营

庞枫骞,赵鸿飞,康营营. 融合不确定性估计的端到端视频事件检测算法[J]. 北京航空航天大学学报,2024,50(12):3759-3770 doi: 10.13700/j.bh.1001-5965.2022.0897
PANG F Q,ZHAO H F,KANG Y Y. Uncertainty estimation fused end-to-end video event detection algorithm[J]. Journal of Beijing University of Aeronautics and Astronautics,2024,50(12):3759-3770 (in Chinese) doi: 10.13700/j.bh.1001-5965.2022.0897
基金项目: 国家自然科学基金(62001009);北京市教育委员会科技计划一般项目(KM202210009003);北方工业大学科研启动基金

    E-mail: fqpang@ncut.edu.cn

  • 中图分类号: TP751.1;TP391.4

Uncertainty estimation fused end-to-end video event detection algorithm

Funds: National Natural Science Foundation of China (62001009); Research and Development Program of Beijing Municipal Education Commission (KM202210009003); Scientific Research Initiation Foundation of North China University of Technology
  • 摘要:



  • 图 1  UC-YOWO算法结构

    Figure 1.  UC-YOWO algorithm structure

    图 2  UC-YOWO 算法子模块结构

    Figure 2.  UC-YOWO algorithm sub-module structure

    图 3  不确定性损失函数设计

    Figure 3.  Uncertainty loss function design

    图 4  NMS 算法示意图

    Figure 4.  Schematic diagram of NMS algorithm

    图 5  不同λ参数的相对 mAP

    Figure 5.  Relative mAP of different parameters λ

    图 6  J-HMDB-21数据集[13]检测结果

    Figure 6.  Test result in J-HMDB-21 data set[13]

    图 7  不确定性值和 IoU 散点图

    Figure 7.  Scatter plot of uncertainty and IoU

    图 8  去除关键帧时的不确定性

    Figure 8.  Uncertainties while removing keyframes

    图 9  替换关键帧时的不确定性

    Figure 9.  Uncertainties while replacing keyframes

    图 10  UC-YOWO 算法对新类别的检测结果

    Figure 10.  UC-YOWO algorithm test results for new categories

    表  1  不同初始化方差对算法性能的影响

    Table  1.   Influence of different initialization variance on algorithm performance

    σ0 mAP50/%
    VIRAT[23] J-HMDB-21[13]
    37.2 65.4
    10−1 37.1 65.1
    10−2 37.4 65.5
    10−3 37.9 66.9
    10−4 36.9 66.7
    表  2  不同视频帧参数对算法性能的影响

    Table  2.   Influence of different video frame parameters on algorithm performance

    帧长度/帧 采样间隔/帧 mAP50/%
    J-HMDB-21[13] AVA[10] VIRAT[23]
    8 $d = 1$ 66.9 16.5 37.9
    8 $d = 2$ 65.8 16.0 35.0
    8 $d = 3$ 62.7 16.0 34.6
    16 $d = 1$ 74.8 17.8 41.0
    32 $d = 1$ 71.2 18.5 44.9
    表  3  现有不同算法在J-HMDB-21数据集[13]的对比

    Table  3.   Comparison of different deep algorithms in J-HMDB-21 data set[13]

    算法 算法类型 数据类型 mAP50/%
    Peng w/o MR[9] 双阶段 V 56.9
    Peng w/ MR[9] 双阶段 V 58.5
    T-CNN[26] 双阶段 V 61.3
    ACT[27] 双阶段 V+F 65.7
    P3D-CTN[28] 单阶段 V 71.1
    YOWO[12] 单阶段 V 74.4
    UC-YOWO 单阶段 V 74.7
    UC-YOWO+Std-NMS 单阶段 V 75.2
    表  4  现有不同算法在AVA数据集[10]的对比

    Table  4.   Comparison of different deep algorithms in AVA data set[10]

    算法 算法类型 数据类型 mAP50/%
    I3D[10] 双阶段 V+F 15.6
    ACRN, S3D[30] 双阶段 V+F 17.4
    STEP, I3D[31] 双阶段 V+F 18.6
    RTPR[29] 双阶段 V+F 22.3
    LFB, R101+NL[32] 双阶段(离线) V 27.4
    ACAR, R50, 8x8, (64-f)[30] 双阶段(离线) V 28.3
    SlowFast, R50,8x8,(64-f)[33] 双阶段(离线) V 24.8
    YOWO(32-f)[12] 单阶段 V 18.3
    UC-YOWO(32-f) 单阶段 V 18.5
    UC-YOWO+StdNMS(32-f) 单阶段 V 19.6
图(10) / 表(4)
