马素刚 陈期梅 侯志强 杨小宝 张子贤

马素刚,陈期梅,侯志强,等. 基于GLCNet的轻量级语义分割算法[J]. 北京航空航天大学学报,2024,50(11):3358-3366 doi: 10.13700/j.bh.1001-5965.2022.0822
MA S G,CHEN Q M,HOU Z Q,et al. Lightweight semantic segmentation algorithm based on GLCNet[J]. Journal of Beijing University of Aeronautics and Astronautics,2024,50(11):3358-3366 (in Chinese) doi: 10.13700/j.bh.1001-5965.2022.0822
doi: 10.13700/j.bh.1001-5965.2022.0822
基金项目: 国家自然科学基金(62072370);西安市科技计划(22GXFW0125)


  • 中图分类号: TP391.4

Lightweight semantic segmentation algorithm based on GLCNet

Funds: National Natural Science Foundation of China (62072370); Science and Technology Project of Xi’an City (22GXFW0125)
More Information
  • 摘要:

    多数基于卷积神经网络的语义分割算法伴随庞大的参数量和计算复杂度,限制了其在实时处理场景中的应用。为解决该问题,提出了一种基于全局-局部上下文网络(GLCNet)的轻量级语义分割算法。该算法主要由全局-局部上下文(GLC)模块和多分辨率融合(MRF)模块构成。全局-局部上下文模块学习图像的全局信息和局部上下文信息,使用残差连接增强特征之间的依赖关系。在此基础上,提出了多分辨率融合模块聚合不同阶段的特征,对低分辨率特征进行上采样,与高分辨率特征融合增强高层特征的空间信息。在Cityscapes和Camvid数据集上进行测试,平均交并比(mIoU)分别达到69.89%和68.86%,在单块NVIDIA Titan V GPU上,速度分别达到87帧/s和122帧/s。实验结果表明:所提算法在分割精度、效率及参数量之间实现了较好的平衡,参数量仅有0.68×106


  • 图 1  GLCNet整体框架

    Figure 1.  Overall framework of GLCNet

    图 2  GLC模块

    Figure 2.  GLC module

    图 3  Cityscapes数据集的可视化对比结果

    Figure 3.  Visual comparison results of Cityscapes dataset

    图 4  Camvid数据集的可视化对比结果

    Figure 4.  Visual comparison results of Camvid dataset

    表  1  不同算法在Cityscapes数据集上的测试结果

    Table  1.   Test results of different algorithms on Cityscapes dataset

    算法 骨干网络 参数量 分割速度/(帧·s−1 mIoU/%
    ENet[14] None 0.4×106 76.9 58.3
    SegNet[40] VGG16 29.5×106 14.6 56.1
    ICNet[17] PSPNet50 26.50×106 30.3 69.5
    BiSeNet[20] Xception39 5.80×106 106 68.4
    FSSNet[41] None 0.2×106 51 65.6
    SwiftNet[43] MobileNetv2 2.4×106 27.7 69.7
    EDANet[31] None 0.68×106 81 67.3
    DFANet[18] Xception 4.8×106 120 67.1
    ESNet[15] None 1.6×106 41.7 69.1
    Fast-SCNN[37] None 1.11×106 123 68.0
    LEDNet[22] None 0.91×106 71 70.6
    CGNet[38] None 0.5×106 64.8
    NDNet[42] None 0.5×106 40 65.3
    CFPNet[45] None 0.55×106 30 70.1
    BSDNet[44] Xception 1.2×106 84.6 68.3
    BiSeNet V2[21] None 3.40×106 156 72.6
    SGCPNet[13] MobileNet 0.61×106 178.5 69.5
    本文算法 None 0.68×106 87 69.89
    表  2  不同算法在Camvid数据集上的测试结果

    Table  2.   Test results of different algorithms on Camvid dataset

    算法 骨干网络 参数量 mIoU/%
    ENet[14] None 0.36×106 51.3
    SegNet[40] VGG16 29.50×106 55.6
    BiSeNet[20] Xception39 65.6
    BiSeNet[20] ResNet18 49×106 68.7
    DFANet[18] Xception 7.80×106 64.7
    DABNet[23] None 0.76×106 66.4
    CGNet[38] None 0.5×106 65.6
    RGPNet[49] None 17.7×106 66.9
    FDDWNet[47] None 0.8×106 66.9
    LDPNet[48] None 0.8×106 67.3
    LRNNet[50] None 0.67×106 67.6
    HPNet[51] None 68.0
    BCPNet[52] MobileNet 0.61×106 67.8
    BSDNet[44] ResNet50 22.8×106 67.8
    FBSNet[46] None 0.62×106 68.9
    本文算法 None 0.68×106 68.86
    表  3  消融实验结果

    Table  3.   Ablation experiments results

    模块 融合方式 MRF mIoU/% 参数量
    相加 拼接 残差连接
    GLC 66.31 0.80×106
    GLC 67.22 0.67×106
    GLC 67.39 0.67×106
    (2,2,2,4,4,8,8,16,16) 67.39 0.67×106
    (2,2,2,2,4,4,8,8,16) 67.25 0.67×106
    (2,2,2,2,4,8,8,16,16) 67.61 0.67×106
    (2,2,2,2,2,4,8,8,16,16) 67.49 0.69×106
    (1,1,1,1,4,4,8,8,12) 68.15 0.67×106
    GLCNet 68.86 0.68×106
  • 收稿日期:  2022-09-29
  • 录用日期:  2022-11-07
  • 网络出版日期:  2022-11-30
  • 整期出版日期:  2024-11-30


