北京航空航天大学学报 ›› 2020, Vol. 46 ›› Issue (9): 1635-1642.doi: 10.13700/j.bh.1001-5965.2020.0042

• 论文 • 上一篇    下一篇

面向个体人员特征的跨模态目标跟踪算法

周千里1,2, 张文靖1, 赵路平1, 田乃倩1, 王蓉1,3   

  1. 1. 中国人民公安大学 警务信息工程与网络安全学院, 北京 100038;
    2. 北京市公安局, 北京 100740;
    3. 安全防范技术与风险评估公安部重点实验室, 北京 100038
  • 收稿日期:2020-02-21 发布日期:2020-09-22
  • 通讯作者: 王蓉 E-mail:dbdxwangrong@163.com
  • 作者简介:周千里 男,博士研究生。主要研究方向:计算机视觉;张文靖 男,博士研究生。主要研究方向:计算机视觉;赵路平 女,硕士研究生。主要研究方向:单目标跟踪;田乃倩 女,硕士研究生。主要研究方向:单目标跟踪;王蓉 女,博士,教授,博士生导师。主要研究方向:计算机视觉。
  • 基金资助:
    国家重点研发计划(A19808);中国人民公安大学基本科研业务费年度重大项目(2019JKF111)

Cross-modal object tracking algorithm based on pedestrian attribute

ZHOU Qianli1,2, ZHANG Wenjing1, ZHAO Luping1, TIAN Naiqian1, WANG Rong1,3   

  1. 1. Police Information Engineering and Network Security College, People's Public Security University of China, Beijing 100038, China;
    2. Beijing Municipal Public Security Bureau, Beijing 100740, China;
    3. Key Laboratory of Security Technology and Risk Assessment, Beijing 100038, China
  • Received:2020-02-21 Published:2020-09-22
  • Supported by:
    National Key R & D Program of China (A19808); The Operating Expenses of Basic Scientific Research Project of the People's Public Security University of China (2019JKF111)

摘要: 针对类内干扰影响基于个体人员特征目标跟踪算法的精确性和鲁棒性问题,分析当前跟踪算法在个体人员跟踪方面存在的不足,提出了利用语言先验知识引导辅助跟踪器的方法。在视觉跟踪器的基础上增加语言引导分支,对跟踪目标产生注意力,从而减少对类内干扰的影响。利用位置置信度进行回归目标框定位的方法解决基于孪生网络目标跟踪算法中利用分类置信度定位候选目标框的局限性,实现跨模态信息融合提升特定目标跟踪的精度。为提升所提模型对特定人员目标跟踪的针对性,构建了跨模态的人员目标跟踪数据集用于训练和验证。实验表明:所提模型应用于个体人员跟踪时表现更佳,其有效性得到了证明。

关键词: 目标跟踪, 孪生网络, 跨模态, 数据集, 语言先验

Abstract: The accuracy and robustness of the object tracking algorithm have been influenced by the intra-class interference when tracking pedestrian. In this paper,we analyze the drawbacks of current tracking algorithms and propose a model to combine the visual feature and language priori to improve the performance of the tracker.The language guided branch is added to supervise the visual tracking branch by generating the attention, so the intra-class interference can be alleviated.We also propose a method to improve the accuracy of thecross-modal object tracking based on the location confidence instead of classification confidence for siamese trackers.To validate our method, we customize the dataset specialized for pedestrian tracking. The experiment shows the effectiveness of this model.

Key words: target tracking, siamese network, cross-modal, dataset, language priori

中图分类号: 


版权所有 © 《北京航空航天大学学报》编辑部
通讯地址:北京市海淀区学院路37号 北京航空航天大学学报编辑部 邮编:100191 E-mail:jbuaa@buaa.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发