北京航空航天大学学报 ›› 2019, Vol. 45 ›› Issue (11): 2170-2176.doi: 10.13700/j.bh.1001-5965.2019.0045

• 论文 • 上一篇    下一篇

基于CNN的多尺寸航拍图像定位方法的研究与实现

潘海侠1, 徐嘉璐1, 李锦涛1, 王赟豪1, 王华锋1,2   

  1. 1. 北京航空航天大学 软件学院, 北京 100083;
    2. 北方工业大学 信息学院, 北京 100144
  • 收稿日期:2019-02-13 出版日期:2019-11-20 发布日期:2019-11-30
  • 通讯作者: 王华锋.E-mail:wanghuafeng@buaa.edu.cn E-mail:wanghuafeng@buaa.edu.cn
  • 作者简介:潘海侠 女,博士,副教授。主要研究方向:人工智能、模式识别、计算机视觉与图像处理;王华锋 男,博士,副教授。主要研究方向:图像识别、基于图像的测量。

Research and implementation of multi-size aerial image positioning method based on CNN

PAN Haixia1, XU Jialu1, LI Jintao1, WANG Yunhao1, WANG Huafeng1,2   

  1. 1. School of Software, Beihang University, Beijing 100083, China;
    2. School of Electrical&Information Engineering, North China University of Technology, Beijing 100144, China
  • Received:2019-02-13 Online:2019-11-20 Published:2019-11-30

摘要: 图像定位常用于无人机视觉导航,传统的无人机视觉导航广泛采用景象匹配导航方式,随着计算机技术的不断发展,深度学习技术为视觉导航的实现提供了新途径。以无人机的垂直侦查为背景,将飞行区域的航拍图像划分成大小相同的若干网格,每个网格代表一类区域,用网格图像制作数据集训练卷积神经网络(CNN)。基于AlexNet设计了一种融合显著性特征的全卷积网络模型,有效实现了一个基于CNN的多尺寸输入的滑动窗口分类器,并提出了一种邻域显著性参照定位策略来筛选分类结果,从而实现多尺寸航拍图像的定位。

关键词: 多尺寸航拍图像定位, 全卷积网络, 滑动窗口, 显著性, 特征融合

Abstract: Image positioning is the key of UAV visual navigation. Scene matching navigation is widely used in traditional UAV visual navigation. With the continuous development of computer technology, deep learning technology provides a new way for the realization of visual navigation. In this context, this research mainly focuses on image localization based on convolution neural network. In this paper, based on the vertical reconnaissance of UAV, the aerial image of flight area is divided into several grids of the same size, each grid represents a class of regions, and the convolutional neural network (CNN) is trained by making data sets of grid images. This paper designs a fully convolutional network model based on AlexNet, which integrates saliency features. It effectively implements a sliding window classifier with CNN multi-size input, and proposes a neighborhood saliency reference positioning strategy to filter the classification results, so as to realize the positioning of multi-size aerial images.

Key words: multi-dimensional aerial image location, fully convolutional network, sliding window, saliency, feature fusion

中图分类号: 


版权所有 © 《北京航空航天大学学报》编辑部
通讯地址:北京市海淀区学院路37号 北京航空航天大学学报编辑部 邮编:100191 E-mail:jbuaa@buaa.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发