Research and implementation of multi-size aerial image positioning method based on CNN

PAN Haixia; XU Jialu; LI Jintao; WANG Yunhao; WANG Huafeng

doi:10.13700/j.bh.1001-5965.2019.0045

Volume 45 Issue 11

Nov. 2019

Turn off MathJax

Article Contents

Abstract

References

Journal of Beijing University of Aeronautics and Astronautics > 2019 > 45(11): 2170-2176.

GUO Jiangang, CHEN Peng, ZHENG Weiet al. Data fusion algorithm of multi-sensor redundant inertial navigation and its application in self-alignment[J]. Journal of Beijing University of Aeronautics and Astronautics, 2020, 46(12): 2211-2216. doi: 10.13700/j.bh.1001-5965.2019.0604(in Chinese)

Citation:

PAN Haixia, XU Jialu, LI Jintao, et al. Research and implementation of multi-size aerial image positioning method based on CNN[J]. Journal of Beijing University of Aeronautics and Astronautics, 2019, 45(11): 2170-2176. doi: 10.13700/j.bh.1001-5965.2019.0045(in Chinese)

Citation:

PDF( 3127 KB)

Research and implementation of multi-size aerial image positioning method based on CNN

doi: 10.13700/j.bh.1001-5965.2019.0045

1.
School of Software, Beihang University, Beijing 100083, China
2.
School of Electrical&Information Engineering, North China University of Technology, Beijing 100144, China

More Information

Corresponding author: WANG Huafeng. E-mail: wanghuafeng@buaa.edu.cn
Received Date: 13 Feb 2019
Accepted Date: 21 Jun 2019
Publish Date: 20 Nov 2019

Abstract

Abstract

Image positioning is the key of UAV visual navigation. Scene matching navigation is widely used in traditional UAV visual navigation. With the continuous development of computer technology, deep learning technology provides a new way for the realization of visual navigation. In this context, this research mainly focuses on image localization based on convolution neural network. In this paper, based on the vertical reconnaissance of UAV, the aerial image of flight area is divided into several grids of the same size, each grid represents a class of regions, and the convolutional neural network (CNN) is trained by making data sets of grid images. This paper designs a fully convolutional network model based on AlexNet, which integrates saliency features. It effectively implements a sliding window classifier with CNN multi-size input, and proposes a neighborhood saliency reference positioning strategy to filter the classification results, so as to realize the positioning of multi-size aerial images.
- multi-dimensional aerial image location,
- fully convolutional network,
- sliding window,
- saliency,
- feature fusion

FullText(HTML)

激光陀螺捷联惯导系统(Laser Strapdown Inertial Navigation System, LSINS)具有动态范围广、耐冲击振动、可靠性高等优点，远征一号、嫦娥探测器等空间飞行器及多数现役火箭均采用LSINS提供姿态、位置等导航信息。多表冗余惯导系统通过仪表冗余设计，显著提高系统的可靠性，国外如波音777飞机的FT/ADIRS (Fault-Tolerant/Air Data Inertial Reference System)容错大气数据参考系统和“德尔它”系列火箭的RIFCA (Redundant Inertial Flight Control Assembly)冗余激光捷联惯导系统^[1]等都采用了多表冗余设计。国内对多表冗余惯导系统进行了多年的研究与探索，已有多型采用三正交加斜置冗余配置的惯导系统得到工程应用，其中斜置冗余仪表仅用于故障检测。

空间飞行器等起飞前需要通过初始对准获得姿态初值，目前普遍使用光学瞄准方案。与光学瞄准相比，惯导自对准需要的设备和人力更少，操作流程大大简化，更符合当前低成本、快速发射的发展趋势^[2]。国内外的专家学者对晃动基座上的自对准技术进行了大量研究，提出了许多更优的自对准方案和自对准算法，显著提高了对准精度^[3-6]。

对于多表冗余惯导系统而言，冗余仪表用于故障检测和隔离，同时还可通过数据融合技术提高惯导系统的测量和导航精度^[7-10]。通过多传感器数据融合技术，充分利用所有的冗余测量数据，可以得到姿态和速度信息的最优估计值。数据融合技术可以有效抑制测量数据中的随机误差，为提高惯导系统自对准精度提供了另外一条有效途径。

本文基于某型多表冗余惯导系统，对数据融合技术在多表冗余惯导系统自对准中的应用及数据融合算法进行了研究。

1. 数据融合算法

1.1 惯导仪表构型

该型惯导系统采用三正交两斜置的十表(5只激光陀螺，5只石英加速度计)冗余设计，其中斜置仪表只用于判故。惯导系统中，陀螺和加速度计的安装定向方式如图 1所示，仪表测量矩阵如式(1)所示。

图 1 惯性仪表安装定向示意图

Figure 1. Schematic diagram of inertial instrument installation orientation

下载: 全尺寸图片幻灯片

图 1中，X₁Y₁Z₁为载体坐标系，OX₁为纵轴，OY₁为法向轴，OZ₁为横向轴；X_sY_sZ_s为惯导坐标系，OS轴正向与OX_s、OY_s、OZ_s轴正向的夹角分别为125.9°、46.6°、115.4°，OT轴正向与OX_s、OY_s、OZ_s轴正向的夹角分别为46.5°、56.5°、118.0°；向量G_i和A_i分别为第i只陀螺和第i只加速度计的测量轴向，i=x, y, z, s, t。

(1)

1.2 基于最小二乘的数据融合算法

最小二乘估计(Least Square Estimation, LSE)的特点是算法简单，不必知道与被估计量及量测量有关的任何统计信息^[11]。NASA的SIRU项目使用加权最小二乘(Weighted Least Squares Estimation, WLSE)算法进行冗余仪表的数据融合^[12]。

对于测量系统：

(2)

式中：X为n维状态矢量；Z为m维量测量；H为m×n维量测矩阵，m＞n；V为m维测量噪声，其均值为零，方差阵为R。

X的最小二乘估计为

(3)

当多组测量数据精度并不完全相同时，可根据其精度质量通过加权的方法进行区别对待，能够有效提高估计精度。式(3)中，X的加权最小二乘估计为

(4)

式中：W为适当取值的正定加权矩阵。

如果取W=R^－1，则称为马尔可夫估计，马尔可夫估计的均方误差比任何其他加权最小二乘估计的均方误差都要小^[13]。

惯导系统测量方程可以简化表示为

(5)

式中：N_g和N_a分别为陀螺和加速度计的测量输出，m维向量，m为陀螺或加速度计的数量；K_g和K_a分别为陀螺和加速度计的当量矩阵，m阶对角阵；D_g和D_a分别为陀螺和加速度计零偏，m维向量；dt为系统采样时间间隔；H_g和H_a分别为陀螺和加速度计的一次项系数矩阵，也即测量矩阵，m×3维，当不考虑零部件加工和安装误差时，H_g=H_a；Δθ和ΔV分别为载体在dt时间内的角增量和速度增量，3维向量；V_g和V_a分别为陀螺和加速度计的测量噪声，m维向量，均值为零，其方差阵分别为R_g和R_a。

Δθ和ΔV的加权最小二乘估计为

(6)

式中:W_g和W_a分别为陀螺和加速度计输出的加权矩阵。

Δθ和ΔV的马尔可夫估计为

(7)

1.3 算法精度分析

不考虑零部件加工和安装误差，陀螺和加速度计系统的测量矩阵均如式(1)所示，假设5只仪表(陀螺或者加速度计)的测量精度相同，输出标准差均为1σ。

1) 只使用正交仪表数据

3个轴向的输出标准差为

3个轴合成输出的标准差为

2) 同时使用5只仪表数据

根据式(3)所示的融合算法，可以计算出3个轴向的输出标准差分别为

3个轴合成输出的标准差为

由上可以看出，相较于只使用3个正交轴向仪表数据，通过数据融合同时使用5只仪表数据，可以有效降低惯导系统各个轴向及3个轴合成输出的噪声水平，3个轴合成标准差由降低到1.42σ，降低了18.2%。由于式(1)所示的系统测量矩阵在3个轴向并不对等，数据融合后对3个轴向输出噪声的改善也并不相同，其中X轴向提升最显著，噪声标准差由1σ降低到0.74σ，降低了26%。

2. Monte Carlo仿真

编写了MATLAB仿真计算程序，对静基座上的自对准进行仿真，仿真中惯导坐标系与地理坐标系(东北天坐标系)重合。工程上通常挑选精度较好的仪表安装在正交轴向，斜置方向仪表精度略差，如正交仪表精度为0.01 (°)/h左右，而斜置仪表精度范围为0.015~0.02(°)/h。因此，仿真中假设斜置仪表噪声标准差比正交仪表高50%，并使用马尔可夫估计进行数据融合。为对算法在不同仪表精度下的融合效果进行对比，共进行了4组不同精度的仿真，每组进行500次Monte Carlo打靶。分别通过：①只使用3只正交仪表数据直接解算；②通过式(7)进行5只仪表的数据融合，2种方法得到的自对准结果进行对比，偏航角的统计结果如表 1所示。

表 1 偏航角误差的Monte Carlo仿真结果对比

Table 1. Comparison of Monte Carlo simulation results of yaw angle error

序号	噪声标准差	三表解算		五表数据融合		比值
序号	噪声标准差	均值/(10^-5(°))	方差/(10^-4(°))	均值/(10^-5(°))	方差/(10^-4(°))	均值	方差
1组	σ_g=0.03 σ_a=0.001	1.21	0.095	1.12	0.079	0.93	0.83
2组	σ_g=0.06 σ_a=0.002	2.39	0.18	1.83	0.15	0.77	0.83
3组	σ_g=0.09 σ_a=0.003	3.47	0.27	3.30	0.24	0.95	0.89
4组	σ_g=0.12 σ_a=0.004	4.79	0.36	4.37	0.32	0.91	0.89
均值						0.89	0.86

下载: 导出CSV

| 显示表格

结果表明，相较于只使用正交仪表数据，通过数据融合同时使用5只仪表数据，可以有效提高惯导偏航角自对准精度，其中误差均值降低了11%，对准结果统计标准差降低了14%。这表明对于如式(1)所示的三正交两斜置惯导系统，即便斜置仪表精度显著低于正交仪表，通过数据融合，仍然能够显著提高惯导的自对准精度，使斜置冗余仪表数据得到充分利用。

3. 自对准试验和算法改进

3.1 静态自对准试验

为验证本文中数据融合算法的有效性，利用该型惯导系统在大理石平板上进行了静态自对准试验。5只激光陀螺的零偏稳定性在0.01 (°)/h左右。试验时，将惯组固联在六面体工装上，惯导按照地理坐标系(东北天坐标系)放置，工装靠紧大理石平板靠块，如图 2所示，对准时间5 min，共进行12组试验。

图 2 激光陀螺捷联惯导自对准试验

Figure 2. Self-alignment experiment of LSINS

下载: 全尺寸图片幻灯片

考虑试验现场条件无法获取惯导系统真实的航向基准，为了评估算法的有效性，采用在同一方位下进行多次对准，以多次对准结果的标准差的方法间接进行评估^[14]。每组试验数据分别通过3只正交仪表直接解算和5只仪表数据融合2种方法进行处理，得到Δθ和ΔV，然后进行自对准。

试验中使用如式(7)所示的马尔可夫估计进行数据融合，对2种方法的自对准结果进行对比，如表 2所示。只使用正交仪表直接解算时，偏航角的统计标准差为2.8′(1σ)，同时使用5只仪表数据进行数据融合时，偏航角的统计标准差为2.4′(1σ)，精度提高了14%。

表 2 偏航角自对准结果对比

Table 2. Self-alignment result comparison of yaw angles

序号	偏航角/(′)
序号	三表解算	五表数据融合
1	-7.5	-4.4
2	1.5	0.9
3	-3.9	-5.8
4	-2.1	-3.9
5	-5.7	-3.7
6	-7.5	-5.8
7	-0.3	-0.3
8	-0.3	-1.4
9	-0.2	-2.1
10	-2.1	0.1
11	-2.1	-3.6
12	-3.9	1.0
标准差	2.8	2.4

下载: 导出CSV

| 显示表格

3.2 加权矩阵的优化

该型惯导系统各仪表原始输出均为脉冲形式，间隔20 ms，输出脉冲数对应惯导在惯性坐标系下的角增量和速度增量。静态自对准试验时，由于地球自转角速度和重力加速度较小，导致仪表输出的量化误差明显。试验中仪表的一段输出数据如表 3所示，其中A_i和G_i(i=x, y, z, s, t)分别为第i只陀螺和加速度计的脉冲输出。同时，仪表输出噪声非白噪声形式，尤其是激光陀螺。因此，对仪表输出直接取方差不能反映仪表精度状况，影响了基于数据方差的马尔可夫估计的数据融合算法的效果。

表 3 仪表 20 ms脉冲增量输出

Table 3. Incremental pulse output of sensors with 20 ms interval

序号	A_x	A_y	A_z	A_s	A_t	G_x	G_y	G_z	G_s	G_t
1	0	0	49	-21	-23	0	0	0	0	0
2	0	-1	48	-21	-23	0	0	0	0	0
3	0	0	49	-21	-23	0	0	0	0	0
4	0	0	49	-20	-23	0	0	0	0	0
5	0	0	48	-21	-23	0	0	0	0	0
6	0	0	48	-21	-24	0	1	1	0	0
7	0	0	49	-21	-22	0	0	0	0	0
8	0	0	49	-21	-23	0	0	0	0	0
9	0	0	48	-21	-23	0	0	0	0	0
10	0	0	49	-21	-23	0	0	0	0	1

下载: 导出CSV

| 显示表格

惯性仪表的零偏稳定性是衡量仪表精度、影响导航误差的重要参数，同时仪表零偏稳定性也比较容易准确获得。因此，选择各仪表的零偏稳定性作为加权系数，构造如式(8)所示的加权矩阵，其中Ω_i(i=x, y, z, s, t)为第i只陀螺和加速度计的零偏稳定性。

(8)

使用如式(8)所示的加权矩阵和加权最小二乘估计的数据融合算法, 对试验数据重新进行处理，结果如表 4所示，偏航角的统计标准差为2.1′(1σ)。相较于马尔可夫估计，通过加权最小二乘算法和式(8)所示的加权矩阵进行数据融合，自对准精度进一步提高。

表 4 五表数据融合的偏航角自对准结果

Table 4. Self-alignment results of yaw angles by data fusion of five instruments

序号	偏航角/(′)
1	-4.3
2	1.0
3	-4.6
4	-3.0
5	-3.4
6	-5.1
7	-0.1
8	-0.9
9	-1.5
10	-0.2
11	-2.7
12	0.2
标准差	2.1

下载: 导出CSV

| 显示表格

多表冗余惯导系统在实际工程应用中需要先经故障诊断技术对故障仪表进行诊断隔离，再使用正常仪表完成系统重构。惯导系统自对准过程中，火箭受发射场阵风等干扰因素的影响，箭体产生顺风向和横风向晃动^[15]，但晃动频率较低、量级较小；同时可以通过地测对载荷和火箭惯导系统的输出进行地面判读。因此，初始对准过程中不用担心惯导系统冗余仪表的判故问题，上述数据融合算法有一定的工程实用价值。

4. 结论

基于某型三正交两斜置冗余的十表惯导系统，针对其自对准过程中的数据融合问题：

1) 通过分析和仿真，证明数据融合技术可以有效提高多表冗余惯导系统的自对准精度。

2) 开展惯导静态自对准试验，结果表明，相较于只使用正交仪表的数据，数据融合可以使斜置冗余仪表的数据得到充分利用，系统自对准精度提高了16%。

3) 在静态自对准试验的基础上，构造了基于仪表零偏稳定性的加权矩阵，改进后的算法比马尔可夫估计的略有提高。

References(19)

References

[1]	PREWITT J M S.Object enhancement and extraction[M]//LIPKIN B S, ROSENFELD A.Picture processing and psychopictorics.Salt Lake City: Academic Press, 1970: 75-149.
[2]	MARR D, HILDRETH E.Theory of edge detection[J].Proceedings of the Royal Society of London, 1980, 207(1167):187-217.
[3]	CANNY J.A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, 8(6):679-698.
[4]	HARRIS C, STEPHENS M.A combined corner and edge detector[C]//4th Alvey Vision Conference, 1988: 117-151.
[5]	SMITHSM, BRADYM.SUSAN-Anewapproachtolowlevel image processing[J].Intemational Joumal of Computer Vision, 1997, 23(1):45-78. doi: 10.1023/A%3A1007963824710
[6]	MIKOLAJCZYK K, SCHMID C.An affine invariant interest point detector[C]//Proceedings of European Conference on Computer Vision.Berlin: Springer, 2002: 128-142.
[7]	LOWE D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision, 2004, 60(2):91-110.
[8]	BAY H, TUVTELLARS T, VAN GOOL L.SURF: Speeded up robust features[C]//Proceedings of the European Conference on Computer Vision.Berlin: Springer, 2006: 404-417. doi: 10.1007/11744023_32
[9]	RUBLEE E, RABAUD V, KONOLIGE K, et al.ORB: An efficient alternative to SIFT or SURF[C]//IEEE International Conference on Computer Vision.Piscataway, NJ: IEEE Press, 2012: 2564-2571.
[10]	HAUSDORFF F.Grundzüge der mengenlehre[M].Von Veit:Grundzüge der mengenlehre, 1914:A34-A35.
[11]	HUTTENLOCHER D P, KLANDERMAN G A, RUCKLIDGE W J.Comparing images using the Hausdorff distance[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, 15(9):850-863.
[12]	DUBUISSON M P, JAIN A K.A modified Hausdorff distance for object matching[C]//Proceedings of the 12th International Conference on Pattern Recognition.Piscataway, NJ: IEEE Press, 1994: 566-568.
[13]	ZHAO C, SHI W, DENG Y.A new Hausdorff distance for image matching[J].Pattern Recognition Letters, 2005, 26(5):581-586. doi: 10.1016-j.patrec.2004.09.022/
[14]	BELONGIE S, MALIK J, PUZICHA J, et al.Shape context: A new descriptor for shape matching and object recognition[C]//Proceedings of the 13th International Conference on Neural Information Processing Systems.Cambridge: MIT Press, 2000: 831-837.
[15]	BELONGIE S, MALIK J, PUZICHA J.Shape matching and object recognition using shape context[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(4):509-522.
[16]	KRIZHEVSKY A, SUTSKEVER I, HINTON G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM, 2012, 60(6):84-90.
[17]	SERMANET P, EIGEN D, ZHANG X, et al.OverFeat: Integrated recognition, localization and detection using convolutional networks[EB/OL].(2013-12-21)[2019-02-10].https: //arxiv.org/abs/1312.6229.
[18]	HOU X, HAREL J, KOCH C.Image signature:Highlighting sparse salient regions[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(1):194-201.
[19]	OJALA T, PIETIKÄINEN M, MÄENPÄÄ T.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7):971-987.

Relative Articles

Supplements(0)

Cited By

Proportional views

Proportional views

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(8) / Tables(5)

Get Citation

PDF

XML

Article Metrics

Article views(869) PDF downloads(376)