留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

当期目录

2026年  第52卷  第2期

显示方式:
2026年, 第52卷, 第2期
icon下载 (23179) 119 icon预览
有翼飞行器编队协同突防构型和通信拓扑优化设计方法
徐星光, 于江龙, 郭鸿飞, 任章
2026, 52(2): 385-403. doi: 10.13700/j.bh.1001-5965.2023.0818
摘要:

有翼飞行器编队构型和通信拓扑优化在编队协同突防应用场景下有着迫切需求。针对编队构型优化中的参考基准选择和飞行器/拦截力量/战场之间关系的建模问题,提出一种基于突防通道的编队构型优化设计方法。通过通信拓扑优化获得领导者飞行器角色,先使用各组长的几何中心、后使用领导者飞行器作为编队构型的参考基准,设计时变编队构型的显式表达式,摆脱了对事先获取领导者飞行器先验信息的依赖;建立有翼飞行器突防通道模型,保证有翼飞行器在各战场栅格处的探测、反探测、机动规避能力优势;针对通信拓扑优化需要兼顾信息共享和均衡网络负载的问题,在编队构型约束下构建通信拓扑,提出基于最小生成树和最优刚性图的通信拓扑优化设计方法,给出基于战场威胁态势的拓扑切换策略,实现了编队构型和通信拓扑的优化。以有翼飞行器编队协同突防探测拦截威胁为例,验证了所提方法的有效性。

不确定环境下多机器人协同区域搜索与覆盖方法
曹凯, 陈阳泉, 魏云博, 高嵩, 阎坤, 丁羽菲
2026, 52(2): 404-414. doi: 10.13700/j.bh.1001-5965.2024.0379
摘要:

针对未知环境下的多机器人协同搜索和源定位问题,提出一种基于Voronoi图的分布式协同区域搜索和覆盖方法。该方法考虑机器人的实际尺寸和定位误差引起的碰撞问题,根据每个机器人的定位不确定性半径构造Voronoi缓冲区域以保障安全性。利用稀疏高斯过程回归和引入不确定正则项的质心Voronoi划分(CVT)算法重建未知浓度场的分布,并进行协同覆盖;提出一种自适应环境探索策略,实现无先验信息下的环境探索。仿真实验表明:所提方法能够快速完成对未知环境的探索,并准确定位到污染源的位置。

基于改进动态窗口法的离轴式全拖挂车辆主动避障
胡丹丹, 赵金聚, 牛国臣
2026, 52(2): 415-425. doi: 10.13700/j.bh.1001-5965.2024.0404
摘要:

针对普通乘用车的局部规划算法无法充分考虑整个拖挂系统,从而导致全拖挂车辆存在高碰撞风险的问题,提出一种针对离轴式全拖挂系统的改进动态窗口法(DWA),以实现无人全拖挂系统在非结构化道路下的主动避障。对牵引车速度进行采样,构成速度矢量空间,并根据系统约束和采样值,借助系统运动学模型预测两车体的运动轨迹;引入与目标点位置相关的子评价函数,提出一种符合全拖挂系统的评价函数;根据评价函数选择最优速度,确保系统安全抵达目标点。实验表明:所提方法在避障任务中具有可靠的安全性,在实车实验中,牵引车到障碍物边界的最小距离为0.83 m,全拖挂车辆到障碍物边界的最小距离为0.89 m。

韧性导向的机场航空器滑行路径及停机位分配联合优化
寇伟彬, 于凯任, 王佳玉, 张宇辉
2026, 52(2): 426-435. doi: 10.13700/j.bh.1001-5965.2023.0801
摘要:

为改善恶劣天气对航空器场面滑行的干扰程度,提升机场场面运行系统的恢复力,基于航空器滑行时间表征场面运行系统性能,通过刻画系统性能损失与恢复动态过程量化场面运行系统韧性。根据场面跑道、滑行道与停机坪间的拓扑网络结构,以韧性的提升作为优化核心,建立考虑滑行时间、旅客登机时间与系统韧性的航空器场面滑行路径及停机位分配联合优化模型。考虑到模型为复杂非线性规划模型,开发基于线性迭代的三阶段算法。结合天津滨海国际机场数据进行案例分析,结果表明:优化后的场面运行系统平均性能提升20.68%,恢复速率提升16.67%,系统韧性均值提升20.33%,韧性恢复速率提升27.15%。优化后的航空器场面滑行路径及停机位分配方案能够加快系统对恶劣天气的干扰适应,减少适应阶段性能损失,提升系统性能恢复速率,保障系统性能相对稳定。

基于因子图的主从式AUV协同定位算法
王苏, 黄鸿殿, 赵健文, 周红进, 李倩
2026, 52(2): 436-444. doi: 10.13700/j.bh.1001-5965.2024.0378
摘要:

针对无人自主水下航行器(AUV)集群高精度导航定位需求,提出一种基于因子图(FG)的主从式AUV协同定位算法。针对主从式AUV协同定位系统,构建系统状态方程和量测方程,并在此基础上构建相应因子图模型;根据和积算法(SPA)推导因子图中各节点间消息传递,通过因子图协同定位算法获得从艇位置变量节点概率密度函数(PDF)。利用陆上小车、GPS、惯性设备及数据链设备构建一主一从式协同定位试验平台并开展实际试验验证,结果表明:所提因子图协同定位算法相对于常规扩展卡尔曼滤波(EKF)协同定位算法,定位精度提高18.60%。同时,试验结果也表明测距误差对协同定位精度有较大影响。

基于MPC的多目标防撞优化算法
孙辉, 张学东, 孙连蔚, 杨凯欣, 王蕊
2026, 52(2): 445-452. doi: 10.13700/j.bh.1001-5965.2024.0381
摘要:

为避免飞机滑行时追尾风险并兼顾乘客的舒适性,提出一种基于模型预测控制(MPC)的多目标防撞优化算法。建立向运动学模型,考虑飞机滑行的安全性和乘客的舒适性设计目标函数及约束;以相对速度和间距作为参数,设计变权重函数,将其引入到MPC中,优化安全性权重,利用序列二次规划(SQP)算法对变权重MPC策略进行求解得到期望加速度,并对变权重MPC的稳定性进行分析。通过仿真实验验证所提算法在典型工况下的防撞效果,实验结果表明:所提算法在实现减速防撞的同时,优化了加速度变化幅度,提高了乘客舒适性。

具有同时到达约束的多无人机任务规划
任斯远, 王松, 陈功, 邓晨, 潘正宵
2026, 52(2): 453-462. doi: 10.13700/j.bh.1001-5965.2023.0783
摘要:

针对无人机(UAV)集群执行任务的问题,考虑无人机任务分配和航迹规划相互耦合的特性及禁飞区约束,提出一种能使无人机群以最短时间同时到达目标位置的任务规划算法。该算法通过Dubins曲线规划路径,使用引入粒子群变异的改进粒子群优化(PSO)算法对任务分配方案进行优化;采用“盘旋等待+动态速度调整”的方法同步各无人机到达目标时间;在基于无人机六自由度动力学模型和动态逆控制模型的仿真环境中对所提算法有效性进行评估验证。仿真结果表明:相比传统PSO算法,改进的PSO算法能够有效跳出局部最优,获得更优的分配方案;在所提算法的控制下,多无人机间飞行时间最大偏差仅有0.5%,满足饱和打击要求。

基于线性卷积混叠过程的自监督式光纤传感信号分离
陈照, 刘泽超
2026, 52(2): 463-469. doi: 10.13700/j.bh.1001-5965.2024.0409
摘要:

针对光纤传感信号分离问题,提出一种基于线性卷积混叠过程的自监督式信号分离方法,其主要包含3部分:线性卷积混叠模型、语义特征提取模型和基于查询的信号分离模型。在模型训练过程中,相比于线性叠加模型,线性卷积混叠模型可依据更贴合实际传感过程的线性卷积混叠方式对输入的多个子信号进行混叠,动态生成混叠信号,服务于后续基于查询的信号分离模型的自监督式学习;利用语义特征提取模型将某一子信号映射至特征空间;将其特征作为查询因子,并与混叠信号一起输入到基于查询的信号分离模型中,最终输出目标子信号,在可成倍扩充训练样本的同时,也可实现零样本条件下的目标信号分离。为验证所提方法的有效性,在室内环境下开展实验并采集了跑步时及单频正弦振动下的光纤传感信号及两者的混叠信号,且在该实测数据上的实验结果表明了所提方法的有效性。

一种面向隐身目标跟踪的雷达组网系统资源优化分配算法
黄洁瑜, 张浩为, 谢军伟, 李正杰, 齐铖, 丁梓航
2026, 52(2): 470-481. doi: 10.13700/j.bh.1001-5965.2023.0782
摘要:

传统集中式多输入多输出(MIMO)雷达组网探测过程中,通常利用雷达散射截面(RCS)统计模型进行资源优化。但隐身目标RCS具有动态起伏特性,这会导致目标跟踪精度下降甚至是目标丢失。针对此问题,提出一种面向隐身目标跟踪的集中式MIMO雷达组网系统波束及功率资源优化分配算法。利用协方差交叉(CI)融合滤波算法对目标状态进行估计,推导CI融合准则下的预测贝叶斯克拉美罗下界(BCRLB);基于目标RCS与雷达预测观测角度相关的特性对目标RCS进行预测,并以各个目标BCRLB加权和为目标函数,建立RCS预测模型下的波束及功率优化算法;设计一种基于贡献度的快速求解算法对模型进行求解。仿真结果表明:在隐身目标RCS动态起伏场景下,相比于RCS统计模型策略,所提算法能有效利用目标RCS信息实现更优的资源分配,进而提升隐身目标跟踪精度。

高机动飞机机翼机动载荷控制方法
赵卓林, 左林玄, 钱卫, 陈同银, 瓮哲, 王子安
2026, 52(2): 482-489. doi: 10.13700/j.bh.1001-5965.2023.0811
摘要:

高机动飞机的机动载荷是机体结构强度主要设计约束,对飞机的机体结构质量和飞行疲劳损伤情况影响较大。面向高机动飞机对更轻机体结构和更长飞行使用寿命的要求,提出以法向过载为反馈参数,通过操纵面动态偏转实施机翼机动载荷控制的方法,以常规布局高机动飞机的典型极限机动为研究对象,综合分析机翼操纵面偏转影响优选了载荷控制策略,并完成了不同门限启动控制策略的机翼机动载荷控制效果仿真分析。结果表明:以75%最大法向过载为启动门限,按选定的策略将操纵面动态偏转5°,即可达到将机翼弯矩峰值降低10%的控制效果,所提方法在降低高机动飞机机体承载能力要求和减轻高机动飞机机体疲劳损伤方面具有重要的应用潜力和前景。

基于拦截捕获区的“多对多”能量最优目标分配方法
李昊键, 黎克波, 梁彦刚
2026, 52(2): 490-497. doi: 10.13700/j.bh.1001-5965.2024.0330
摘要:

针对多拦截器与多目标交战(MME)场景的任务分配问题,从制导的角度入手,提出基于拦截捕获区的“多对多”能量最优目标分配方法。分析三维现实真比例导引(3D-RTPN)拦截任意机动目标的捕获区与最优制导能量消耗;以多拦截器成功拦截机动目标与整体能量消耗最低为优化目标,构建目标分配代价矩阵;基于适应性匈牙利算法(AHA)实现多拦截器的多目标分配(MMA)。通过数值仿真算例,验证了所提方法的有效性。

基于AHRS的无人机集群协同导航方法
史晨发, 熊智, 蒋旭, 李其杰, 王钲淳
2026, 52(2): 498-506. doi: 10.13700/j.bh.1001-5965.2024.0343
摘要:

为有效解决无人机集群在卫星部分拒止下的低成本导航定位问题,提出一种基于航姿参考系统(AHRS)的无人机集群协同导航方法。以AHRS作为基础完成三维位置状态递推模型设计;设计一种基于机间测距的分布式协同导航滤波器,利用构建的协同精度因子(CDOP)完成最优节点筛选,降低导航系统的计算负担;通过故障识别与隔离算法完成对受扰协同量测信息的诊断与系统重构;利用分布式协同导航算法完成位置解算。仿真与实验表明:协同导航方法能有效解决集群过度依赖卫星导航、大规模导航信息处理慢等难题,相较于传统多源融合算法有效降低了系统硬件成本,符合大规模无人机集群低成本下的高精度定位需求。

基于滑模观测器和非线性动态逆技术的舰载机直接升力控制
甄冲, 冯心钰
2026, 52(2): 507-515. doi: 10.13700/j.bh.1001-5965.2024.0373
摘要:

舰载机是航母战斗群的重要组成部分,在实际运用中有众多技术难点,而着舰技术是其中关键难点之一。针对舰载机系统的多变量耦合特点和着舰过程中环境复杂多变等问题,提出一种基于滑模观测器和非线性动态逆技术的舰载机直接升力控制系统。为补偿舰尾流对控制精度的影响,设计一种自适应滑模观测器,可以有效估计外界干扰对舰载机运动造成的影响。为实现控制输入之间的解耦,利用非线性动态逆控制技术,建立舰载机的直接升力控制系统,并提出自调节鸽群优化(SAPIO)算法用于整定控制系统参数,提升控制精度。仿真对比实验表明:所提舰载机直接升力控制系统相比传统比例-积分-微分控制系统着舰精度更高。

基于非线性优化双目VIO的在线时间偏差标定实现方法
曹梓育, 杨建华
2026, 52(2): 516-523. doi: 10.13700/j.bh.1001-5965.2024.0374
摘要:

基于非线性优化的双目视觉惯性里程计(VIO)系统在低纹理等环境下长时间运行误差累积问题严重。因此,针对基于非线性优化的双目VIO系统,提出在线时间偏差标定方法。所提方法充分发挥双目相机的优势,利用双目相机中的极线约束构建误差因子,减少特征点误匹配对时间偏差标定的负面影响,提高系统鲁棒性和状态估计的准确度,适用于低成本,自组装系统。在公开数据集上的实验表明:所提方法准确度更高,收敛速度更快,能够提高系统状态估计的准确度和鲁棒性。真实场景下的实验也验证了所提方法的有效性。

基于神经网络的地形等高线辅助导航
李睿, 汤浔, 都岩巍, 张睿, 许斌
2026, 52(2): 524-532. doi: 10.13700/j.bh.1001-5965.2024.0376
摘要:

针对地形高程匹配定位精度低及遍历搜索方式实时性差的问题,提出一种基于神经网络的地形等高线辅助导航方法。研究二维等高线特征匹配以提高匹配算法在高程噪声下的鲁棒能力,考虑小波变换具备旋转、平移不变性特点,利用小波变换子提取等高线边缘特征;同时提出基于神经网络的等高线边缘特征匹配算法,利用多个子网进行分类识别代替传统遍历搜索匹配过程,显著提高算法实时性及匹配准确度。仿真实验表明:所提算法与地形高程匹配相比匹配成功率提高30%以上,较基于遍历搜索的地形等高线匹配算法匹配时长缩短97%以上。

X射线安检图像高精度实时目标检测模型与基准数据集
支洪平, 孙立峰, 王旭
2026, 52(2): 533-540. doi: 10.13700/j.bh.1001-5965.2024.0459
摘要:

图像目标检测技术辅助提高了安检工作效率,进一步保障了公共安全。然而,不同型号安检机成像的差异性、X射线安检图像的复杂性及昂贵的数据标注成本制约了X射线安检图像目标检测技术的深入研究。为此,针对不同安检机厂商相同物质X射线成像颜色的差异,基于风格迁移算法进行数据集扩充,提高目标检测算法的泛化性;针对X射线安检图像中同类待识别物品尺寸的明显差异,提出一种细化的特征金字塔网络结构提取更加丰富的不同层次语义信息;为进一步提高检测精度,提出一个易于集成的细粒度分类模块,该模块能很好地适配主流目标检测模型。同时,构造一个大规模的基准数据集,包含56659张X射线安检图像,37种违禁品,每张图像均进行高质量标注。该公开X射线安检图像数据集包含的违禁品种类和图像数量较多。基于该X射线违禁品数据集进行对比实验,结果显示,所提模型结构较基线模型YOLOX-L的均值平均精度(mAP)提高约0.056。

基于深度强化学习的多无人车协同路径规划方法
戴晟潭, 王寅, 尚晨晨
2026, 52(2): 541-550. doi: 10.13700/j.bh.1001-5965.2024.0377
摘要:

为解决多无人车系统中的协同路径规划问题,利用深度强化学习方法,设计了一种高效的路径规划框架。构建基于双轮差速无人车的运动学模型和协同避障场景的数学模型;在此基础上,进一步分析深度强化学习在处理高维度状态空间和连续动作空间等复杂动态场景时训练速度慢、采样效率低和适应能力差的机理,为多无人车协同路径规划研究提供理论基础。针对全部可观测条件下多无人车协同路径规划避障围捕的策略生成问题,提出改进双延迟深度确定性策略梯度(AE-TD3)算法,在围捕无人车输出的动作上添加来自高斯分布的随机噪声,并权衡探索或利用输出动作,使围捕无人车在未知环境中能更有效地探索,实现多无人车高效稳定的协同避障围捕。仿真实验表明,改进算法相较于双延迟深度确定性策略梯度(TD3)算法,平均奖励的收敛速度更快,围捕时间缩短16.7%,验证了改进算法的可行性。

面向无拖曳稳态建立的抗扰模型预测控制
贺雄峰, 卢苇, 许诺, 周齐贤, 王鹏程, 张永合
2026, 52(2): 551-560. doi: 10.13700/j.bh.1001-5965.2024.0380
摘要:

为提升深空引力波探测任务中检验质量释放阶段的控制器抗干扰性能,提出一种面向检验质量稳态建立的基于扰动观测器(DOB)的渐进管道模型预测控制(MPC)方法。采用DOB提高控制器抗干扰性能,利用虚拟回路技术将DOB的设计问题归结为标准$ {H}_{\mathrm{\infty }} $混合灵敏度优化问题,并实现高精度估计。同时,设计渐进管道MPC,利用有效集法求解优化问题,结合DOB的扰动估计值实现强干扰和强执行约束下的高精度检验质量抗扰控制。在航天器-双检验质量全自由度仿真平台上进行仿真验证,在基本噪声及干扰的基础上引入0.1 Hz的正弦干扰和阶跃干扰,结果表明:DOB对扰动实现了准确估计,所提方法能够在干扰下实现对检验质量的高精度控制,同时,对量测噪声起到抑制作用。

考虑攻击时间和视线角度约束的预定时间收敛协同制导方法
常亚南, 王先至, 李国飞
2026, 52(2): 561-569. doi: 10.13700/j.bh.1001-5965.2024.0395
摘要:

基于预定时间收敛一致性理论,设计多飞行器区域封控约束协同拦截制导律。视线(LOS)方向设计预定时间收敛协同制导律,使多个飞行器命中时间误差和命中时间一致性误差收敛到零,命中时间趋于一致,满足指定时间同时命中要求;视线法向结合滑模控制方法设计预定时间收敛滑模面和视线角约束制导律,使各飞行器视线角误差、视线角速率收敛到零,实现多个飞行器按各自指定视线角命中目标,满足期望视线角度要求。视线方向和视线法向的设计使预定时间收敛协同制导律能够同时满足攻击时间和视线角度的双重约束。理论分析表明,所设计的制导方法可保证多飞行器以期望视线角度同时命中目标。仿真结果验证了所提方法的正确性和有效性。

超视距空战全域火力场计算及态势威胁评估和辅助决策应用
曹玥瑶, 薛涛, 何闪闪, 艾剑良, 董一群
2026, 52(2): 570-580. doi: 10.13700/j.bh.1001-5965.2024.0399
摘要:

针对超视距(BVR)空战态势威胁评估问题,提出一种基于全域火力场的空战态势威胁评估方法,基于超视距空战载机、设备特征,开展离线单机全域火力场数值计算和在线多机聚合全域火力场计算,克服了传统态势威胁评估方法主观性强、不满足实时计算需求等缺陷。考虑导弹导引头探测误差及导弹舵机响应时延,建立超视距空战仿真环境;考虑飞行员操纵行为偏差,划分机动动作关键决策点并引入正态分布的关键决策点控制量散布,基于蒙特卡罗法,统计载机空战胜率,离线计算单机全域火力场;基于独立概率事件假设在线计算多机聚合全域火力场;计算全域火力场的梯度特征表征模型,并针对一对一超视距空战场景,设计辅助决策系统。实验计算结果有效验证了全域火力场的概念设计和计算方法,为基于全域火力场的超视距空战态势威胁评估和辅助决策系统设计提供了支撑。

基于神经网络控制器的无人机安全降落算法
易绍鹏, 董伟, 王炜琳, 王春彦, 易爱清, 王佳楠
2026, 52(2): 581-588. doi: 10.13700/j.bh.1001-5965.2024.0402
摘要:

通过结合控制障碍函数与神经网络控制器,提出一种无人机安全降落控制策略。对控制障碍函数和无人机动力学模型进行了介绍,为后续的算法设计提供了理论基础。通过水平集方法构造控制障碍函数,并将其与神经网络控制器相结合,提出一种在避障和安全降落过程中均能有效保障无人机安全的控制策略。对所提算法进行仿真实验,验证了所提控制策略在避障和安全降落方面的有效性,展示了无人机在机动能力受限及姿态约束下的安全避障能力。对所提算法的效果进行总结,并对未来研究的方向进行了展望。

基于自适应神经网络的四旋翼无人机固定时间指令滤波控制
聂黎, 李臣亮, 刘旺魁, 沈海东, 刘燕斌, 陈金宝
2026, 52(2): 589-598. doi: 10.13700/j.bh.1001-5965.2024.0403
摘要:

针对四旋翼无人机在外部扰动和模型不确定性下的姿态跟踪问题,设计了一种基于自适应径向基函数(RBF)神经网络的固定时间指令滤波控制方法。设计了一种基于双曲正切函数的固定时间指令滤波器,避免了虚拟控制律推导过程中存在的“微分爆炸”问题,消除了传统滤波器由于引入分数阶而产生的奇异现象;利用RBF神经网络对模型不确定性进行逼近,并根据跟踪偏差设计了神经网络权值的自适应调节律,改善了在线逼近效果;此外,结合反步法和干扰观测器,设计了四旋翼无人机固定时间控制律,通过干扰观测器对外界扰动进行估计和补偿,实现了对目标姿态的快速、准确跟踪。基于Lyapunov理论严格证明了该方法的固定时间稳定性,并通过数值仿真验证了所提方法的有效性。

基于Hp自适应伪谱法的飞机速度矢量控制优化
孔令玮, 李卫琪
2026, 52(2): 599-609. doi: 10.13700/j.bh.1001-5965.2024.0405
摘要:

采用Hp自适应伪谱法对速度矢量控制问题进行优化求解。建立基于航迹坐标系的非线性飞机动力学模型,建模时将飞机的过载、推力及滚转的动态响应以动态环节形式进行描述,并通过路径约束实现了实际飞行控制律中的迎角限制功能。通过对控制量、状态量及目标函数的设定实现不同的战术需求,进而利用伪谱法进行优化求解。仿真结果验证了基于Hp自适应伪谱法的速度矢量控制优化的有效性,并展示了在特定场景中处理各种约束的可行性。

轻量化低慢小无人机多目标检测及跟踪方法
樊小冬, 谭天一, 吴江
2026, 52(2): 610-619. doi: 10.13700/j.bh.1001-5965.2024.0406
摘要:

为有效地探测城镇、厂区等复杂环境中的低慢小无人机(UAV)目标,提出一种轻量化多无人机目标视觉检测及跟踪方法。该方法以CenterNet目标检测算法为基础,通过引入多层次特征融合和快速空间金字塔池化(SPPF)结构,并采用MobileNet轻量化主干网络,实现对小型无人机目标的准确检测。为解决长焦相机跟踪无人机目标过程中的不稳定问题,提出一种基于优化DeepSORT的无人机多目标跟踪方法。采用自适应噪声卡Kalman波器进行目标轨迹预测,同时引入相机运动补偿模块和BYTE目标关联算法,以实现对多个无人机目标的准确跟踪。构建小型无人机目标检测及跟踪数据集,对算法进行训练和测试,并在嵌入式设备Jetson NX上进行部署验证。实验结果显示,所提算法平均模型参数量减少了56.9%,mAP提高了1.18%,平均计算量减少了66.5%。在Jetson NX上,单帧图像平均处理时间为36.4 ms,平均模型大小为14.5 MB。该算法具有较好的检测准确性和运行实时性,适用于算力较小的边缘设备部署。

博弈环境下的多无人机系统协同路径规划
范芮滔, 刘昊, 程明, 马超群, 刘大卫
2026, 52(2): 620-626. doi: 10.13700/j.bh.1001-5965.2024.0481
摘要:

研究了博弈环境下多无人机系统在模型动力学不确定和输入受限条件下的协同路径规划问题。在博弈环境中,我方无人机需要通过协同路径规划捕获对方无人机,并考虑避开禁区和避碰。首先,提出一种基于注意力机制的长短期记忆(LSTM)模型来预测对方无人机的轨迹,帮助我方无人机进行后续的协同路径规划。然后,通过构造性能函数,将协同路径规划问题转化为输入受限条件下的最优控制问题。提出一种基于历史数据的不依赖于模型参数的积分强化学习方法,实现了输入受限条件下的最优控制。仿真结果验证了所提方法的有效性。

常见问答