基于强化学习的体系对抗仿真战役层次指控算法

作者：闫雪飞; 李新明; 刘东; 刘德生; 李强武器装备体系作战仿真强化学习grbf神经网络认知决策

摘要：针对传统的认知决策技术无法有效应对体系对抗环境具有的不确定性、未知性以及复杂性问题,提出一种基于强化学习（RL）的体系对抗仿真战役层次指控算法。介绍了包含侦察类、打击类、通信类、补给类、修复类以及指控类Agent的UML体系架构,对自主开发的作战仿真原型系统及其作战想定进行了说明,在对战役层次指控Agent认知域描述与假设的基础上,对改进Q-learning认知决策算法的参数归一化、基于GRBF神经网络的Q离散、基于TD公式的跨步差分机制以及网络结构的学习训练过程进行了详细说明。最后,通过地空一体化联合体系对抗仿真验证了算法的有效性,并通过对算法的大量可视化回溯分析发现,一定程度的火力协调以及不间断的战术机动对于作战效能的提升以及毁伤的减免具有重要的意义。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机工程与科学

《计算机工程与科学》（CN：43-1258/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机工程与科学》的办刊宗旨是为计算机界同行发表有创见的学术论文，介绍有特色的科研成果，探讨有新意的学术观点提供理想园地；活跃计算机界学术气氛，扩大国内外交流，为发展中国的计算机事业尽一点微薄之力。本刊强调学术性、及时性和普及性。

杂志详情

服务推荐

计算机工程与科学相关期刊

基于强化学习的体系对抗仿真战役层次指控算法

服务推荐

在线咨询

杂志订阅

期刊推荐

中国组织工程研究

网友世界

科学技术与工程

计算机光盘软件与应用