HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于强化学习的无人机自主机动决策方法

作者:孙楚; 赵辉; 王渊; 周欢; 韩瑾无人作战飞机机动决策强化学习连续动作神经网络

摘要:提出了一种基于连续动作集强化学习的无人机机动决策方法。通过Actor-Critic强化学习构架下的NRBF神经网络输出状态真实效用值与连续动作控制变量,效用值与动作控制变量的输出层共用隐层以简化网络结构。结合相对熵理论设计隐层节点的自适应调整方法,有效减少了隐层节点数目。对输出动作控制变量,采用基于高斯分布的连续动作选择策略,并依据训练次数调整随机动作控制变量的概率分布,提升了网络对未知策略的探索能力。在3种不同空战态势下的仿真验证了该方法的有效性,结果表明该方法生成的策略鲁棒性较强,动作控制量更加精确。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

火力与指挥控制

《火力与指挥控制》(月刊)创刊于1976年,由中国兵器工业集团有限公司主管,北方自动控制技术研究所主办,CN刊号为:14-1138/TJ,自创刊以来,颇受业界和广大读者的关注和好评。 《火力与指挥控制》主要刊载国内外火控指控技术及有关高新技术、发生动态的综述性文章;各类火控系统、战术指挥控制系统及战场数字化信息系统总体设计、系统分析、作战效能评估、仿真建模方法等论文。

杂志详情