基于深度强化学习的追逃博弈算法

作者：谭浪; 巩庆海; 王会霞导弹攻防对抗追逃博弈深度强化学习ddpg

摘要：在未来的局部战争中,导弹攻防对抗将成为一个重要的作战样式。用智能小车的追逃来模拟导弹攻防对抗过程,并以深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法为原型,以视距和视线角为状态,借鉴PID控制思想设计回报函数,提出了一种追逃博弈算法。该算法分别在数学仿真和智能小车实物上进行了验证,实验结果表明算法可以有效地控制小车使其完成追捕任务,并且具有很好的适应性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

航天控制

《航天控制》（CN：11-1989/V）是一本有较高学术价值的大型双月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

航天控制相关期刊

基于深度强化学习的追逃博弈算法

服务推荐

在线咨询

杂志订阅

期刊推荐

控制与决策

控制工程

电力系统保护与控制

电机与控制应用