基于增强学习的无人直升机姿态控制器设计

作者：蔡文澜王俊生税海涛马宏绪黄茜薇无人直升机增强学习自适应启发评价策略梯度pegasus

摘要：自适应启发评价（AHC）增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数．策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。通过将AHC增强学习和策略梯度增强学习相结合，对PID控制器参数进行在线自适应整定，实现对无人直升机姿态控制性能的在线优化。仿真结果表明．与固定PID参数控制器相比，该算法能在线调整控制器参数．并很好地控制了无人直升机的悬停姿态。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

弹箭与制导学报

《弹箭与制导学报》（CN：61-1234/TJ）是一本有较高学术价值的大型双月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《弹箭与制导学报》办刊宗旨是报道导弹、制导、控制、导航、弹药、火箭、弹道、气动力、模拟及相关技术领域的学术论文，报道该专业领域最新研究动态和科研成果，为该专业领域的科研、生产、教学、部队使用服务。

杂志详情

服务推荐

弹箭与制导学报相关期刊

基于增强学习的无人直升机姿态控制器设计

服务推荐

在线咨询

杂志订阅

期刊推荐

佳木斯教育学院学报

赤峰学院学报·自然科学版

重庆科技学院学报·社会科学版

湖南科技学院学报