作者:程玉虎; 易建强; 王雪松; 赵冬斌连续状态空间连续动作空间加权q学习神经气算法径向基网络
摘要:针对连续状态与动作空间下的控制问题,提出了一类连续状态与动作空间下的加权Q学习算法,应用改进的增长神经气算法动态构建径向基网络的隐含层,实现状态空间的自适应构建.在基于径向基网络实现的标准Q学习基础上,利用加权Q学习算法用以解决具有连续动作输出的控制问题.仿真实例验证了所提算法的有效性.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《电机与控制学报》(CN:23-1408/TM)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《电机与控制学报》刊登范围:电机与电器、电力电子与电力传动、电力系统及其自动化、电工理论与新技术、高电压与绝缘技术、测试计量技术与仪器、控制理论与控制工程、检测技术与自动化装置、导航制导与控制、机器人控制等方面具有原创性、创新性、先进性的科研成果和学术论文。
省级期刊
人气 238519 评论 36
人气 154106 评论 33
人气 151784 评论 53
人气 123116 评论 54