作者:沈晶; 顾国昌; 刘海波分层强化学习option人工免疫网络经验回放
摘要:分层强化学习中目前有Option、HAM和MAXQ三种主要方法,其自动分层问题均未得到有效解决,该文针对第一种方法,提出了Option自动生成算法,该算法以Agent在学习初始阶段探测到的状态空间为输入.采用人工免疫网络技术对其进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,从而生成Option,仿真实验验证了该算法的有效性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机工程与应用》(CN:11-2127/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
部级期刊
人气 230498 评论 65
人气 215177 评论 35
省级期刊
人气 213333 评论 71
北大期刊、统计源期刊
人气 193103 评论 73