分层强化学习中的Option自动生成算法

作者：沈晶; 顾国昌; 刘海波分层强化学习option人工免疫网络经验回放

摘要：分层强化学习中目前有Option、HAM和MAXQ三种主要方法，其自动分层问题均未得到有效解决，该文针对第一种方法，提出了Option自动生成算法，该算法以Agent在学习初始阶段探测到的状态空间为输入．采用人工免疫网络技术对其进行聚类，在聚类后的各状态子集上通过经验回放学习产生内部策略集，从而生成Option，仿真实验验证了该算法的有效性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机工程与应用

《计算机工程与应用》（CN：11-2127/TP）是一本有较高学术价值的大型半月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

计算机工程与应用相关期刊

分层强化学习中的Option自动生成算法

服务推荐

在线咨询

杂志订阅

期刊推荐

网友世界

计算机光盘软件与应用

计算机与网络

计算机仿真