一种基于启发式轮廓表的逻辑强化学习方法

作者：刘全高阳陈道蓄孙吉贵姚望舒维数灾启发式轮廓表谓词逻辑强化学习cclorrl算法

摘要：强化学习通过试错与环境交互获得策略的改进，其自学习和在线学习的特点使其成为机器学习研究的一个重要分支．针对强化学习一直被“维数灾”问题所困扰的问题，提出在关系强化学习的基础上，引入启发式轮廓表的方法，采用含轮廓表的一阶谓词表示状态、活动和Q-函数，充分发挥Prolog表的优势，将逻辑谓词规则与强化学习相结合，形成一种新的逻辑强化学习方法——CCLORRL，并对其收敛性进行了证明．该方法使用轮廓形状谓词产生形状状态表，大幅度地减少状态空间；利用启发式规则指导动作的选择，减少了样本中不存在状态选择的盲目性．CCLORRL算法应用于俄罗斯方块中，实验表明，该方法是比较高效的．

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机研究与发展

《计算机研究与发展》（CN：11-1777/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

计算机研究与发展相关期刊

一种基于启发式轮廓表的逻辑强化学习方法

服务推荐

在线咨询

杂志订阅

期刊推荐

网友世界

计算机光盘软件与应用

计算机与网络

计算机仿真