一种大规模离散空间中的高斯强化学习方法

作者：周文云刘全李志涛强化学习维数灾高斯过程回归函数分布

摘要：针对大规模离散空间中强化学习的“维数灾”问题，即状态空间的大小随着特征的增加而发生指数级的增长，提出了一种基于高斯过程的强化学习方法。在本方法中，高斯过程模型有表示函数分布的能力，使用该模型之后，可以得到的不只是一个所需的估计值，而是关于该值的一个分布。实验结果表明，结合了高斯过程的强化学习方法在各方面性能，如收敛速度以及最终实验效果等都有所提高。使用高斯方法的回归模型可以在一定程度上解决大规模离散空间上的“维数灾”问题。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机科学

《计算机科学》（CN：50-1075/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机科学》报导国内外计算机科学与技术的发展动态，以其新颖、准确、及时为特色，突出动态性、综述性、学术性，“前沿学科”与“基础研究”相结合；“优秀技术”与“支撑技术”相结合；“倡导”与“争鸣”相结合。

杂志详情

服务推荐

计算机科学相关期刊

一种大规模离散空间中的高斯强化学习方法

服务推荐

在线咨询

杂志订阅

期刊推荐

科技风

魅力中国

科学与财富

科学中国人