基于函数近似的知识迁移

作者：谢岩松; 金海东; 陈冬火知识迁移强化学习相似任务v值

摘要：传统强化学习中,函数近似方法用于同一任务中不同状态之间的知识泛化。提出基于函数近似的知识迁移方法 KTBFA,实现不同任务之间的知识泛化与迁移。KTBFA方法在对状态-动作空间进行特征编码的基础上,使用线性函数逼近器近似表示Agent在源任务中学习到的V*值。近似函数作为知识迁移的表达形式,实现知识从源任务到目标任务的迁移。格子世界平台的实验结果表明,在相似任务中,基于KTBFA方法的Transfer-Q-learning算法的学习效率有非常大的提高。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

软件

《软件》（CN：12-1151/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《软件》注重刊登反映计算机应用和软件技术开发应用方面的新理论、新方法、新技术以及创新应用的文章。

杂志详情

服务推荐

软件相关期刊

基于函数近似的知识迁移

服务推荐

在线咨询

杂志订阅

期刊推荐

计算机光盘软件与应用

计算机应用与软件

电子技术与软件工程

软件导刊