对称和非对称的启发式多Agent再励学习方法

作者：张新良; 石纯一多agent系统再励学习启发式算法

摘要：针对解决对传统的多Agent再励学习算法中，Agent只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个Agent而没有推广到多Agent的情况，给出了对称和非对称环境下的基于启发式的多Agent再励学习算法。该算法基于Agent之间的通信来获取其它Agent的历史信息，以及动作选择策略，结合启发式算法思想，达到Agent在学习过程中的合作的目的，最终提高学习的效率。以2个Agent的2个状态3个动作选择为例，表明该算法的收敛速度高于传统分布式再励学习算法的收敛速度。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

清华大学学报·自然科学版

《清华大学学报·自然科学版》（CN：11-2223/N）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

清华大学学报·自然科学版相关期刊

对称和非对称的启发式多Agent再励学习方法

服务推荐

在线咨询

杂志订阅

期刊推荐

科技风

魅力中国

科学与财富

科学中国人