HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

对称和非对称的启发式多Agent再励学习方法

作者:张新良; 石纯一多agent系统再励学习启发式算法

摘要:针对解决对传统的多Agent再励学习算法中,Agent只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个Agent而没有推广到多Agent的情况,给出了对称和非对称环境下的基于启发式的多Agent再励学习算法。该算法基于Agent之间的通信来获取其它Agent的历史信息,以及动作选择策略,结合启发式算法思想,达到Agent在学习过程中的合作的目的,最终提高学习的效率。以2个Agent的2个状态3个动作选择为例,表明该算法的收敛速度高于传统分布式再励学习算法的收敛速度。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

清华大学学报·自然科学版

《清华大学学报·自然科学版》(CN:11-2223/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情