一般和博弈中的合作多agent学习

作者：宋梅萍; 顾国昌; 张国印; 刘海波多agent学习一般和随机博弈nash平衡pareto占优

摘要：理性和收敛是多agent学习研究所追求的目标．在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习，使agent更具理性．另一方面引入社会公约来启动和约束agent的推理，统一系统中所有agento决策，从而保证学习的收敛性．利用2人栅格游戏对多种算法进行验证，成功率的比较说明了所提算法具有较好的学习性能．

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

控制理论与应用

《控制理论与应用》（CN：44-1240/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《控制理论与应用》主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中，特别是高科技领域中的应用研究成果。

杂志详情

服务推荐

控制理论与应用相关期刊

一般和博弈中的合作多agent学习

服务推荐

在线咨询

杂志订阅

期刊推荐

医学理论与实践

理论观察

教育发展研究

学园