一般和对策中基于协商的多强化学习

作者：张化祥; 赵彤; 黄上腾markov对策强化学习协商

摘要：一般和对策中,只考虑个体理性的多协作是一种无全局目标的协作.学习基于对手策略假设,不能保证假设的正确性.为此通过定义协作的集体目标,提出了一种基于多协商的强化学习算法.选择协商策略,并惩罚偏离该策略的来保证协商策略的执行.文中给出了学习收敛的条件及证明,并以实例加以分析.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

上海交通大学学报

《上海交通大学学报》（月刊）创刊于1956年，由中华人民共和国教育部主管，上海交通大学主办，CN刊号为：31-1466/U，自创刊以来，颇受业界和广大读者的关注和好评。《上海交通大学学报》主要刊载船舶与海洋工程、动力、机械、能源、材料、电气、电子、计算机、化工、生物工程、管理科学，以及数学、物理、工程力学等方面的最新研究成果。

杂志详情

服务推荐

上海交通大学学报相关期刊

一般和对策中基于协商的多强化学习

服务推荐

在线咨询

杂志订阅

期刊推荐

交通世界

佳木斯教育学院学报

赤峰学院学报·自然科学版

重庆科技学院学报·社会科学版