HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一般和对策中基于协商的多强化学习

作者:张化祥; 赵彤; 黄上腾markov对策强化学习协商

摘要:一般和对策中,只考虑个体理性的多协作是一种无全局目标的协作.学习基于对手策略假设,不能保证假设的正确性.为此通过定义协作的集体目标,提出了一种基于多协商的强化学习算法.选择协商策略,并惩罚偏离该策略的来保证协商策略的执行.文中给出了学习收敛的条件及证明,并以实例加以分析.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

上海交通大学学报

《上海交通大学学报》(月刊)创刊于1956年,由中华人民共和国教育部主管,上海交通大学主办,CN刊号为:31-1466/U,自创刊以来,颇受业界和广大读者的关注和好评。 《上海交通大学学报》主要刊载船舶与海洋工程、动力、机械、能源、材料、电气、电子、计算机、化工、生物工程、管理科学,以及数学、物理、工程力学等方面的最新研究成果。

杂志详情