基于贝叶斯方法的多Agent强化学习

作者：郑顾平; 曹锦纲贝叶斯方法多agents强化学习

摘要：在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解.然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机.在多agents系统中,由于agents之间的协作使该问题更加复杂.为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理.同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

华北理工大学学报·自然科学版

《华北理工大学学报·自然科学版》（CN：13-1419/N）是一本有较高学术价值的大型季刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《华北理工大学学报·自然科学版》为社会科学理论刊物，以理论结合实际为特色坚持学术质量标准。本刊编排格式严格遵守现行的国家有关标准化、规范化规定望作者能严格执行。

杂志详情

服务推荐

华北理工大学学报·自然科学版相关期刊

基于贝叶斯方法的多Agent强化学习

服务推荐

在线咨询

杂志订阅

期刊推荐

佳木斯教育学院学报

赤峰学院学报·自然科学版

重庆科技学院学报·社会科学版

湖南科技学院学报