HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于奖励机制的agent联盟形成策略

作者:李剑; 景博; 杨义先多智能体联盟奖励策略

摘要:为了解决多智能体系统中agent在形成联盟的时候不能同时保持系统全局优化解和联盟的稳定性问题,提出了一种联盟形成时的奖励策略,对于在联盟中执行任务的agent给以适当奖励,从而使得联盟在达到全局最优化解的同时保持稳定.在实验中,以Postman问题作为例子,对三种联盟形成策略即Shapley值策略、均分策略和奖励策略进行了比较.数据表明Shapley值策略和均分策略的时效性差,并且不能保证联盟的稳定性.相反,奖励策略是最有效的,它可以使得联盟达到全局优化解的同时保持稳定,并且时效性好.最后对奖励策略进行了性能分析,从理论上证明了奖励策略的优越性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子学报

《电子学报》(CN:11-2087/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情