作者:刘新宇; 洪炳镕强化学习足球机器人协作策略编程增量系统稳定性理论框架进化概率
摘要:利用强化学习方法实现足球机器人协作策略。对于不同情况,分别将零和策略及一般和策略作为强化学习的理论框架,并且借助概率增量编程进化提高系统的稳定性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《高技术通讯》(CN:11-2770/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。