作者:涂浩; 刘洪星游戏人工智能行为决策q学习行为树
摘要:游戏中的非玩家角色(NPC)通过学习获得智能,因此学习算法的设计是一个关键问题。提出一种改进型Q学习算法(SA-QL),它以模拟退火算法为基础,在状态空间、探索策略、报酬函数等方面改进了Q学习算法的不足。将该算法运用到行为树的设计中,使NPC能在游戏过程中实时学习,调整行为树中逻辑行为的最佳执行点,从而产生合适的行为响应。实验结果表明,SA—QL算法比传统Q学习算法效率更高,控制NPC的效果更好。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社