HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

改进GA3C求解POMDP的深度强化学习网络模型

作者:陈晓军; 康士伟ga3c求解pomdp问题学习网络模型

摘要:针对GA3C求解视频游戏中POMDP问题的特点,通过引入长短期记忆(Long-Short Term Memory, LSTM)保留游戏过程中多时间步的历史状态信息,与当前状态信息一同作为输入状态信息,该网络仅需对当前的1幅游戏截图进行预处理,网络输入状态空间的规模在每个训练时间步都得以缩小,只有原来传统网络的1/4,从而可以减小更新网络所需的计算量及存储要求,加快学习速度。同时LSTM有记忆机制,改进的网络模型将有利于加强求解POMDP问题的性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电脑编程技巧与维护

《电脑编程技巧与维护》(CN:11-3411/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《电脑编程技巧与维护》一直秉承"实用第一,智慧密集"的办刊宗旨,定位与从事电脑编程,计算机系统应用,计算机系统软件研发和维护人群,坚持"质量第一,读者为本"的原则,"与时俱进,不断创新"的办刊理念,紧紧跟踪计算机技术、网络技术、信息技术发展和应用的脚步,培养和造就具有高超编程技能、系统应用研发与维护能力的专业人员是杂志一贯遵循的目标。

杂志详情