一种强化学习行动策略ε-greedy的改进方法

作者：李琛; 李茂军; 杜佳佳强化学习探索与利用

摘要：强化学习作为机器学习中的一种无监督式学习,在实际应用中的难点之一便是如何平衡强化学习中探索和利用之间的关系。在Q学习结合ε-greedy的基础上,提出了一种参数动态调整的策略。该策略是以学习者在学习过程中各状态下的学习状况为依据,实现参数的自适应,从而更好地平衡探索和利用之间的关系。同时,引入一种结合了试错法的动作删减机制,对备选动作集合进行"删减",来提高学习者的探索效率。最后通过迷宫问题的实验仿真,验证了所提方法的有效性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算技术与自动化

《计算技术与自动化》（CN：43-1138/TP）是一本有较高学术价值的大型季刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算技术与自动化》坚持理论与实践相结合的方针，跟踪世界最新科技动态，以其前沿的报道和新颖实用的内容，迅速向社会各界传递技术信息，为企业和科研院所架起联系的纽带和桥梁。

杂志详情

服务推荐

计算技术与自动化相关期刊

一种强化学习行动策略ε-greedy的改进方法

服务推荐

在线咨询

杂志订阅

期刊推荐

机械工程与自动化

控制与决策

自动化应用

兵工自动化