最新无模型深度强化学习研究：从零开始训练机器人“玩乐高”

作者：Tuomas; Haarnoja; Vitchyr; Pong; Auric...机器人系统强化学习无模型型深训练学习方法人类学习基于模型

摘要：当人类学习一项新技能,往往是不断试错与计划的交织,机器也是如此.强化学习有基于模型的方法和无模型的方法.近日伯克利大学最新提出无模型深度强化学习方法-soft Q-learning（SQL）算法,该算法可以对模拟和现实世界的任务执行组合性,同时在该算法基础上提出了一种使用具有表达性的神经网络策略学习机器人操作技能的学习框架.该学习框架为学习各种机器人技能提供了一种有效的机制,并且在实际机器人系统的样本效率方面优于目前最先进的无模型深度强化学习方法.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

机器人产业

《机器人产业》（CN：10-1324/TP）是一本有较高学术价值的大型双月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

机器人产业相关期刊

最新无模型深度强化学习研究：从零开始训练机器人“玩乐高”

服务推荐

在线咨询

杂志订阅

期刊推荐

时代报告

外国文学研究

纺织报告

时事报告