HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

伯克利AI研究院利用反向课程学习,改善强化学习智能体

作者:Wieland; Brendel; Jonas; Rauber; Matth...智能体起始位置强化学习ai奖励函数

摘要:众所周知,强化学习(RL)是一种强大的技术,它能够解决诸如移动(locomotion)、Atari游戏、赛车游戏以及机器人操作等复杂的任务,而这些全部是通过在一个奖励函数上训练智能体以其优化行为实现的。但是,对于许多任务来说,我们很难设计一个既容易训练又能产生理想行为的奖励函数。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

机器人产业

《机器人产业》(CN:10-1324/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情