策略梯度论文_学术之家

HI，欢迎来到学术之家，发表咨询：400-888-7501 订阅咨询：400-888-7502 股权代码 102064

经营许可杂志订阅支付方式

首页期刊杂志 SCI 发表出版社

0

首页论文大全策略梯度论文列表

期刊分类

不限

期刊收录

不限

CSSCI 南大期刊
北大期刊
CSCD中国科学引文数据库
统计源期刊
知网收录
维普收录
万方收录
EI工程索引
CA化学文摘
SA科学文摘
SCI科学引文索引
JST 日本科学技术振兴机构数据库(日)
Pж(AJ) 文摘杂志(俄)
哥白尼索引(波兰)
剑桥科学文摘
国际药学文摘
国家图书馆馆藏
上海图书馆馆藏
文摘与引文数据库
文摘杂志
医学文摘
数学文摘
ASPT来源刊
农业与生物科学研究中心文摘
物理学、电技术、计算机及控制信息数据库

出版地区

不限

一种解决连续空间问题的真实在线自然梯度AC算法第267-282页

关键词: 策略梯度自然梯度真实在线td 核方法

2018年第02期《软件学报》

基于值函数和策略梯度的深度强化学习综述第1406-1438页

关键词: 深度学习强化学习深度强化学习值函数策略梯度机器学习

2019年第06期《计算机学报》

策略梯度强化学习中的最优回报基线第1021-1026页

关键词: 强化学习策略梯度部分可观测马氏决策过程回报基线

2005年第06期《计算机学报》

增强学习中的直接策略搜索方法综述第16-24页

关键词: 增强学习策略搜索策略梯度

2007年第01期《智能系统学报》

基于增强学习的无人直升机姿态控制器设计第73-76页

关键词: 无人直升机增强学习自适应启发评价策略梯度 pegasus

2008年第02期《弹箭与制导学报》

基于Dec-POMDP的认知无线电网络频谱接入算法第720-725页

关键词: 认知无线电可观测马尔科夫决策过程策略梯度频谱分配

2010年第06期《太赫兹科学与电子信息学报》

基于TD（λ）的自然梯度强化学习算法第186-189页

关键词: 策略梯度自然梯度资格迹

2010年第12期《计算机科学》

基于MDP支持弹性服务质量的接入控制第16-21页

关键词: markov决策过程接入控制资源分配弹性服务质量策略梯度

2012年第02期《网络新媒体技术》

POMDP环境下交通信号自适应控制的策略梯度学习方法第51-56页

关键词: pomdp 强化学习策略梯度交通信号控制

2012年第07期《武汉理工大学学报·信息与管理工程版》

几种经典的策略梯度算法性能对比第6937-6941页

关键词: 强化学习策略梯度收敛性仿真实验

2014年第10X期《电脑知识与技术》

连续空间的递归最小二乘行动者—评论家算法第1994-1997页

关键词: 强化学习连续状态动作空间递归最小二乘策略梯度高斯径向基函数

2014年第07期《计算机应用研究》

期刊导航