HI,欢迎来到
学术之家
,发表咨询:400-888-7501 订阅咨询:400-888-7502
股权代码 102064
登录/注册
经营许可
杂志订阅
支付方式
首页
期刊
杂志
SCI
发表
出版社
0
首页
论文大全
策略梯度论文
列表
期刊分类
不限
教育
医学
经济
金融
管理
科技
工业
机械
农业
电力
水利
文学
艺术
文化
建筑
图书
档案
交通
体育
环境
政法
煤矿
地质
化工
社会
科学
化学
生物
新闻
历史
航空
理论
电子
政治
石油
计算机
期刊收录
不限
CSSCI 南大期刊
北大期刊
CSCD中国科学引文数据库
统计源期刊
知网收录
维普收录
万方收录
EI工程索引
CA化学文摘
SA科学文摘
SCI科学引文索引
JST 日本科学技术振兴机构数据库(日)
Pж(AJ) 文摘杂志(俄)
哥白尼索引(波兰)
剑桥科学文摘
国际药学文摘
国家图书馆馆藏
上海图书馆馆藏
文摘与引文数据库
文摘杂志
医学文摘
数学文摘
ASPT来源刊
农业与生物科学研究中心文摘
物理学、电技术、计算机及控制信息数据库
出版地区
不限
北京
上海
天津
江苏
浙江
河北
山西
重庆
四川
辽宁
吉林
安徽
福建
江西
山东
河南
湖北
湖南
广东
广西
海南
贵州
云南
西藏
陕西
甘肃
青海
宁夏
新疆
内蒙古
黑龙江
一种解决连续空间问题的真实在线自然梯度AC算法
第267-282页
关键词: 策略梯度 自然梯度 真实在线td 核方法
2018年第02期
《软件学报》
基于值函数和
策略梯度
的深度强化学习综述
第1406-1438页
关键词: 深度学习 强化学习 深度强化学习 值函数 策略梯度 机器学习
2019年第06期
《计算机学报》
策略梯度
强化学习中的最优回报基线
第1021-1026页
关键词: 强化学习 策略梯度 部分可观测马氏决策过程 回报基线
2005年第06期
《计算机学报》
增强学习中的直接策略搜索方法综述
第16-24页
关键词: 增强学习 策略搜索 策略梯度
2007年第01期
《智能系统学报》
基于增强学习的无人直升机姿态控制器设计
第73-76页
关键词: 无人直升机 增强学习 自适应启发评价 策略梯度 pegasus
2008年第02期
《弹箭与制导学报》
基于Dec-POMDP的认知无线电网络频谱接入算法
第720-725页
关键词: 认知无线电 可观测马尔科夫决策过程 策略梯度 频谱分配
2010年第06期
《太赫兹科学与电子信息学报》
基于TD(λ)的自然梯度强化学习算法
第186-189页
关键词: 策略梯度 自然梯度 资格迹
2010年第12期
《计算机科学》
基于MDP支持弹性服务质量的接入控制
第16-21页
关键词: markov决策过程 接入控制 资源分配 弹性服务质量 策略梯度
2012年第02期
《网络新媒体技术》
POMDP环境下交通信号自适应控制的
策略梯度
学习方法
第51-56页
关键词: pomdp 强化学习 策略梯度 交通信号控制
2012年第07期
《武汉理工大学学报·信息与管理工程版》
几种经典的
策略梯度
算法性能对比
第6937-6941页
关键词: 强化学习 策略梯度 收敛性 仿真实验
2014年第10X期
《电脑知识与技术》
连续空间的递归最小二乘行动者—评论家算法
第1994-1997页
关键词: 强化学习 连续状态动作空间 递归最小二乘 策略梯度 高斯径向基函数
2014年第07期
《计算机应用研究》
期刊导航
基础科学
工程科技I
工程科技II
农业科技
医药卫生科技
信息科技
哲学与人文科学
社会科学I
社会科学II
经济与管理科学