POMDP环境下交通信号自适应控制的策略梯度学习方法

作者：夏新海pomdp强化学习策略梯度交通信号控制

摘要：将交通自适应控制看成是POMDP（Partially Observable Markov Decision Process）问题,建立交叉口POMDP环境模型,结合值函数法的优点设计解决此问题的策略梯度学习算法。仿真实验与传统方法比较表明,在局部交通较少及高度饱和交通条件下此学习方法具有一定的收敛性和有效性,并对解决自适应交通控制问题具有一定的适用性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

武汉理工大学学报·信息与管理工程版

《武汉理工大学学报·信息与管理工程版》（CN：42-1825/TP）是一本有较高学术价值的大型双月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《武汉理工大学学报·信息与管理工程版》重点刊登电子与电工、通信与信息、计算机、控制与自动化以及经济、管理科学与工程、物流工程等学科的最新研究成果，同时刊登机械工程、土木工程与建筑、船舶与海洋工程以及力学、数学、物理学等基础学科的研究与工程应用论文。

杂志详情

服务推荐

武汉理工大学学报·信息与管理工程版相关期刊

POMDP环境下交通信号自适应控制的策略梯度学习方法

服务推荐

在线咨询

杂志订阅

期刊推荐

佳木斯教育学院学报

赤峰学院学报·自然科学版

重庆科技学院学报·社会科学版

湖南科技学院学报