作者:仵博 郑红燕 冯延蓬部分可观察马尔可夫决策过程序贯决策信念状态空间在线算法维数灾
摘要:部分可观察马尔可夫决策过程( Partially Observable Markov Decision Processes, POMDPs )是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入“维数灾”和“历史灾”问题,造成理想的POMDPs模型无法在实际工程中得到应用.本文首先详细分析了POMDPs精确算法的复杂度,阐述问题求解的难点;然后比较分析现有基于点的离线算法和在线算法两类算法的算法思想和时间复杂度,指出两类算法的优缺点;最后简介POMDPs实际应用情况和未来的研究方向.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《深圳职业技术学院学报》(CN:44-1572/Z)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《深圳职业技术学院学报》强调创新性,突出技术性及应用性研究。根据职业院校的学科与研究特点,坚持理论联系实际,从生产、服务、管理的实际需要出发,面向国民经济主战场,重视发表那些理论密切联系实际,有重要应用价值和指导意义的文章。
杂志详情