HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于后验信念聚类的在线规划算法

作者:仵博 吴敏部分可观察马尔可夫决策过程后验信念聚类在线规划kl散度分支界限

摘要:在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求。为此,提出一种基于后验信念聚类的在线规划算法。使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类后验信念计算报酬值,并采用分支界限裁剪方法裁剪后验信念与或树。实验结果表明,该算法能够有效降低求解问题的规模,消除雨复计算,具有较好的实时性和较低的误差。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

《计算机工程》(CN:31-1289/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机工程》特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。

杂志详情