HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

半Markov控制过程在平均准则下的优化算法

作者:代桂平; 殷保群; 李衍杰; 周亚平; 奚宏生半markov控制过程紧致行动集性能势策略迭代数值迭代

摘要:研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证明了算法的收敛性.最后给出了一个数值例子来说明算法的应用.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国科学技术大学学报

《中国科学技术大学学报》(CN:34-1054/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国科学技术大学学报》主要刊登基础科学、技术科学及管理科学领域创新、应用价值较高的学术论文和研究成果。

杂志详情