HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

在线学习方法综述:汤普森抽样和其他方法

作者:何斯迈; 金羽佳; 王华; 葛冬冬在线学习多摇臂机汤普森抽样信心上界算法情境多摇臂机在线凸优化

摘要:本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经典的在线优化模型——多摇臂机问题为例,引入了汤普森抽样算法和信心上界算法,分析、展示了它们的基本思路和最新成果,并进一步讨论了汤普森抽样算法在更复杂的在线学习问题中的变式和应用.本文同时对在线凸优化算法做了初步探讨,它也是解决多摇臂机问题和其他许多在线学习的应用问题时一种强有力的工具.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

运筹学学报

《运筹学学报》(CN:31-1732/O1)是一本有较高学术价值的大型季刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《运筹学学报》主要刊登运筹学领域的理论研究和应用论文、综述文章、应用成果等。学报的作者和读者来源于高校及科研院所,主要是高校数学系与管理类专业的教师和研究生以及科研单位从事运筹学研究的一线科技工作者。

杂志详情