基于再励学习的主动队列管理算法

作者：张雁冰; 杭大明; 马正新; 曹志刚拥塞控制主动队列管理再励学习

摘要：从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

软件学报

《软件学报》（CN：11-2560/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

软件学报相关期刊

基于再励学习的主动队列管理算法

服务推荐

在线咨询

杂志订阅

期刊推荐

佳木斯教育学院学报

计算机光盘软件与应用

赤峰学院学报·自然科学版

重庆科技学院学报·社会科学版