HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

强化学习算法在供应链环境下的库存控制中的应用

作者:汤大为; 王红卫多级库存马尔可夫决策过程马尔可夫博弈强化学习算法供应链管理库存控制

摘要:以两级库存为例,提出了一种优化库存管理的方法。该方法包含3种技术:马尔可夫决策过程、马尔可夫博弈和一种用于求解马尔可夫博弈的强化学习算法。具体操作过程是,将一个两级的库存系统通过马尔可夫博弈建模,再用马尔可夫博弈和强化学习的知识求解该模型,并得出该系统的优化解。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

管理学报

《管理学报》(CN:42-1725/C)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《管理学报》依据现有资源与实力,从“中国”这一关键词入手,历经“中国管理论坛”、“学术探索”、“中国管理理论介绍”、“中国管理学派园地”等探索阶段,逐渐定格于“管理学在中国”(特色栏目)。荣获国家自然科学基金委员会管理科学部重要期刊;第六,七,八届湖北省优秀期刊。

杂志详情