作者:谭琦; 王永青; 戴飞不相容工件组随机调度批处理机q学习
摘要:研究不相容工件组在单台批处理机上的分批加工问题,工件具有随机的到达时间和加工时间。不相容工件组是指属于不同组的工件不能被安排在同一批中加工。首先,以长期平均代价最小为优化目标,以缓冲库中工件数为实时状态,建立了基于半马尔科夫决策过程的系统模型。然后,通过策略迭代算法对其进行优化控制,同时为了缓解大状态空间导致的维数灾问题,给出了基于模拟退火的Q学习算法。仿真实验验证了所提出方法的有效性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社