作者:黄锦增 陈虎 赖路双负载均衡异构gpu集群任务调度动态适应
摘要:GPU集群已经成为高性能计算的重要方式,特别对于计算密集型应用,具有成本低、性能高、功耗小的优势。为了解决GPU集群系统运行中的任务负载均衡问题,文中提出了一种面向计算密集型应用的异构GPU集群调度方法,该方法可以自动发现计算节点,并动态估计计算节点的计算能力,并根据计算能力、任务的计算强度和优先级在异构GPU集群上合理分配计算资源。同时,该系统还具有容错能力,能够处理计算节点的意外退出,可恢复意外退出计算节点的计算任务,并动态适应系统的计算规模。通过实验表明,文中采用的策略达到了预期目的。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社