作者:邱敏; 桂小林容错计算网格计算可靠性错误检测故障恢复
摘要:由于网格资源的分布性、流动性和异构性,计算故障在网格计算环境中发生的概率比传统机群系统要高,而且结点故障的发生具有不确定性,检测和恢复更加困难.为了在网格计算环境中实现应用程序的可靠执行,提出了一种基于分布式错误检测技术的容错网格体系结构,研究了在结点故障、网络故障和进程故障时,应用程序恢复执行的方法.针对网格环境下上述三种故障发生的特性,研究了不同的应用程序恢复执行机制,其目标是以较小代价获得应用的可靠执行.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社