×

并行不稳定环境中迭代方法的恢复模式。 (英语) Zbl 1159.65318号

摘要:介绍了并行迭代方法的几种恢复技术。首先,描述和分析了并行迭代方法中检查点的实现。然后,针对并行迭代方法提出了一种简单的无检查点容错方案,即有损方法。当一个处理器发生故障且其所有数据丢失时,系统将通过使用未发生故障的处理器的数据计算新的近似解来恢复。然后用这个新向量重新启动迭代方法。与标准检查点算法相比,有损方法的主要优点是,在无故障发生时,它不会增加迭代求解器的计算成本。给出了比较不同技术的实验。使用了容错FT-MPI库。同时考虑了迭代线性解算器和特征解算器。

MSC公司:

65层10 线性系统的迭代数值方法
65英尺50英寸 稀疏矩阵的计算方法
2005年5月 并行数值计算
68宽10 计算机科学中的并行算法
68宽15 分布式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接