在线-ABFT swMATH ID: 17489 软件作者: Z.Chen(陈) 描述: Online-ABFT:一种基于在线算法的容错方案,用于迭代方法中的软错误检测。软错误是一次性事件,会破坏计算系统的状态,但不会破坏其整体功能。大型超级计算机由于其组件数量众多,特别容易出现软错误。软错误通常可以通过比较两次重复计算的最终计算结果来进行离线检测,但这种方法通常会带来很大的开销。本文介绍了Online-ABFT,一种简单而有效的在线软错误检测技术,可以在程序执行过程中检测广泛使用的Krylov子空间迭代方法中的软错误,以便在软错误发生后立即终止损坏的计算,从而提高计算效率。基于对正交性和残差的简单验证,Online-ABFT易于实现且高效。实验结果表明,当这种在线错误检测方法与检查点结合使用时,与传统的离线方法相比,它将获得正确结果的时间提高了几个数量级。 主页: http://dl.acm.org/citation.cfm?id=2442533 相关软件: 滴答声;稀疏矩阵;mctoolbox软件;MUMPS公司;DUNE公司;炒作;BoomerAMG公司 引用于: 4文件 全部的 前5名11位作者引用 2 艾曼纽尔·阿古洛 2 吕克·吉拉德 2 马乌西·佐农 1 比约恩·格梅纳 1 阿卜杜·盖尔穆切 1 马库斯·休伯(Markus Q.Huber)。 1 杰拉德·A·梅朗特。 1 让·罗曼 1 乌尔里奇·吕德 1 巴勃罗萨拉斯 1 芭芭拉·沃尔穆特。 3篇连载文章中引用 2 SIAM科学计算杂志 1 数值算法 1 数值线性代数及其应用 在3个字段中引用 4 数值分析(65-XX) 2 偏微分方程(35-XX) 1 运筹学、数学规划(90-XX) 按年份列出的引文