×

高性能计算的容错技术。 (英语) Zbl 1330.68026号

计算机通信与网络.商会:施普林格出版社(ISBN 978-3-319-20942-5/hbk;978-3-319-20943-2/ebook)。ix,320页。(2015).
出版商描述:这篇及时的文章全面概述了高性能计算(HPC)的容错技术。本文首先详细介绍了检查点协议和调度算法的概念、预测、复制、无声错误检测和纠正,以及一些特定于应用程序的技术,如ABFT。重点放在分析性能模型上。然后回顾了通用技术,包括几个检查点和回滚恢复协议。还通过定量模型评估和比较了相关的执行场景。特点:提供弹性方法和性能模型的调查;检查大型系统中错误和故障的各种来源;回顾了可用于设计容错MPI的各种技术;研究不同的复制方法;讨论了极值系统中容错方法的能耗挑战。
本卷的文章不会单独编入索引。

MSC公司:

68-06 与计算机科学有关的会议记录、会议、收藏等
68米15 网络和计算机系统的可靠性、测试和容错
00B15号机组 杂项特定利益物品的收集
PDF格式BibTeX公司 XML格式引用
全文: 内政部