英特尔体系结构上的高级计算
18 GFLOPS并行气候资料同化PSAS包

在爱思唯尔的手下用户许可证
开放存档

摘要

我们为一个非结构化计算包PSAS数据模拟包设计并实现了一套高效且高度可扩展的算法,通过对一个Intel Paragon的512个节点的系统运行的详细性能分析可以证明这一点。预处理的共轭梯度解算器达到了18 Gflops的性能。因此,我们在Intel Paragon上实现了前所未有的100倍的解决时间比Cray C90的单头缩短。这不仅超出了美国宇航局戈达德航天飞行中心数据同化办公室的日常性能要求,而且使探索更大、更具挑战性的数据同化问题成为可能,这些问题在克雷C90等传统计算机平台上是无法想象的。

关键词

气候模拟
PSAS软件包
性能
英特尔典范
克雷C90

目前在美国宾夕法尼亚州匹兹堡第五大道4400号匹兹堡超级计算中心并行应用集团,邮编15213-2617。

1

C、 JPL的Chan和D.Gennery通过编写部分代码对这项工作做出了贡献。我们感谢DAO的P.Lyster、A.Da Silva和J.Guo,他们为我们提供了Cray C90代码,并帮助我们理解了这个问题。进入加州理工学院512节点的Paragon由NASA HPCC计划提供。这项工作是根据与NASA的合同通过HPCC-ESS项目进行的。

查看摘要