跳到主要内容
10.5555/1855048旅游指南书籍页面出版物页面acm-pubtype公司
跳过标题部分
科学家和工程师高性能计算导论2010年7月
出版商:
  • CRC出版社。
  • 子公司。佛罗里达州博卡拉顿西北公司大道2000号时代镜
  • 美国
国际标准图书编号:978-1-4398-1192-4
出版:2010年7月2日
页:
356
跳过书目计量部分
文献计量学
跳过抽象节
摘要

由高性能计算(HPC)专家编写的《科学家和工程师高性能计算简介》(Introduction to high performance computing for Scientists and Engineers)对当前主流计算机体系结构、主流并行编程模型以及科学HPC的有用优化策略进行了坚实的介绍。通过在科学计算中心工作,作者对用户以及并行计算机制造商的需求和态度有了独特的见解。本文首先介绍了现代基于缓存的微处理器的体系结构,并讨论了其固有的性能限制,然后描述了基于缓存的体系结构上串行代码的通用优化策略。接下来介绍共享和分布式内存并行计算机体系结构以及最相关的网络拓扑。在理论层面上讨论了并行计算之后,作者展示了如何避免或改善与OpenMP相关的典型性能问题。然后,他们介绍了缓存相干非均匀内存访问(ccNUMA)优化技术,研究了使用消息传递接口(MPI)的分布式内存并行编程,并解释了如何编写高效的MPI代码。最后一章重点介绍MPI和OpenMP的混合编程。高性能计算机的用户通常不知道是什么因素限制了解决问题的时间,也不知道考虑优化是否有意义。这本书有助于直观地理解性能限制,而不依赖于大量的计算机科学知识。它也为读者学习更高级的文学做好了准备。

引用人

  1. 孙乙、龚丁、姚十(2023).将DSGEO集成到MPI程序路径覆盖的测试用例生成中,信息和软件技术,153:C,在线发布日期:2023年1月1日.
  2. ACM公司
    Alvermann A、Hager G和Fehske H(2023).大尺度特征值计算中的正交平行层,ACM并行计算汇刊,10:3, (1-31),在线发布日期:2023年9月30日.
  3. ACM公司
    Maier M和Kronbichler M(2021).基于二阶有限元格式的可压缩Euler方程的高效并行三维计算,并行计算ACM事务,8:3, (1-30),在线发布日期:2021年9月30日.
  4. Holzer M、Bauer M、Köstler H和Rüde U(2021).通过代码生成,在CPU和GPU上以高密度比对不混溶流体进行高效的格子Boltzmann多相模拟,国际高性能计算应用杂志,35:4, (413-427),在线发布日期:2021年7月1日.
  5. Rho S、Park G、Choi J和Park C(2021).开发基准自动化套件并评估各种高性能计算系统,集群计算,24:1, (159-179),在线发布日期:2021年3月1日.
  6. ACM公司
    Ganser S、Größlinger A、Siegmund N、Apel S和Lengauer C(2018).使用替代性能模型加速迭代多面体调度优化,ACM架构和代码优化事务,15:4, (1-27),在线发布日期:2019年1月8日.
  7. Zarei Zefreh E、Lotfi S、Mohammad Khanli L和Karinpur J(2019).依赖于分布式系统的完美嵌套循环的拓扑和计算功耗感知瓦片映射,并行与分布式计算杂志,129:C, (14-35),在线发布日期:2019年7月1日.
  8. 孙乙、王杰、龚丁、田特(2019).调度序列选择以生成测试数据以覆盖MPI程序的路径,信息和软件技术,114:C, (190-203),在线发布日期:2019年10月1日.
  9. 伦纳德·L(2019).面向CONUS尺度流域的多级网格工作流,环境建模与软件,122:C,在线发布日期:2019年12月1日.
  10. ACM公司
    Kronbichler M和Kormann K(2019).非连续Galerkin有限元算子的快速无矩阵计算,ACM数学软件汇刊,45:3, (1-40),在线发布日期:2019年9月30日.
  11. I、Fortin P、Lamotte J和Calandra H说(2018).利用加速处理单元进行地震成像,国际高性能计算应用杂志,32:6, (819-837),在线发布日期:2018年11月1日.
  12. Szustak L、Halbiniak K、Kuczynski L、Wrobel J和Kulawik A(2018).CPU-MIC混合平台固化应用程序的移植和优化,国际高性能计算应用杂志,32:4,(523-539),在线发布日期:2018年7月1日.
  13. Kronbichler M、Diagne A和Holmgren H(2018).用于微流控芯片模拟的快速大规模并行两相流求解器,国际高性能计算应用杂志,32:2, (266-287),在线发布日期:2018年3月1日.
  14. Chaudhury B、Varma A、Keswani Y、Bhatnagar Y和Parikh S(2018).让HPC,并行与分布式计算杂志,118:第1页, (213-232),在线发布日期:2018年8月1日.
  15. Antil H、Chen D和Field S(2018).基于QR的模型简化:算法、软件和引力波应用,科学与工程计算,20:4, (10-25),在线发布日期:2018年7月1日.
  16. 拉斯托夫斯基A、苏斯塔克L和威兹科夫斯基R(2017).通过负载不平衡对Intel Xeon Phi上的EULAG内核进行基于模型的优化,IEEE并行和分布式系统汇刊,28:3, (787-797),在线发布日期:2017年3月1日.
  17. Marzolla M和D’Angelo G共享内存多处理器上基于并行排序的数据分布管理匹配第21届分布式仿真和实时应用国际研讨会论文集,(1-8)
  18. Kreutzer M、Thies J、Röhrig-Zöllner M、Pieper A、Shahzad F、Galgon M、Basermann A、Fehske H、Hager G和Wellein G(2017).幽灵,国际并行程序设计杂志,45:5, (1046-1072),在线发布日期:2017年10月1日.
  19. Brus S、Wirasaet D、Westerink J和Dawson C(2017).非结构网格守恒定律间断Galerkin解的性能和可扩展性改进,科学计算杂志,70:1, (210-242),在线发布日期:2017年1月1日.
  20. Rojek K和Wyrzykowski R(2017).GPU集群上3D MPDATA仿真的性能建模,超级计算杂志,73:2,(664-675),在线发布日期:2017年2月1日.
  21. Bramas B和Ancona D(2017).Inastemp公司,科学规划,2017,在线发布日期:2017年1月1日.
  22. ACM公司
    Gounalakis O、Lytos A和Dasygenis M利用在线CAD工具的并行化机会东南欧设计自动化、计算机工程、计算机网络和社交媒体会议论文集,(25-31)
  23. Masliah I、Abdelfattah A、Haidar A、Tomov S、Baboulin M、Falcou J和Dongarra J甚小矩阵的高性能矩阵矩阵乘法第22届欧洲标准国际会议论文集2016:并行处理-第9833卷,(659-671)
  24. Khan K、Nybäck F、Ou Z、Nurminen J、Niemi T、Eulisse G、Elmer P和Abdurachmanov D使用IgProf的第15届IEEE/ACM集群、云和网格计算国际研讨会论文集进行能源分析,(1115-1118)
  25. ACM公司
    Träff J、Lübbe F、Rougier A和Hunold S同构、稀疏MPI-like并行模具计算集体通信操作第22届欧洲MPI用户小组会议论文集,(1-10)
  26. ACM公司
    Basermann A、Röhrig-Zöllner M和Illmer J并行python编程的性能和生产率第五届python高性能和科学计算研讨会论文集,(1-10)
  27. Rojek K、Ciznicki M、Rosa B、Kopta P、Kulczewski M、Kurowski K、Piotrowski Z、Szustak L、Wojcik D和Wyrzykowski R(2015).流体模型EULAG适应图形处理单元架构,并行与计算:实践与经验,27:4, (937-957),在线发布日期:2015年3月25日.
  28. Rojek K和Wyrzykowski R使用多个图形处理器对3D MPDATA算法进行并行化第13届并行计算技术国际会议论文集-第9251卷,(445-457)
  29. Weinbub J,Dang F,Gillberg T和Selberherr S半序快速迭代方法的共享内存并行化高性能计算研讨会论文集,(217-224)
  30. Ji H,Sosonkina M和Li Y块共轭梯度算法在CPU-GPU处理器上的实现第一届高性能计算软硬件协同设计国际研讨会论文集,(72-77)
  31. ACM公司
    Yin J、Rekepalli B、Patel P、Drennen C和Engel A《共享内存体系结构的基因组序列分析管道模型》2014年极端科学与工程发现环境年会论文集,(1-4)
  32. ACM公司
    Antonelli L、Corsaro S、Marino Z和Rizardi M(2014).算法944,ACM数学软件汇刊,40:4, (1-18),在线发布日期:2014年6月1日.
  33. ACM公司
    Hawe G、Coates G、Wilson D和Crouch R(2012).基于Agent的大规模应急响应模拟,倒排索引综述,45:1, (1-51),在线发布日期:2012年11月1日.
  34. 编程混合架构ATIP/A*CRC高性能计算加速器技术研讨会论文集:亚洲领先吗?,(1-145)
  35. ACM公司
    von Praun C 2011年ACM SIGPLAN X10研讨会并行编程会议记录(1-6)
  36. Jurczuk K、Kretowski M和Bezy-Wendling J血管网络建模中的层次并行方法第九届并行处理和应用数学国际会议论文集第一卷,(376-385)
贡献者
  • 埃尔朗根-纽伦堡大学
  • 埃尔朗根-纽伦堡大学

建议

评论

迈克尔·墨菲

Hager和Wellein发表了一篇关于高性能计算的介绍性文章。这本书是为具有一定计算背景的科学家和工程师而写的,他们希望在高性能领域拥有与广泛主题相关的概念和技术的坚实基础。需要明确的是,这些主题大多与物理科学和相关工程领域相关,而不是生物科学,这是一个科学计算的完全不同的领域,有单独的文献库。前几章提供了现代处理器、串行代码优化和数据访问优化的背景,以及并行计算机和并行化技术的概述。接下来,介绍了使用共享内存进行并行编程的开放式多处理(OpenMP),并对效率进行了考虑。OpenMP是一种应用程序编程接口(API),它使用编译器指令在各种计算平台上开发并行应用程序。其中有一章介绍了缓存相干非均匀内存访问(ccNUMA)体系结构和局部优化。然后,结合并行编程和分布式内存,介绍了消息传递接口(MPI)标准,并对效率进行了考虑。最后一章考虑MPI和OpenMP协同工作以提供混合并行方法。有一个简短的附录,介绍多核环境的特殊注意事项。这本写得很好、组织得很好的书被设计成一本教科书,也可以作为一本自学指南,供积极性很高的个人或具有高性能计算背景的人使用。在可读性和内容的严格处理之间实现了合理的平衡。文中给出了许多示例和示例代码段,包括一些主要的应用程序,这些应用程序将在文本的不同位置重新讨论。大量有用的图表和其他图形。其中包括一些精心挑选的练习,以及一个给出解决方案的附录。有一个很好的参考章节,以一种特别有用的方式组织。无论是作为教科书还是作为高性能计算重要领域的参考卷,本文都值得仔细考虑。在线计算评论服务

访问计算机文献的关键评论在这里

成为评论员计算评论。