引用人
孙乙、龚丁、姚十 (2023). 将DSGEO集成到MPI程序路径覆盖的测试用例生成中, 信息和软件技术 , 153 :C , 在线发布日期:2023年1月1日 . Alvermann A、Hager G和Fehske H (2023). 大尺度特征值计算中的正交平行层, ACM并行计算汇刊 , 10 :3 , (1-31), 在线发布日期:2023年9月30日 . Maier M和Kronbichler M (2021). 基于二阶有限元格式的可压缩Euler方程的高效并行三维计算, 并行计算ACM事务 , 8 :3 , (1-30), 在线发布日期:2021年9月30日 . Holzer M、Bauer M、Köstler H和Rüde U (2021). 通过代码生成,在CPU和GPU上以高密度比对不混溶流体进行高效的格子Boltzmann多相模拟, 国际高性能计算应用杂志 , 35 :4 , (413-427), 在线发布日期:2021年7月1日 . Rho S、Park G、Choi J和Park C (2021). 开发基准自动化套件并评估各种高性能计算系统, 集群计算 , 24 :1 , (159-179), 在线发布日期:2021年3月1日 . Ganser S、Größlinger A、Siegmund N、Apel S和Lengauer C (2018). 使用替代性能模型加速迭代多面体调度优化, ACM架构和代码优化事务 , 15 :4 , (1-27), 在线发布日期:2019年1月8日 . Zarei Zefreh E、Lotfi S、Mohammad Khanli L和Karinpur J (2019). 依赖于分布式系统的完美嵌套循环的拓扑和计算功耗感知瓦片映射, 并行与分布式计算杂志 , 129 :C , (14-35), 在线发布日期:2019年7月1日 . 孙乙、王杰、龚丁、田特 (2019). 调度序列选择以生成测试数据以覆盖MPI程序的路径, 信息和软件技术 , 114 :C , (190-203), 在线发布日期:2019年10月1日 . 伦纳德·L (2019). 面向CONUS尺度流域的多级网格工作流, 环境建模与软件 , 122 :C , 在线发布日期:2019年12月1日 . Kronbichler M和Kormann K (2019). 非连续Galerkin有限元算子的快速无矩阵计算, ACM数学软件汇刊 , 45 :3 , (1-40), 在线发布日期:2019年9月30日 . I、Fortin P、Lamotte J和Calandra H说 (2018). 利用加速处理单元进行地震成像, 国际高性能计算应用杂志 , 32 :6 , (819-837), 在线发布日期:2018年11月1日 . Szustak L、Halbiniak K、Kuczynski L、Wrobel J和Kulawik A (2018). CPU-MIC混合平台固化应用程序的移植和优化, 国际高性能计算应用杂志 , 32 :4 ,(523-539), 在线发布日期:2018年7月1日 . Kronbichler M、Diagne A和Holmgren H (2018). 用于微流控芯片模拟的快速大规模并行两相流求解器, 国际高性能计算应用杂志 , 32 :2 , (266-287), 在线发布日期:2018年3月1日 . Chaudhury B、Varma A、Keswani Y、Bhatnagar Y和Parikh S (2018). 让HPC, 并行与分布式计算杂志 , 118 :第1页 , (213-232), 在线发布日期:2018年8月1日 . Antil H、Chen D和Field S (2018). 基于QR的模型简化:算法、软件和引力波应用, 科学与工程计算 , 20 :4 , (10-25), 在线发布日期:2018年7月1日 . 拉斯托夫斯基A、苏斯塔克L和威兹科夫斯基R (2017). 通过负载不平衡对Intel Xeon Phi上的EULAG内核进行基于模型的优化, IEEE并行和分布式系统汇刊 , 28 :3 , (787-797), 在线发布日期:2017年3月1日 . Marzolla M和D’Angelo G共享内存多处理器上基于并行排序的数据分布管理匹配第21届分布式仿真和实时应用国际研讨会论文集,(1-8) Kreutzer M、Thies J、Röhrig-Zöllner M、Pieper A、Shahzad F、Galgon M、Basermann A、Fehske H、Hager G和Wellein G (2017). 幽灵, 国际并行程序设计杂志 , 45 :5 , (1046-1072), 在线发布日期:2017年10月1日 . Brus S、Wirasaet D、Westerink J和Dawson C (2017). 非结构网格守恒定律间断Galerkin解的性能和可扩展性改进, 科学计算杂志 , 70 :1 , (210-242), 在线发布日期:2017年1月1日 . Rojek K和Wyrzykowski R (2017). GPU集群上3D MPDATA仿真的性能建模, 超级计算杂志 , 73 :2 ,(664-675), 在线发布日期:2017年2月1日 . Bramas B和Ancona D (2017). Inastemp公司, 科学规划 , 2017 , 在线发布日期:2017年1月1日 . Gounalakis O、Lytos A和Dasygenis M利用在线CAD工具的并行化机会东南欧设计自动化、计算机工程、计算机网络和社交媒体会议论文集,(25-31) Masliah I、Abdelfattah A、Haidar A、Tomov S、Baboulin M、Falcou J和Dongarra J甚小矩阵的高性能矩阵矩阵乘法第22届欧洲标准国际会议论文集2016:并行处理-第9833卷,(659-671) Khan K、Nybäck F、Ou Z、Nurminen J、Niemi T、Eulisse G、Elmer P和Abdurachmanov D使用IgProf的第15届IEEE/ACM集群、云和网格计算国际研讨会论文集进行能源分析,(1115-1118) Träff J、Lübbe F、Rougier A和Hunold S同构、稀疏MPI-like并行模具计算集体通信操作第22届欧洲MPI用户小组会议论文集,(1-10) Basermann A、Röhrig-Zöllner M和Illmer J并行python编程的性能和生产率第五届python高性能和科学计算研讨会论文集,(1-10) Rojek K、Ciznicki M、Rosa B、Kopta P、Kulczewski M、Kurowski K、Piotrowski Z、Szustak L、Wojcik D和Wyrzykowski R (2015). 流体模型EULAG适应图形处理单元架构, 并行与计算:实践与经验 , 27 :4 , (937-957), 在线发布日期:2015年3月25日 . Rojek K和Wyrzykowski R使用多个图形处理器对3D MPDATA算法进行并行化第13届并行计算技术国际会议论文集-第9251卷,(445-457) Weinbub J,Dang F,Gillberg T和Selberherr S半序快速迭代方法的共享内存并行化高性能计算研讨会论文集,(217-224) Ji H,Sosonkina M和Li Y块共轭梯度算法在CPU-GPU处理器上的实现第一届高性能计算软硬件协同设计国际研讨会论文集,(72-77) Yin J、Rekepalli B、Patel P、Drennen C和Engel A《共享内存体系结构的基因组序列分析管道模型》2014年极端科学与工程发现环境年会论文集,(1-4) Antonelli L、Corsaro S、Marino Z和Rizardi M (2014). 算法944, ACM数学软件汇刊 , 40 :4 , (1-18), 在线发布日期:2014年6月1日 . Hawe G、Coates G、Wilson D和Crouch R (2012). 基于Agent的大规模应急响应模拟, 倒排索引综述 , 45 :1 , (1-51), 在线发布日期:2012年11月1日 . 编程混合架构ATIP/A*CRC高性能计算加速器技术研讨会论文集:亚洲领先吗?, (1-145) von Praun C 2011年ACM SIGPLAN X10研讨会并行编程会议记录(1-6) Jurczuk K、Kretowski M和Bezy-Wendling J血管网络建模中的层次并行方法第九届并行处理和应用数学国际会议论文集第一卷,(376-385)
建议
高性能Fortran简介 高性能Fortran(HPF)是Fortran 90扩展的非正式标准,有助于在并行体系结构上实现它,特别是在数据并行计算方面。 除其他外,它还包括用于指定数据的指令。。。