CUDA-Zero公司 swMATH ID: 14130 软件作者: Chen DH、Chen WG、Zheng WM 描述: CUDA-Zero:将共享内存GPU应用程序移植到多GPU的框架。随着通用计算在GPU上的普及,提出了共享内存编程模型来缓解GPU编程的痛苦。然而,随着对更密集工作负载的要求越来越高,最好将GPU程序移植到更可伸缩的分布式内存环境,例如多GPU。为此,需要使用混合编程模型(例如CUDA和消息传递)重新编写程序。程序员不仅需要仔细研究工作负载分配,还需要研究调度机制,以确保执行效率。本文研究了自动化多GPU并行化过程的可能性。从一个在共享内存模型中编写的GPU程序开始,我们的框架分析了内核函数中数组的访问模式,以导出数据分区方案。为了获得访问模式,我们提出了一种三层方法:静态分析、基于概要文件的分析和用户注释。实验表明,前两层可以正确地导出大多数访问模式,这意味着无需付出任何努力即可将现有应用程序移植到分布式内存环境。我们使用我们的框架对多个应用程序进行并行化,并表明对于某些类型的应用程序,CUDA-Zero可以在多GPU环境中实现高效的并行化 主页: http://rd.springer.com/article/10.1007%2Fs11432-011-4497-z型 相关软件: CUDA公司;MPto流;SBA公司;小教堂;开放式CL 引用于: 1文件 3位作者引用 1 高伟 1 胡占毅 1 刘欣 连载1篇 1 计算机科学与技术杂志 在1个字段中引用 1 计算机科学(68至XX) 按年份列出的引文