跳到主要内容
10.1145/2627373.2627387acm会议文章/章节视图摘要出版物页面物理层数据接口会议记录会议集合
辅导的

Loo.py:基于转换的GPU和CPU代码生成

出版:2014年6月9日出版历史

摘要

今天的高度异构计算环境给想要在相当广泛的机器上实现高性能的程序员带来了负担。要做到这一点,计算需要用许多不同但数学上等价的方法来表示,在最坏的情况下,每个目标机器都有一个变量。

Loo.py是一个嵌入Python的编程系统,它通过定义用于数组式计算的数据模型和在此模型上操作的转换库来应对这一挑战。它提供了循环平铺、矢量化、存储管理、展开、指令级并行、数据布局更改等转换,为捕获、参数化和重新统一代码变体之间的增长提供了一种方便的方法。与numpy和PyOpenCL的可选深度集成提供了一个方便的计算环境,在该环境中,可以以机器辅助的形式逐步从原型实现过渡到高性能实现。

工具书类

  1. K.Asanovic、R.Bodik、B.C.Catanzaro、J.J.Gebis、P.Husbands、K.Keutzer、D.A.Patterson、W.L.Plishker、J.Shalf、S.W.Williams等。并行计算研究的前景:伯克利的观点。技术报告,UCB/EECS-2006-183,EECS,加州大学伯克利分校,2006年。谷歌学者谷歌学者
  2. C.巴斯托尔。多面体模型中的代码生成比您想象的要容易。《第13届并行体系结构和编译技术国际会议论文集》,第7-16页,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  3. J.Bilmes、K.Asanovic、C.-W.Chin和J.Demmel。使用PHiPAC优化矩阵乘法:一种便携式、高性能、ANSI C编码方法。第11届超级计算国际会议记录,第340-347页。ACM,1997年。谷歌学者谷歌学者数字图书馆数字图书馆
  4. G.E.Blelloch。作为基本并行操作进行扫描。计算机,IEEE汇刊,38(11):1526--15381989。谷歌学者谷歌学者数字图书馆数字图书馆
  5. B.Catanzaro、M.Garland和K.Keutzer。铜斑蛇:编译嵌入式数据并行语言。在ACM SIGPLAN通知中,第46卷,第47-56页。ACM,2011年。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Continuum Analytics,Inc.Numba Pro,2014年。谷歌学者谷歌学者
  7. H.Cui、L.Wang、J.Xue、Y.Yang和X.Feng。GPU上BLAS3的自动库生成。第25届IEEE国际并行与分布式处理研讨会论文集,安克雷奇,阿拉斯加州,2011年。谷歌学者谷歌学者数字图书馆数字图书馆
  8. J.Ellson、E.Gansner、L.Koutsofios、S.C.North和G.Woodhull。Graphviz——开源图形绘制工具。在图形绘制中,第483-484页。斯普林格,2002年。谷歌学者谷歌学者
  9. P.Feautrier先生。多面体模型中的自动并行化。在数据并行编程模型中,第79-103页。施普林格,1996年。谷歌学者谷歌学者数字图书馆数字图书馆
  10. R.Garg和L.Hendren。针对CPU/GPU混合系统的基于阵列的语言的编译器工具包。2012年11月,加拿大魁北克省蒙特利尔市麦吉尔大学计算机科学系Sable研究小组2012年3月的技术报告。谷歌学者谷歌学者
  11. M.Hall、J.Chame、C.Chen、J.Shin、G.Rudy和M.Khan。用于代码生成和自动调整的循环转换方法。并行计算语言和编译器,第50-64页,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  12. T.D.Han和T.S.Abdelrahman。hiCUDA:高级GPGPU编程。《IEEE并行与分布式系统汇刊》,22:78-902011。。谷歌学者谷歌学者数字图书馆数字图书馆
  13. A.Klöckner、N.Pinto、Y.Lee、B.Catanzaro、P.Ivanov和A.Fasih。PyCUDA和PyOpenCL:一种基于脚本的GPU运行时代码生成方法。并行计算,38(3):157--174,2012。。谷歌学者谷歌学者数字图书馆数字图书馆
  14. A.科克纳。爱尔兰手册,2014年。统一资源定位地址http://documen.tician.de/islpy/。谷歌学者谷歌学者
  15. A.Klöckner和T.Warburton。Loopy:基于转换的GPU和CPU代码生成的应用程序和性能。2014年(准备中)。谷歌学者谷歌学者
  16. S.Lee和R.Eigenmann。OpenMPC:针对GPU的扩展OpenMP编程和调整。《2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集》,第1-11页。IEEE计算机学会,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  17. K.Matsumoto、N.Nakasato、S.G.Sedukhin、I.M.Tsuruga和A.W.City。在GPU上的OpenCL中实现用于快速矩阵乘法的代码生成器。2012谷歌学者谷歌学者
  18. A.Rubinsteyn、E.Hielscher、N.Weinman和D.Shasha。鹦鹉:Python的实时并行加速器。在第四届USENIX并行性热点会议的会议记录中,第14-14页。USENIX协会,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  19. G.Rudy、M.Khan、M.Hall、C.Chen和J.Chame。描述转换和代码生成的编程语言接口。《并行计算的语言和编译器》,第136-1502011页。谷歌学者谷歌学者数字图书馆数字图书馆
  20. J.Svensson、K.Claessen和M.Sheeran。使用Obsidian实现和优化GPGPU内核。Procedia Computer Science,1(1):2065--20742010。谷歌学者谷歌学者交叉引用交叉引用
  21. S.van der Walt、S.C.Colbert和G.Varoqueux。numpy数组:一种高效数值计算的结构。科学与工程计算,13(2):22-302011。谷歌学者谷歌学者数字图书馆数字图书馆
  22. S.Verdoolaege公司。isl:多面体模型的整数集库。K.Fukuda、J.Hoeven、M.Joswig和N.Takayama,《数学软件——ICMS 2010》编辑,《计算机科学讲义》第6327卷,第299-302页。施普林格柏林/海德堡,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. S.Verdoolaege、J.Carlos Juega、A.Cohen、J.Ignacio Gómez、C.Tenllado和F.Catthoor。CUDA的多面体并行代码生成。ACM变速器。阿基特。代码优化。,9(4):54:1--54:232013年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  24. 杨勇、项鹏飞、孔杰和周海波。用于内存优化和并行管理的GPGPU编译器。在ACM SIGPLAN通知中,第45卷,第86页至第97页,2010年。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. Loo.py:基于转换的GPU和CPU代码生成

          建议

          评论

          登录选项

          检查您是否可以通过登录凭据或您的机构访问本文。

          登录

          完全访问权限

          • 发布于

            封面图片ACM会议
            ARRAY’14:ACM SIGPLAN数组编程库、语言和编译器国际研讨会会议记录
            2014年6月
            112页
            国际标准图书编号:9781450329378
            内政部:10.1145/2627373

            版权所有©2014 ACM

            如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

            出版商

            计算机协会

            美国纽约州纽约市

            出版历史

            • 出版:2014年6月9日

            权限

            请求有关此文章的权限。

            请求权限

            检查更新

            限定符

            • 辅导的
            • 研究
            • 推荐有限公司

            接受率

            阵列'14纸张接受率17属于25提交文件,68%总体验收率17属于25提交文件,68%

            即将召开的会议

            PLDI’24
            ACM SIGPLAN编程语言设计与实现会议
            2024年6月24日至28日
            哥本哈根,丹麦

          PDF格式

          以PDF文件查看或下载。

          PDF格式

          电子阅读器

          使用eReader联机查看。

          电子阅读器