跳到主要内容
研究论文

银杏:用于高性能计算的现代线性算子代数框架

作者信息和声明
出版:2022年2月16日出版历史
跳过抽象节

摘要

在本文中,我们将介绍银杏,一个用于科学高性能计算的现代C++数学库。当经典线性代数库作用于矩阵和向量对象时,银杏的设计原理将所有功能抽象为“线性运算符”,从而激发了“线性运算符代数库”的注释银杏当前的重点是为高性能图形处理单元(GPU)体系结构提供稀疏线性代数功能,但考虑到库的设计,此重点可以轻松扩展以适应其他算法和硬件体系结构。我们介绍了这种复杂的软件体系结构,它将核心算法与特定于体系结构的后端分离开来,并提供了有关可扩展性和可持续性度量的详细信息。我们还展示银杏的可用性,提供了如何在MFEM和deal.ii有限元生态系统中使用其功能的示例。最后,我们提供了一个银杏在最先进的GPU体系结构上的高性能。

参考文献

  1. [1]2020.Suite稀疏矩阵集合。检索自http://官能.cse.tamu.edu/davis/suitesparse.html.谷歌学者谷歌学者
  2. [2](2020年4月访问).混合波特兰模式库.谷歌学者谷歌学者
  3. [3](2020年4月访问).对象切片。波特兰模式库.谷歌学者谷歌学者
  4. [4](4月访问 2020). xSDK示例检索自https://xsdk.info/release-0-5-0/.谷歌学者谷歌学者
  5. [5](4月访问 2020亿).xSDK:极端规模的科学软件开发工具包检索自https://xsdk.info网址/.谷歌学者谷歌学者
  6. [6](8月访问 2018).更好的科学软件检索自https://bssw.io网址/.谷歌学者谷歌学者
  7. [7](8月访问 2018).谷歌测试。检索自https://github.com/google/googletest网站.谷歌学者谷歌学者
  8. [8]阿尔泽塔·G·。,阿恩特·D。,班杰斯·W·。,博杜五世。,品牌B。,达维多夫·D·。,加斯穆勒R。,Heister T。,赫尔泰L。,科尔曼K。,克伦比切勒·M·。,梅尔M。,佩尔特J.-P。,Turcksin B公司。、和D井。.2018.交易。II库,版本9.0.数值数学杂志 26,4, (2018),173183.谷歌学者谷歌学者交叉引用交叉引用
  9. [9]安德森E。白Z。,比肖夫C。,布莱克福德S。,德梅尔·J。,东加拉·J·。,克罗兹·J·杜,格林鲍姆A。,哈马林S。,麦肯尼A。、和索伦森D。.1999.LAPACK用户指南.工业和应用数学学会,第三届。预计起飞时间.费城谷歌学者谷歌学者
  10. [10]安德森·R·。,安德烈·J。,巴克A。,Bramwell J。,卡米尔J.-S。,塞维尼J。,多布雷夫五世。,杜杜伊特Y。,费希尔A。,科列夫·T·。,帕兹纳·W·。,斯托维尔·M。,托莫夫五世。,达姆·J。,麦地那D。、和扎皮尼S。.2019.模块化有限元方法库.https://www.sciencedirect.com/science/article/abs/pii/S0898122120302583?通过%3Dihub谷歌学者谷歌学者
  11. [11]安兹特·H。,陈Y.-C。,科让·T。,东加拉·J·。,弗莱加G。,纳亚克·P。,金塔纳-奥尔蒂E.S。,蔡永明(Tsai Y.M.)。、和王伟(Wang W.)。.2019.走向持续基准测试:高性能软件的自动化性能评估框架.英寸高级科学计算平台会议记录,111.谷歌学者谷歌学者数字图书馆数字图书馆
  12. [12]安兹特·H。,周一英(Chow E.)。、和东加拉·J·。.2015.预处理的迭代稀疏三角解.英寸欧洲并行处理会议记录,柏林施普林格,650661谷歌学者谷歌学者交叉引用交叉引用
  13. [13]安兹特·H。,周一英(Chow E.)。、和东加拉·J·。.2018.Parilu——一种新的并行阈值ilu分解.SIAM J.科学。计算。 40,4, (2018)C503–C519.谷歌学者谷歌学者交叉引用交叉引用
  14. [14]安兹特·H。,科让·T。,陈Y.C。,弗莱加·G·。,哥贝尔·F。,Grützmacher T。,纳亚克·P。,里比泽尔T。、和蔡玉华(Tsai Y.-H.)。.2020.银杏:一个高性能的数值线性代数库.开源软件杂志,5,52(2020),2260.谷歌学者谷歌学者交叉引用交叉引用
  15. [15]安兹特·H。,东加拉·J·。,弗莱加·G·。,海姆·新泽西。、和金塔纳-奥尔蒂E.S。.2019.迭代稀疏线性系统求解器块jacobi预处理的自适应精度.并行与计算:实践与经验 31,6,2019,第4460页.谷歌学者谷歌学者交叉引用交叉引用
  16. [16]安兹特·H。,东加拉J。,弗莱加·G·。、和金塔纳-奥尔蒂E.S。.2019.图形处理器上块jacobi预处理的可变大小分批高斯-乔丹消去.并行计算。 81, (2019),131146.谷歌学者谷歌学者交叉引用交叉引用
  17. [17]安兹特·H。,哈克·T·K。,布拉克利J。、和东加拉·J·。.2018.并行预处理的不完全稀疏近似逆.并行计算。 71, (2018),122.谷歌学者谷歌学者交叉引用交叉引用
  18. [18]安兹特·H。,里比泽尔T。,弗莱加·G·。,周一英(Chow E.)。、和东加拉·J·。.2019.ParILUT-GPU的并行阈值ILU.2019 IEEE国际并行和分布式处理研讨会.231241.谷歌学者谷歌学者
  19. [19]周一英(Chow E.)。,安兹特·H。、和东加拉·J·。.2015.GPU上计算不完全分解的异步迭代算法.英寸高性能计算国际会议记录,施普林格,116.谷歌学者谷歌学者交叉引用交叉引用
  20. [20]科普林J.O。1995.奇怪地重复出现的模板模式.C++报告。谷歌学者谷歌学者数字图书馆数字图书馆
  21. [21]迪肯·T。,普莱斯·J。,马提诺·M·。、和麦金托什-史密斯S。.2016.GPU-STREAM v2.0:跨不同并行编程模型对多核处理器可实现的内存带宽进行基准测试.英寸托弗M。,莫尔B。、和昆克尔J.M。,个编辑高性能计算,施普林格.489507.谷歌学者谷歌学者
  22. [22]弗莱加·G·。,安兹特·H。,科让·T。、和金塔纳-奥尔蒂E.S。.2021.银杏线性代数软件中用于高性能预处理的自适应精确块jacobi.ACM数学软件交易,47,2(2021), 1–12.谷歌学者谷歌学者数字图书馆数字图书馆
  23. [23]伽马E。,赫尔姆·R。,约翰逊·R·。、和Vlissides J.M.公司。.1994.设计模式:可重用面向对象软件的元素(第1版)。Addison-Wesley专业版.谷歌学者谷歌学者数字图书馆数字图书馆
  24. [24]戈贝尔·F。,安兹特·H。,科让·T。,弗莱加·G·。、和金塔纳-奥尔蒂E.S。.2020.迭代三角解的多精度块-jacobi.英寸欧洲并行处理会议记录,施普林格,546560.谷歌学者谷歌学者交叉引用交叉引用
  25. [25]贾戈德·H。,达纳利斯A。,安兹特·H。、和东加拉·J·。.2019.用于深入性能分析的Papi软件定义事件.国际高性能计算应用杂志 33,6(2019),11131127.谷歌学者谷歌学者数字图书馆数字图书馆
  26. [26]约翰逊·R·。,伽马E。,弗利赛德斯J。、和赫尔姆·R。.1995.设计模式:可重用面向对象软件的元素.出版商.谷歌学者谷歌学者数字图书馆数字图书馆
  27. [27]劳森·C·L。,汉森·R·J。,金凯·D·R。、和Krogh F.T.公司。.1979.fortran使用的基本线性代数子程序.数学软件交易 5,(1979),308323.谷歌学者谷歌学者数字图书馆数字图书馆
  28. [28]萨阿德·Y。.2003.稀疏线性系统的迭代方法. (工业与应用数学学会). (第2版)。谷歌学者谷歌学者数字图书馆数字图书馆
  29. [29]蔡永民。,科让·T。、和安兹特·H。.2020年.AMD和NVIDIA GPU上的稀疏线性代数-比赛开始了.英寸高性能计算国际会议记录,施普林格,309327.谷歌学者谷歌学者数字图书馆数字图书馆
  30. [30]蔡永明(Tsai Y.M.)。,科让·T。,里比泽尔T。、和安兹特·H。.2020亿.为amd gpus准备银杏–关于将cuda代码移植到hip的证明.https://link.springer.com/chapter/10.1007/978-3-030-71593-9_9谷歌学者谷歌学者

索引术语

  1. 银杏:用于高性能计算的现代线性算子代数框架

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          封面图片ACM数学软件汇刊
          ACM数学软件汇刊 第48卷第1期
          2022年3月
          320页
          国际标准编号:0098-3500
          EISSN公司:1557-7295
          内政部:2014年10月14日/505199
          期刊目录

          如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2022年2月16日
          • 认可的:2021年8月1日
          • 修订过的:2021年2月1日
          • 收到:2020年5月1日
          发布于汤姆斯第48卷第1期

          权限

          请求有关此文章的权限。

          请求权限

          检查更新

          限定符

          • 研究论文
          • 推荐

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器

        全文

        以全文形式查看本文。

        查看全文

        HTML格式

        以HTML格式查看本文。

        查看HTML格式