研究论文

银杏：用于高性能计算的现代线性算子代数框架

作者：
哈特维格·安斯特

德国卡尔斯鲁厄理工学院和田纳西大学创新计算实验室，德国埃根斯坦-利奥波德沙芬

德国卡尔斯鲁厄理工学院和田纳西大学创新计算实验室，德国埃根斯坦-利奥波德沙芬

0000-0003-2177-952X
查看个人资料

,
特里·科让

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

0000-0002-1560-921倍
查看个人资料

,
戈兰·弗莱加

西班牙普莱纳卡斯特隆詹姆一世大学

西班牙普莱纳卡斯特隆詹姆一世大学
查看个人资料

,
弗里茨·戈贝尔

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

德国利奥波德沙芬埃根斯坦卡尔斯鲁厄理工学院
查看个人资料

,
托马斯·格吕茨马赫

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国
查看个人资料

,
普拉蒂克·纳亚克

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国
查看个人资料

,
托比亚斯·里比泽尔

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国
查看个人资料

,
余香迈克·蔡

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国

卡尔斯鲁厄理工学院，Eggenstein-Leopoldshafen，德国
查看个人资料

,
恩里克·金塔纳·奥尔蒂

西班牙巴伦西亚瓦伦西亚政治大学

西班牙巴伦西亚瓦伦西亚政治大学
查看个人资料

作者信息和声明

ACM数学软件汇刊第48卷第1版条款编号：2第1-33页https://doi.org/10.1145/3480935

出版：2022年2月16日出版历史

ACM数学软件汇刊

摘要

在本文中，我们将介绍银杏，一个用于科学高性能计算的现代C++数学库。当经典线性代数库作用于矩阵和向量对象时，银杏的设计原理将所有功能抽象为“线性运算符”，从而激发了“线性运算符代数库”的注释银杏当前的重点是为高性能图形处理单元（GPU）体系结构提供稀疏线性代数功能，但考虑到库的设计，此重点可以轻松扩展以适应其他算法和硬件体系结构。我们介绍了这种复杂的软件体系结构，它将核心算法与特定于体系结构的后端分离开来，并提供了有关可扩展性和可持续性度量的详细信息。我们还展示银杏的可用性，提供了如何在MFEM和deal.ii有限元生态系统中使用其功能的示例。最后，我们提供了一个银杏在最先进的GPU体系结构上的高性能。

参考文献

[1]2020.Suite稀疏矩阵集合。检索自http://官能.cse.tamu.edu/davis/suitesparse.html.谷歌学者
[2]（2020年4月访问）.混合波特兰模式库.谷歌学者
[3]（2020年4月访问）.对象切片。波特兰模式库.谷歌学者
[4]（4月访问 2020). xSDK示例检索自https://xsdk.info/release-0-5-0/.谷歌学者
[5]（4月访问 2020亿).xSDK：极端规模的科学软件开发工具包检索自https://xsdk.info网址/.谷歌学者
[6]（8月访问 2018).更好的科学软件检索自https://bssw.io网址/.谷歌学者
[7]（8月访问 2018).谷歌测试。检索自https://github.com/google/googletest网站.谷歌学者
[8]阿尔泽塔·G·。,阿恩特·D。,班杰斯·W·。,博杜五世。,品牌B。,达维多夫·D·。,加斯穆勒R。,Heister T。,赫尔泰L。,科尔曼K。,克伦比切勒·M·。,梅尔M。,佩尔特J.-P。,Turcksin B公司。、和D井。.2018.交易。II库，版本9.0.数值数学杂志 26,4, (2018),173–183.谷歌学者交叉引用
[9]安德森E。白Z。,比肖夫C。,布莱克福德S。,德梅尔·J。,东加拉·J·。,克罗兹·J·杜,格林鲍姆A。,哈马林S。,麦肯尼A。、和索伦森D。.1999.LAPACK用户指南.工业和应用数学学会，第三届。预计起飞时间.费城谷歌学者
[10]安德森·R·。,安德烈·J。,巴克A。,Bramwell J。,卡米尔J.-S。,塞维尼J。,多布雷夫五世。,杜杜伊特Y。,费希尔A。,科列夫·T·。,帕兹纳·W·。,斯托维尔·M。,托莫夫五世。,达姆·J。,麦地那D。、和扎皮尼S。.2019.模块化有限元方法库.https://www.sciencedirect.com/science/article/abs/pii/S0898122120302583？通过%3Dihub谷歌学者
[11]安兹特·H。,陈Y.-C。,科让·T。,东加拉·J·。,弗莱加G。,纳亚克·P。,金塔纳-奥尔蒂E.S。,蔡永明（Tsai Y.M.）。、和王伟（Wang W.）。.2019.走向持续基准测试：高性能软件的自动化性能评估框架.英寸高级科学计算平台会议记录,1–11.谷歌学者数字图书馆
[12]安兹特·H。,周一英（Chow E.）。、和东加拉·J·。.2015.预处理的迭代稀疏三角解.英寸欧洲并行处理会议记录,柏林施普林格,650–661谷歌学者交叉引用
[13]安兹特·H。,周一英（Chow E.）。、和东加拉·J·。.2018.Parilu——一种新的并行阈值ilu分解.SIAM J.科学。计算。 40,4, (2018)C503–C519.谷歌学者交叉引用
[14]安兹特·H。,科让·T。,陈Y.C。,弗莱加·G·。,哥贝尔·F。,Grützmacher T。,纳亚克·P。,里比泽尔T。、和蔡玉华（Tsai Y.-H.）。.2020.银杏：一个高性能的数值线性代数库.开源软件杂志,5,52(2020),2260.谷歌学者交叉引用
[15]安兹特·H。,东加拉·J·。,弗莱加·G·。,海姆·新泽西。、和金塔纳-奥尔蒂E.S。.2019.迭代稀疏线性系统求解器块jacobi预处理的自适应精度.并行与计算：实践与经验 31,6,2019,第4460页.谷歌学者交叉引用
[16]安兹特·H。,东加拉J。,弗莱加·G·。、和金塔纳-奥尔蒂E.S。.2019.图形处理器上块jacobi预处理的可变大小分批高斯-乔丹消去.并行计算。 81, (2019),131–146.谷歌学者交叉引用
[17]安兹特·H。,哈克·T·K。,布拉克利J。、和东加拉·J·。.2018.并行预处理的不完全稀疏近似逆.并行计算。 71, (2018),1–22.谷歌学者交叉引用
[18]安兹特·H。,里比泽尔T。,弗莱加·G·。,周一英（Chow E.）。、和东加拉·J·。.2019.ParILUT-GPU的并行阈值ILU.2019 IEEE国际并行和分布式处理研讨会.231–241.谷歌学者
[19]周一英（Chow E.）。,安兹特·H。、和东加拉·J·。.2015.GPU上计算不完全分解的异步迭代算法.英寸高性能计算国际会议记录,施普林格,1–16.谷歌学者交叉引用
[20]科普林J.O。1995.奇怪地重复出现的模板模式.C++报告。谷歌学者数字图书馆
[21]迪肯·T。,普莱斯·J。,马提诺·M·。、和麦金托什-史密斯S。.2016.GPU-STREAM v2.0：跨不同并行编程模型对多核处理器可实现的内存带宽进行基准测试.英寸托弗M。,莫尔B。、和昆克尔J.M。，个编辑高性能计算,施普林格.489–507.谷歌学者
[22]弗莱加·G·。,安兹特·H。,科让·T。、和金塔纳-奥尔蒂E.S。.2021.银杏线性代数软件中用于高性能预处理的自适应精确块jacobi.ACM数学软件交易,47,2(2021), 1–12.谷歌学者数字图书馆
[23]伽马E。,赫尔姆·R。,约翰逊·R·。、和Vlissides J.M.公司。.1994.设计模式：可重用面向对象软件的元素（第1版）。Addison-Wesley专业版.谷歌学者数字图书馆
[24]戈贝尔·F。,安兹特·H。,科让·T。,弗莱加·G·。、和金塔纳-奥尔蒂E.S。.2020.迭代三角解的多精度块-jacobi.英寸欧洲并行处理会议记录,施普林格,546–560.谷歌学者交叉引用
[25]贾戈德·H。,达纳利斯A。,安兹特·H。、和东加拉·J·。.2019.用于深入性能分析的Papi软件定义事件.国际高性能计算应用杂志 33,6(2019),1113–1127.谷歌学者数字图书馆
[26]约翰逊·R·。,伽马E。,弗利赛德斯J。、和赫尔姆·R。.1995.设计模式：可重用面向对象软件的元素.出版商.谷歌学者数字图书馆
[27]劳森·C·L。,汉森·R·J。,金凯·D·R。、和Krogh F.T.公司。.1979.fortran使用的基本线性代数子程序.数学软件交易 5,三(1979),308–323.谷歌学者数字图书馆
[28]萨阿德·Y。.2003.稀疏线性系统的迭代方法. (工业与应用数学学会). （第2版）。谷歌学者数字图书馆
[29]蔡永民。,科让·T。、和安兹特·H。.2020年.AMD和NVIDIA GPU上的稀疏线性代数-比赛开始了.英寸高性能计算国际会议记录,施普林格,309–327.谷歌学者数字图书馆
[30]蔡永明（Tsai Y.M.）。,科让·T。,里比泽尔T。、和安兹特·H。.2020亿.为amd gpus准备银杏–关于将cuda代码移植到hip的证明.https://link.springer.com/chapter/10.1007/978-3-030-71593-9_9谷歌学者

索引术语

银杏：用于高性能计算的现代线性算子代数框架

建议

“银杏：用于高性能计算的现代线性算子代数框架”的复制计算结果报告
Anzt等人的文章标题为“银杏：用于高性能计算的现代线性算子代数框架”。为稀疏线性代数提供了一个现代的、以线性运算符为中心的C++库。本文的实验结果表明。。。
阅读更多信息
用于ESX虚拟机监控程序上高性能通用计算的GPU虚拟化
HPC’14：高性能计算研讨会论文集

图形处理单元（GPU）以其大规模并行计算能力和能效成为高性能计算（HPC）系统中的重要组件。虚拟化技术越来越多地应用于HPC以减少。。。
阅读更多信息
用于高性能计算的系统级虚拟化
PDP’08：第16届并行、分布式和基于网络的处理欧洲微观会议记录（PDP 2008）

系统级虚拟化自70年代以来一直是一个研究主题，但由于Xen等高效解决方案的可用性以及商品处理器中硬件支持的实现（例如。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

发布于
ACM数学软件汇刊第48卷第1期
2022年3月
320页
国际标准编号：0098-3500
EISSN公司：1557-7295
内政部：2014年10月14日/505199
编辑：
白昭君
美国加州大学戴维斯分校
,
沃尔夫冈·班格尔
美国科罗拉多州立大学
期刊目录
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2022年2月16日
- 认可的：2021年8月1日
- 修订过的：2021年2月1日
- 收到：2020年5月1日
发布于汤姆斯第48卷第1期

权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
高性能计算
健康的软件生命周期
多核和多核体系结构
限定符
- 研究论文
- 推荐
会议
资金来源
其他指标
查看文章指标

文章指标
- 13
  引文总数
  查看引文
- 925
  总下载次数
- 下载次数（过去12个月）337
- 下载次数（最近6周）28
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

全文

以全文形式查看本文。

查看全文

HTML格式

以HTML格式查看本文。

查看HTML格式

银杏：用于高性能计算的现代线性算子代数框架

ACM数学软件汇刊

摘要

参考文献

引用人

索引术语

建议

“银杏：用于高性能计算的现代线性算子代数框架”的复制计算结果报告

用于ESX虚拟机监控程序上高性能通用计算的GPU虚拟化

用于高性能计算的系统级虚拟化

评论