维也纳

用ViennaCL实现分布式异构高性能计算。使用图形适配器进行计算的一个主要缺点是相关问题大小的可用内存有限。为了克服ViennaCL库的这一局限性,我们研究了高性能计算(HPC)中一个标准基准问题的划分方法,即稠密矩阵矩阵积。我们将这种分区方法应用于超过图形适配器上可用内存的问题。此外,我们还研究了消息传递接口(MPI)在分布式存储系统中的适用性。详细介绍了我们的方法,并给出了基准测试结果。


zbMATH中的参考文献(参考文献21条,1标准件)

显示第1到第20个结果,共21个。
按年份排序(引用)
  1. Jæger,卡罗琳·霍尔格姆;哈斯塔德,克里斯汀·格雷戈里乌斯;蔡、星;Tveito,Aslak:求解EMI模型的算子分裂和有限差分格式(2021)
  2. 里兹,弗朗西斯科;教区,埃里克J。;布洛尼根,帕特里克J。;Tencer,John:线性时不变动力系统Galerkin模型简化的计算界公式(2021)
  3. 阿尼尔,罗宾;卡潘,戈汗;德洛斯特·弗洛姆,伊莎贝尔;邓宁,特德;弗里德曼,艾伦;格兰特,特雷弗;奎恩,香农;兰扬,帕里托什;谢尔特,塞巴斯蒂安;Yılmazel,Özgür:Apache Mahout:分布式数据流系统上的机器学习(2020)
  4. 阿卜杜勒贾巴尔,穆斯塔法;穆罕默德·法尔汉;阿尔哈提,诺哈;陈瑞;横田,里约热内卢;巴奇、哈坎;David Keyes:波散射的极限尺度FMM加速边界积分方程求解器(2019)
  5. 周,亚历克斯D。;罗杰斯,本尼迪克特D。;林德,史蒂芬J。;Stansby,Peter K.:在单个GPU上使用不可压缩平滑粒子流体力学(ISPH)的数值波盆,并使用垂直圆柱体测试案例(2019年)
  6. Demidov,D.:AMGCL:高效、灵活和可扩展的代数多重网格实现(2019)
  7. 余国庆,爱洛菲夫。;赫拉姆钦科夫,E.M。;Biryal'tsev,E.V.:使用GPU计算对协方差矩阵进行高性能处理(2019年)
  8. 格雷姆,费利克斯;Küpper,克尔斯廷;Naumann,Uwe:多核心架构上通过行合并实现的内存高效稀疏矩阵矩阵乘法(2018)
  9. 全,基旺;李昌科;2018年Euz-Woo-Al谐波密度重建法
  10. 李安;塞尔维亚语,拉杜语;Negrut,Dan:GPU卡上线性系统并行解的分裂方法分析(2017)
  11. 鲁普,卡尔;蒂莱,菲利普;鲁道夫,弗洛里安人;温布,约瑟夫;莫哈默,安德烈亚斯;格拉瑟,提博;安格尔,安格尔;Selberherr,Siegfried:多核和多核体系结构的ViennaCL线性代数库(2016)
  12. 鲁普,卡尔;温布,约瑟夫;安格尔,安格尔;Grasser,Tibor:图形处理单元的核融合流水线迭代求解器(2016)
  13. 马尔科普洛斯,亚历山德罗斯;哈普拉,瓦茨拉夫;塞尔马克,马丁;Fusek,Martin:使用permoncube和FLLOP包对具有数千万未知量的弹塑性问题进行大规模并行解决(2015年)
  14. David S Medina,Amik St Cyr,T.Warburton:OCCA:多线程语言的统一方法(2014)阿尔十四
  15. 兰尼,安德里亚;亚利姆,迈赫梅特萨普;Poedts,Stefaan:非结构网格上全球磁层模拟的支持GPU的有限体积解算器(2014)
  16. 温布,约瑟夫;鲁普,卡尔;Selberherr,Siegfried:ViennaX高度灵活和可重用的有限元模拟(2014)
  17. 德米多夫,丹尼斯;阿纳特,卡斯滕;鲁普,卡尔;Gottschling,Peter:Programming CUDA and OpenCL:使用现代C++库的案例研究(2013)
  18. 乔治斯库,塞尔维亚人;周,彼得;Okuda,Hiroshi:基于有限元结构分析的GPU加速度(2013)
  19. 罗西,R。;莫萨比,F。;Idelsohn,S.R.:图形硬件上基于OpenCL的可移植非结构边缘有限元Navier-Stokes解算器(2013)
  20. 维尼亚斯,莫伊斯;波兹库斯,泽基;Fraguela,Basilio B.:利用异构编程库开发异构并行性(2013)ioport公司

更多出版物请访问:http://viennacl.sourceforge.net/viennacl-publications.html