太阳能

SOLAR,一个可扩展的核心外线性代数计算的可移植库的设计与实现。SOLAR是一个便携式的高性能库,用于核心外密集矩阵计算。它通过使用现有的高性能核心子程序库和优化的矩阵输入输出库,将可移植性与高性能结合起来。SOLAR在并行计算机、工作站和个人计算机上工作。它支持在共享内存和分布式内存机器上进行核心计算,它的矩阵输入输出库支持传统I/O接口和并行I/O接口。本文讨论了SOLAR的总体设计、接口和几个重要子程序的设计。实验结果表明,SOLAR可以在单个工作站上以超过215mflops的速率对核外正定对称矩阵进行因子化,并以超过195mflops的速率对核外通用矩阵进行因子化。在这些计算中,不到16%的运行时间花在I/O上。这些结果表明,SOLAR的便携性不会影响其性能。我们期望,可移植性、模块化和高级I/O接口的使用将使该库成为研究核外算法和并行I/O的重要平台。


zbMATH中的参考文献(参考文献17条)

显示第1到17个结果,共17个。
按年份排序(引用)

  1. 莫汉蒂、斯拉班·库马尔;Sajith,G.:Hessenberg约化的输入/输出有效算法(2019)
  2. D'Azevedo,爱德华多;胡志刚;石泉、苏;Wong,Kwai:在基于GPU的并行计算机上解决大规模辐射问题(2014)
  3. D'Azevedo,E。F、 。;Nintcheu Fata,S.:关于使用核心外LU算法在图形处理单元上有效实现边界元代码(2012)
  4. 巴迪亚,J。M、 。;莫维拉,J。五十、 。;克莱门特,J。一、 。;卡斯蒂略,M。;侯爵,M。;梅奥,R。;昆塔娜·奥蒂,E。S、 。;Planelles,J.:使用二次存储的大规模线性系统求解器:混合纳米结构中的自能(2011)
  5. 科特,安德烈;切尔尼科夫,安德烈N。;chrisocholides,Nikos P.:使用现成软件进行有效的核外并行Delaunay网格细化(2011)
  6. 卡斯蒂略,玛丽贝尔;伊戈尔,弗朗西斯科D。;马奎斯,梅赛德斯;梅奥,拉斐尔;昆塔娜·奥蒂,恩里克·S。;金塔娜·奥蒂,格雷戈里奥;鲁比奥,拉斐尔;van de Geijn,Robert:图形处理器上线性系统的核心外解决方案(2009)
  7. Béreux,Natacha:Cholesky因式分解的核心外实现:基于循环的递归算法(2008)
  8. 村里村拉扬努尔;西瓦苏布拉曼尼亚,阿南德;坎德米尔,马哈茂特;塔库尔,拉吉耶夫;Ross,Robert:集群上I/O的自由缓存(2006)ioport公司
  9. 冈特,布莱恩·C。;van de Geijn,Robert A.:QR分解的并行核外计算与更新(2005)
  10. 罗特金,弗拉基米尔;托莱多,西万:一种新的核外稀疏Cholesky因式分解方法的设计与实现(2004)
  11. Strazdins,Peter E.:可扩展核外稠密对称不定因式分解算法的设计问题(2003)
  12. 坎德米尔,马哈茂特;乔德哈里,阿洛克;Ramanujam,J.:一种有I/O意识的磁盘驻留数据集平铺策略(2002)
  13. 托莱多,西万;Rabani,Eran:使用堆外滤波器对角化方法的超大电子结构计算(2002)
  14. D'Azevedo,爱德华多;Jack Dongarra:并行核心外scaLAPACK LU、QR和Cholesky因式分解例程的设计与实现(2001)
  15. 托莱多,西文:数值线性代数的核心外算法综述(1999)
  16. 东加拉,J。J、 。;哈马林,S。;沃克,D。W、 :并行核心外LU分解的关键概念(1998)
  17. 托莱多,西文:局部旋转LU分解中的参考位置(1997)