元素

元素:分布式内存密集矩阵计算的一个新框架将密集矩阵计算并行化到分布式内存体系结构是一个研究得很好的课题,通常被认为是并行计算领域中最容易理解的领域之一。20世纪90年代中期开发的两个软件包仍然可以正常使用:ScaLAPACK和PLAPACK。随着许多核心体系结构的出现,这些核心体系结构很可能在单个处理器中形成分布式内存体系结构,因此必须重新审视这些包,因为传统的基于MPI的方法可能需要扩展。因此,这是一个很好的时机来回顾自采用这两个一揽子计划以来吸取的经验教训,并提出一个简单而有效的替代办法。初步的性能结果表明,新的解决方案在大型集群上达到了竞争性的性能(如果不是优越的话)。

这个软件也是同行评审按日记帐汤姆斯.


zbMATH中的参考文献(参考文献24条)

显示第1到第20个结果,共24个。
按年份排序(引用)
  1. 乔利韦,皮埃尔;罗曼,何塞E。;Zampini,Stefano:KSPHPDDM和PCHPDDM:用先进的Krylov方法和鲁棒多级重叠Schwarz预处理器扩展PETSc(2021)
  2. 波波维奇,多鲁·汤姆;沙茨,马丁D。;弗兰切蒂,弗兰兹;多维DFTs框架
  3. 田中、和谷;伊玛奇,广藤;福本,通屋;秋叶久和;原田,Yuki;福卡娅,武史;山本,裕坂;武雄和志:本征核(2019)
  4. 哈林,约翰;杨海钊:基于QR分解的基函数扩散预测模型(2018)
  5. 艾弗伦,哈伊姆;克拉克森,肯尼斯L。;Woodruff,David P.:使用草图和预处理的更快的内核脊回归(2017)
  6. 布茨西迪斯,克里斯托斯;德里亚斯石油公司;坎巴杜,普拉班詹;孔托普劳,尤金妮娅·玛丽亚;Zouzias,Anastasios:近似对称正定矩阵对数行列式的随机化算法(2017)
  7. 迪那不勒斯,爱德华多;佩斯,埃尔玛;Hrywniak,马库斯;Bientinesi,Paolo:FLAPW方法中哈密顿矩阵和重叠矩阵的高性能生成(2017)
  8. 李英州;Ying,Lexing:分布式内存分层插值因子分解(2017)
  9. 陆剑锋;杨海钊:平面波离散化的预处理轨道极小化方法(2017)
  10. 马丁森,每冈纳;金塔娜·奥蒂,格雷戈里奥;希夫纳,内森;van de Geijn,Robert:Householder QR因式分解与列旋转随机化(HQRRP)(2017)
  11. 范泽,G场。;Smith,Tyler M.:通过3m和4m方法实现高性能复杂矩阵乘法(2017)
  12. 贝里亚科夫,格雷布;Matiyasevich,Yuri:使用任意精度算法计算行列式和子式的并行算法(2016)
  13. 努尔加列夫,R。;罗,H。;威斯顿,B。;安德森,A。;斯科菲尔德,S。;邓恩,T。;Delplanque,J.-P.:相变流体动力学的全隐式正交重构间断Galerkin方法(2016)
  14. 沙茨,马丁D。;范德盖恩,罗伯特A。;杰克·鲍尔森:《并行矩阵乘法:系统之旅》(2016)
  15. Van Loan,Charles F.:来自张量的结构化矩阵问题(2016)
  16. 阿玛蒂亚S.班纳吉。;埃利奥特,瑞安S。;James,Richard D.:团簇Kohn-Sham密度泛函理论的光谱方案(2015)
  17. 范泽,G场。;van de Geijn,Robert A.:BLIS:快速实例化BLAS功能的框架(2015)
  18. 维查林斯基,尤金;杨超;Pask,John E.:用于计算Hermitian矩阵多个极端特征对的投影预处理共轭梯度算法(2015)
  19. 法布盖特·特拉弗,迭戈;尤里·奥琴科。;Bientinesi,Paolo:求解多线程体系结构上的广义最小二乘问题序列(2014)
  20. 马丁森,P。G、 :通过复合谱配置法离散的变系数椭圆偏微分方程的直接求解器(2013)