×

Cholesky非核心因子分解。 (英语) Zbl 1286.65042号

摘要:一般工程仿真软件的计算核心是线性系统求解器。根据数值离散化,该解算器可能是密集的,也可能是稀疏的。如果与线性系统相关的系统矩阵是稀疏的,则需要使用稀疏结构。直接稀疏线性解算器,如Cholesky、(LDL^T)或(LU)是完美的黑盒,即它们只需要线性系统的矩阵(A)和右侧向量(b)作为输入。然而,它们的主要缺点是所需的内存通常会随着问题的大小而快速增加。在这项工作中,我们建议非核心实现Cholesky解算器以克服内存问题。这个非核心层基于专门的缓存开发,只存储问题矩阵(a)的一部分和因子(L),其完整数据存储在临时磁盘文件中。因子L的计算分两步进行,具体来说:第一步是符号计算,第二步是数值计算。第一步计算每行/列的非零元素的位置,第二步使用多正面方法计算每个位置的数值。我们的建议大大节省了内存。建议的实现将计算与I/O重叠,以加快求解器克服磁盘延迟的不同阶段。高速缓存结构的改进,以及预取技术的实现,对多核处理器显示出非常好的效果。

MSC公司:

2008年第65页 迭代方法的前置条件
65层50 稀疏矩阵的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 新墨西哥州古尔德。;斯科特·J·A。;Hu,Y.,大型稀疏对称线性方程组解的稀疏直接解算器的数值评估,ACM数学软件汇刊,33,2(2007),第10条·兹比尔1365.65129
[3] Rothberg,E。;Schreiber,R.,核外稀疏Cholesky因子分解的有效方法,SIAM科学计算杂志,21,1,129-144(1999)·Zbl 1047.65016号
[4] Reid,J。;Scott,J.,《核心外稀疏Cholesky求解器》,ACM数学软件汇刊,TOMS,36,2(2009),第9篇·Zbl 1364.65071号
[8] Bai,Z。;德梅尔,J。;Dongarra,J。;Ruhe,A。;van der Vorst,H.,《代数特征值问题求解模板:实用指南》(2000),SIAM:SIAM Philadelphia·Zbl 0965.65058号
[9] Toledo,S.,《数值线性代数中非核心算法的调查》(Abello,J.;Vitter,J.S.,外部记忆算法和可视化。外部记忆算法与可视化,离散数学和理论计算机科学系列(1999))·Zbl 0943.65036号
[10] Smith,A.J.,缓存,ACM计算调查,14,3,473-530(1982)
[11] 帕特森,D.A。;Hennessy,J.L.,(《计算机组织与设计:硬件/软件接口》(2005),Morgan Kaufmann)·Zbl 1074.68536号
[12] Jean-Loup Baer;Chen,Tien-Fu,降低数据访问惩罚的有效片上预加载方案,(1991年ACM/IEEE超级计算会议论文集。1991年ACM/IEEE超级计算机会议论文集,美国新墨西哥州阿尔伯克基,1991年11月18日至22日,1991年超级计算’91(1991),ACM:美国纽约州纽约市ACM),176-186
[15] Karypis,G。;Kumar,V.,《一种快速且高质量的划分不规则图的多级方案》,SIAM科学计算杂志,20,1,359-392(1999)·Zbl 0915.68129号
[17] 罗津,E。;Toledo,S.,稀疏Cholesky方法中的参考位置,数值分析电子交易,2181-106(2005)·Zbl 1121.65310号
[18] 特普斯特拉,D。;贾戈德,H。;你,H。;Dongarra,J.,使用PAPI-C收集性能数据,(《2009年高性能计算工具》,第三届并行工具研讨会,德国德累斯顿(2009),施普林格:施普林格柏林,海德堡),157-173
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。