跳到主要内容
研究论文

使用随机化技术加速线性系统解

出版:2013年2月1日出版历史
跳过抽象节

摘要

我们说明了在平方线性系统的情况下,如何通过统计技术增强线性代数计算阿克斯 = b条.我们研究了A类这使我们能够避免旋转,然后减少通信量。数值实验表明,与部分枢轴旋转相比,这种随机化可以以非常合理的计算代价执行,同时提供了令人满意的精度。这种称为部分随机蝶形变换(PRBT)的随机变换在数据存储和触发器计数方面进行了优化。我们提出了一个求解器,其中PRBT和无枢轴LU分解利用了当前的混合多核/GPU机器,并将其Gflop/s性能与当前并行库中实现的求解器进行了比较。

工具书类

  1. Anderson,E.、Bai,Z.等人,1999年。LAPACK用户指南第三版SIAM。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Arioli,M.、Demmel,J.W.和Duff,I.S.1989年。求解具有稀疏向后误差的稀疏线性系统。SIAM J.矩阵分析。申请。10, 2, 165--190.谷歌学者谷歌学者数字图书馆数字图书馆
  3. Arioli,M.、Baboulin,M.和Gratton,S.,2007年。线性最小二乘问题的部分条件数。SIAM J.矩阵分析。申请。29, 2, 413--433.谷歌学者谷歌学者数字图书馆数字图书馆
  4. Buttari,A.、Langou,J.、Kurzak,J.和Dongarra,J.,2009年。一类适用于多核体系结构的并行平铺线性代数算法。并行计算。35, 38--53.谷歌学者谷歌学者数字图书馆数字图书馆
  5. Dimov,I.2008年。应用科学家的蒙特卡罗方法Word Scientific。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Duff,I.S.、Erisman,A.M.和Reid,J.K.,1986年。稀疏矩阵的直接方法。牛津克拉伦登出版社。谷歌学者谷歌学者
  7. Edelman,A.1988年。随机矩阵的特征值和条件数。SIAM J.矩阵分析。申请。9, 4, 543--560.谷歌学者谷歌学者数字图书馆数字图书馆
  8. 福斯特,L.V.1994年。部分旋转高斯消去法在实践中可能会失败。SIAM J.矩阵分析。申请。15, 4, 1354--1362.谷歌学者谷歌学者数字图书馆数字图书馆
  9. Grigori,L.、Demmel,J.W.和Xiang,H.,2008年。避免高斯消去的通信。IEEE/ACM超级计算会议记录.谷歌学者谷歌学者数字图书馆数字图书馆
  10. 新泽西州海姆,2002年。数值算法的准确性和稳定性第2版SIAM。谷歌学者谷歌学者数字图书馆数字图书馆
  11. 新泽西州海姆和D.J.海姆,1989年。旋转高斯消去中的大生长因子。SIAM J.矩阵分析。申请。10, 2, 155--164.谷歌学者谷歌学者数字图书馆数字图书馆
  12. Kenney,C.S.、Laub,A.J.和Reese,M.S.1998年。线性最小二乘的统计条件估计。SIAM J.矩阵分析。申请。19, 906--923.谷歌学者谷歌学者数字图书馆数字图书馆
  13. Oettli,W.和Prager,W.1964年。线性方程近似解与系数和右侧给定误差界的相容性。数字数学6, 405--409.谷歌学者谷歌学者数字图书馆数字图书馆
  14. Parker,D.S.1995年。随机蝴蝶变换及其在计算线性代数中的应用。加州大学洛杉矶分校计算机科学系技术代表CSD-950023。谷歌学者谷歌学者
  15. Parker,D.S.和Pierce,B.1995年。随机化FFT:高斯消去中旋转的替代方法。加州大学洛杉矶分校计算机科学系技术代表CSD-950037。谷歌学者谷歌学者
  16. Quintana-Orti,G.、Quintana-Orti,E.S.、van de Geijn,R.A.、van Zee,F.G.和Chan,E.,2009年。多线程体系结构上矩阵计算的块编程算法。ACM事务处理。数学。柔和。36,3,1-26。谷歌学者谷歌学者数字图书馆数字图书馆
  17. Saad,Y.2000年。稀疏线性系统的迭代方法第2版SIAM。谷歌学者谷歌学者数字图书馆数字图书馆
  18. Skeel,R.D.1980年。迭代求精意味着高斯消去的数值稳定性。数学。计算。35, 817--832.谷歌学者谷歌学者交叉引用交叉引用
  19. Sorensen,D.C.1984年。高斯消去中两两旋转的分析。IEEE传输。计算。34, 274--278.谷歌学者谷歌学者数字图书馆数字图书馆
  20. Trefethen,L.N.和Schreiber,R.S.,1990年。高斯消去的平均情况稳定性。SIAM J.矩阵分析。申请。11, 3, 335--360.谷歌学者谷歌学者数字图书馆数字图书馆
  21. Volkov,V.和Demmel,J.W.,2008年。使用GPU的矢量功能进行LU、QR和Cholesky因子分解。加州大学伯克利分校技术代表UCB/EECS-2008-49。LAPACK工作说明202。谷歌学者谷歌学者
  22. Wright,S.J.1993年。部分旋转高斯消去不稳定的一组问题。SIAM J.科学。统计人员。计算。14, 231--238.谷歌学者谷歌学者数字图书馆数字图书馆
  23. Yarkhan,A.、Kurzak,J.和Dongarra,J.,2011年。QUARK用户指南:内核的QUeueing和运行时。田纳西大学创新计算实验室技术代表ICL-UT-11-02。谷歌学者谷歌学者
  24. Yeung,M.和Chan,T.F.1997年。无旋转高斯消去的概率分析。SIAM J.矩阵分析。申请。18, 2, 499--517.谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 使用随机化技术加速线性系统解

      建议

      评论

      杰西·路易斯·巴洛

      在对并行科学计算进行了近40年的积极研究之后,研究人员仍在努力实现高斯消去。问题集中在如何实现枢轴,即为了稳定性而进行行和/或列交换。如果并发性和数据移动没有问题,那么备选方案将是1)完全旋转,或使用完全旋转进行高斯消去(GECP),这涉及使用行和列交换将最大元素重新定位到旋转位置,或2)使用部分旋转进行高斯消去(GEPP),这意味着将当前列中最大的元素移动到轴心位置。GECP需要O(n 3)比较,因此大约加倍努力,但是稳定的。GEPP需要O(n2)比较,并且可能不稳定,但前提是你非常不走运。由于没有人完全理解的原因,使用计算科学家的想象力发现了GEPP不稳定的矩阵示例,但在计算经验中绝非偶然。因此,GEPP被认为是“在实践中”稳定的。不幸的是,在分布式内存计算环境中,即使GEPP所需的比较和行交换的数量不多,数据移动也会带来负担。本文绘制了中央处理单元/图形处理单元(CPU/GPU)架构中的中枢开销,范围从小矩阵上40%的因子分解时间到10000大小矩阵上17%的因子分解时间。虽然这是对大型矩阵的一个改进,但它仍然包含比O(n2)枢轴比较和O(n3)因式分解操作所建议的更大的开销。作为替代方案,作者提出了一种启发式方法,称为部分随机蝶形变换(PRBT),该方法来源于Parker[1]和Parker and Pierce[2]的一个想法。构造PRBT的技术基于构造快速傅里叶变换的技术,因此允许使用类似的并行算法和数据结构。作者建议将高斯消去因子矩阵a转换为a r=U TAV,其中U和V是PRBT。然后,在不旋转的情况下,通过高斯消去因子A r。注意确保U和V的条件数由适度常数限定,从而确保A r的条件数与A的条件数相差不大。作者对文献中的一些矩阵进行了详尽的测试,其中包括三个众所周知的GEPP表现不佳的矩阵。当残差不符合要求时,执行迭代细化。在任何情况下都不需要超过一步的迭代精化,在所有情况下,PRBT都会生成残差较小的解。PRBT的操作复杂性略大于GEPP,理论上为O(n 2 log n),但实际上为O(n2),常数更大。使用本文描述的CPU/GPU体系结构,对于1000到3000的矩阵,PRBT要快得多。然而,对于大于9000的基质,相对于GEPP的改善仅为10%左右。作者认为,从渐近角度来看,PRBT和GEPP将非常接近。从本文中,我们可以得出结论,PRBT作为GEPP的拟议替代方案效果良好,但随着矩阵变大,其优势逐渐消失。作为一种保持高斯消去稳定的方法,没有任何理论解释PRBT为什么工作。事实上,没有已知的理论原因说明为什么这种方法在不旋转的情况下比高斯消去法更好或更差。本文提出了一种有趣的替代部分旋转的方法,但要正确理解它还需要大量的理论工作。在线计算评论服务

      访问计算机文献的关键评论在这里

      成为评论员计算评论。

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        数学软件上的封面图像ACM事务
        ACM数学软件汇刊 第39卷第2期
        2013年2月
        151页
        国际标准编号:0098-3500
        EISSN公司:1557-7295
        内政部:10.1145/2427023
        期刊目录

        版权所有©2013 ACM

        如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2013年2月1日
        • 接受日期:2012年3月1日
        • 修订过的:2011年11月1日
        • 收到时间:2011年5月1日
        发布于汤姆斯第39卷第2期

        权限

        请求有关此文章的权限。

        请求权限

        检查更新

        限定符

        • 研究论文
        • 研究
        • 推荐

      PDF格式

      以PDF文件的形式查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器