×

使用任意精度算法计算行列式和子式的并行算法。 (英语) Zbl 1338.65117号

摘要:我们提出了一种在计算机集群上计算任意精度算法中矩阵行列式的并行算法。该算法限制了节点之间的数据移动,不仅计算行列式,而且计算与特定行或列相对应的所有子矩阵,并且计算所有主要主子矩阵的行列式和子矩阵,而不需要额外的费用。我们用任意精度算法实现了该算法,适用于条件非常差的矩阵,并根据经验估计了精度损失。在我们的场景中,计算的成本大于数据移动的成本。将该算法应用于黎曼zeta函数的研究。

MSC公司:

65平方英尺 行列式的数值计算
2005年5月 并行数值计算
65D20个 特殊函数和常数的计算,表的构造
2006年11月 \(zeta(s)和(L(s,chi))
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abdelmalek,S.,Kouachi,S.:决定因素的凝聚。ArXiv公司:网址:http://arxiv.org/abs/0712.0822 (2007) ·Zbl 1155.35384号
[2] Agullo,E.,Demmel,J.,Dongarra,J.、Hadri,B.、Kurzak,J.和Langou,J.。Ltaief,H.,Luszczek,P.,Tomov,S.:新兴体系结构的数值线性代数:等离子体和MAGMA项目。《物理学杂志》。Conf.序列号。180, 012037 (2009) ·doi:10.1088/1742-6596/180/1/012037
[3] Ballard,G.,Demmel,J.,Holtz,O.,Schwartz,O:数字线性代数中的通信最小化。SIAM J.矩阵分析。申请。32, 866-901 (2011) ·Zbl 1246.68128号 ·doi:10.1137/090769156
[4] Beliakov,G.,Matiyasevich,Yu:用有限Dirichlet级数逼近Riemann的zeta函数:多精度数值方法。实验数学。24, 1-12 (2015). doi:10.1080/10586458.2014.976801,初步版本。http://arxiv.org/abs/1402.5295 ·Zbl 1381.11075号
[5] Blackford,L.S.、Choi,J.、Cleary,A.、D'Azevedo,E.、Demmel,J.和Dhillon,I.、Dongarra,J.,Hammarling,S.、Henry,G.、Petitet,A.、Stanley,K.、Walker,D.、Whaley,R.C.:ScaLAPACK用户指南。费城工业与应用数学学会(1997)·Zbl 0886.65022号 ·数字对象标识代码:10.1137/1.9780898719642
[6] Borwein,P.,Choi,S.,Rooney,B.等人(编辑):黎曼假设:社交和演奏者的资源。收录:CMS数学书籍。施普林格,纽约(2008)·Zbl 1132.11047号
[7] Buttari,A.、Langou,J.、Kurzak,J.和Dongarra,J.:多核架构的一类并行分片线性代数算法。并行计算。35, 38-53 (2009) ·doi:10.1016/j.parco.2008.10.02
[8] Cannon,L.E.:实现卡尔曼滤波算法的蜂窝计算机。蒙大拿州立大学博兹曼分校博士论文(1969年)·Zbl 1241.65028号
[9] 克莱研究所:千年奖问题(2013年)。http://www.claymath.org/millennium-problems。2014年12月15日访问
[10] Coppersmith,D.,Winograd,S.:通过算术级数进行矩阵乘法。J.塞姆。计算。9, 251-280 (1990) ·Zbl 0702.65046号 ·doi:10.1016/S0747-7171(08)80013-2
[11] Demmel,J.、Grigori,L.、Hoemmen,M.、Langou,J.:通信优化并行和序列QR及LU因子分解。SIAM J.科学。计算。34,A206-A239(2012)·Zbl 1241.65028号 ·doi:10.1137/080731992年
[12] Dodgeson,C.L.:决定因素的凝聚。程序。伦敦皇家足球俱乐部。15, 150-155 (1866)
[13] Fousse,L.,Hanrot,G.,Lefèvre,V.,Pélissier,P.,Zimmermann P.MPFR:具有正确舍入的多精度二进制浮点库。ACM事务处理。数学。柔和。33, 13:1-13:15 (2007) ·Zbl 1365.65302号
[14] van de Geijn,R.A.,Watts,J.:SUMMA:可扩展通用矩阵乘法算法。Concurr。计算。实际。实验编号9255-274(1997)·doi:10.1002/(SICI)1096-9128(199704)9:4<255::AID-CPE250>3.0.CO;2-2号
[15] GNU(全球通用单位)。GNUMP图书馆(2013)。网址:http://gmplib.org。2013年6月10日访问·Zbl 0581.65031号
[16] Grigori,L.,Demmel,J.,Xiang,H.:CALU:通信最优LU分解算法。SIAM J.矩阵分析。申请。32, 1317-1350 (2011) ·Zbl 1242.65089号 ·doi:10.1137/100788926
[17] Haidar,A.,Ltaief,H.,YarKhan,A.,Dongarra,J.:多核架构上稠密线性代数的动态调度分片算法分析。Concurr。计算。实际。实验24305-321(2011)·doi:10.1002/第1829页
[18] Haque,S.A.,Moreno Maza,M.:使用冷凝法对GPU进行行列式计算。《物理学杂志》。Conf.序列号。341, 012031 (2012) ·doi:10.1088/1742-6596/341/1/012031
[19] van der Hoeven,J.:球算法。摘自:Beckmann,A.,Gaßner,C.,Löwe,B.(eds.)《计算和复杂性障碍的逻辑方法学报》,第179-208页,Ernst-Moritz-Arndt-Universität Greifswald,Greifswold。http://www.texmacs.org/joris/ball/ball-abs.html
[20] van der Hoeven,J.、Lecerf,G.、Quintin,G.:《Mathemagix》中的模块化SIMD算法(2014)。arXiv:1407.3383·Zbl 1391.65003号
[21] van der Hoeven,J.、Lecerf,G.、Mourain,B.等人:Mathemagix,2012-2014年。软件。http://www.mathemagix.org。2014年12月15日访问
[22] 印度。MPFI库。https://gforge.inria.fr/projects/mpfi/ (2013). 2013年6月10日访问
[23] Johansson,F.:Arb(2013)。http://fredrikj.net/arb/。访问日期:2014年12月15日
[24] Kouya,T.:MPIGMP库(2013)。http://na-inet.jp/na/。2013年6月10日访问
[25] Lu,M.:GPUprec:支持图形处理器上的高精度。http://code.google.com/p/gpuprec/ (2013). 2013年6月10日访问
[26] von Mangoldt,H.:Zu Riemanns Abhandlung“Un ber die Anzhal der Primzahlen unter einer gegebenen Grösse”。J.Reine Agew。数学。114, 255-305 (1985)
[27] 于马蒂亚塞维奇:后验区间分析。莱克特。注释计算。科学。204, 328-334 (1985) ·Zbl 0581.65031号 ·doi:10.1007/3-540-15984-3289
[28] 于马蒂亚塞维奇:关于黎曼zeta函数零点的新猜想。莱斯特大学数学系的研究报告MA12-03(2012)。http://www2.le.ac.uk/departments/mathematics/research/research-reports-2/reports-2012/MA12_03Matiyasevich.pdf/view和[32]。2014年12月15日访问
[29] 于马蒂亚塞维奇:通过插值行列式计算黎曼zeta函数零点的近似值。一、功能。分析。其他数学。4(1)(2012)(待发布)·Zbl 0185.40101号
[30] 于马蒂亚塞维奇:通过插值行列式计算黎曼zeta函数零点的近似值。二、。功能。分析。其他数学。4(2)(2012)(待发布)
[31] 于马蒂亚塞维奇:通过插值行列式计算黎曼zeta函数。波恩马普数学研究所2013-18预印本(2013)。http://www.mpim-bonn.mpg.de/preblob/5368和[32]。2014年12月15日访问
[32] Matiyasevich,余:一种朴素的方法,正在进行的项目。http://logic.pdmi.ras.ru/尤马/个人杂志/艺术方法/。2014年12月15日访问
[33] Yu Matiyasevich。,Beliakov,G.:临界线上Riemann zeta函数的零点,精确到20000位小数,澳大利亚研究数据(2013)。http://hdl.handle.net/10536/DRO/DU:30051725。2014年12月15日访问·兹伯利0581.65031
[34] Nakayama,T.:CUMP图书馆。http://www.hpcs.cs.tsukuba.ac.jp/nakayama/cump/(2013)。2013年6月10日访问
[35] Nakayama,T.,Takahashi,D.:用于GPU计算的多精度浮点运算库的实现。摘自:IASTED第23届并行和分布式计算与系统国际会议论文集(PDCS 2011),第343-349页。IASTED卡尔加里,加拿大(2011年)
[36] Poulson,J.、Marker,B.、van de Geijn,R.、Hammond,J.和Romero,N.:元素:分布式内存密集矩阵计算的新框架。ACM事务处理。数学。柔和。39(2),13:1-13:24(2013)·Zbl 1295.65137号
[37] Schönhage,A.,Strassen,V.:Schnelle Multiplikation grosser Zahlen。计算7281-292(1971)·Zbl 0223.68007号
[38] 斯特拉森:高斯消去法不是最优的。数字。数学。13, 354-356 (1969) ·Zbl 0185.40101号 ·doi:10.1007/BF02165411
[39] Thakur,R.、Rabenseifner,R.和Gropp,W.:MPICH中集体通信操作的优化。国际期刊高性能计算。申请。19, 49-66 (2005) ·doi:10.1177/109434205051521
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。