文件Zbl 1433.65368-zbMATH Open

罗马人Iakymchuk;玛丽亚·巴雷达;马蒂亚斯·维森伯格;JoséI·Aliaga。;恩里克·金塔纳·奥尔蒂。

并行预处理共轭梯度的再现性策略。（英语） Zbl 1433.65368号

J.计算。申请。数学。 371，文章ID 112697，13 p.（2020）.

摘要：预处理共轭梯度法是数值模拟中常用的方法。虽然被广泛使用，但该解算器也因其在计算残差时缺乏准确性而闻名。在本文中，我们的目标有两个：提高求解器的准确性，同时确保其在消息传递实现中的再现性。我们从ExBLAS方法（通过保留每一位信息直到最后四舍五入）到更轻量级的面向性能的变体（通过扩展中间精度），设计并使用了各种策略。这些算法策略通过可编程性建议得到加强，以确保确定性执行。最后，我们在现代HPC系统上验证了这些策略：这两个版本在768个进程上只需29%（ExBLAS）和4%（轻量级）的开销即可提供可重复的迭代次数、残差、直接错误和向量解决方案。

引用于三文件

MSC公司：

2005年5月	并行数值计算
65年20月	数值算法的复杂性和性能
2010年第68季度	计算模式（非确定性、并行、交互式、概率性等）

关键词：

再现性;精确;浮点扩展;长蓄能器;预处理共轭梯度;高性能计算

软件：

高功率激光器;FELTOR公司;ExBLAS公司;LBNL公司;MPFR公司;mctoolbox软件;BLAS公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部哈尔

参考文献：

[1]	巴雷特·R。；贝里，M。；Chan，T.F。；德梅尔，J。；J.多纳托。；Dongarra，J。；艾伊霍特，V。；波佐，R。；罗明，C。；der Vorst，H.V.，《线性系统解的模板：迭代方法的构建块》（1994），SIAM
[2]	Saad，Y.，《稀疏线性系统的迭代方法》（2003），SIAM：美国宾夕法尼亚州费城SIAM·Zbl 1002.65042号
[3]	格罗普，W。；霍夫勒，T。；塔库尔，R。；Lusk，E.，《使用高级MPI：消息传递接口的现代特征》（2014），麻省理工学院出版社
[4]	劳森，C.L。；Hanson，R.J。；Kincaid，D.R。；Krogh，F.T.，Fortran使用的基本线性代数子程序，ACM Trans。数学。软件，5，3，308-323（1979）·Zbl 0412.65022号
[5]	Dongarra，J.J。；克罗兹，J.D。；Hammarling，S。；Duff，I.，一组三级基本线性代数子程序，ACM Trans。数学。软件，16，1，1-17（1990）·Zbl 0900.65115号
[6]	Collange，S。；迪福，D。；格雷亚特，S。；Iakymchuk，R.，《多核和多核架构并行简化的数值再现性》，ParCo，49，83-97（2015）
[7]	德梅尔，J。；Nguyen，H.D.，并行可再现求和，IEEE Trans。计算。，64, 7, 2060-2070 (2015) ·Zbl 1360.68042号
[8]	Iakymchuk，R。；格雷亚特，S。；迪福，D。；Quintana-Orti，E.S.，推导可再现LU因子分解的层次方法，国际高性能计算杂志。申请。，33, 5, 791-803 (2019)
[9]	Iakymchuk，R。；迪福，D。；Collange，S。；Graillat，S.，《可重复且精确的矩阵乘法》，Lect。注释计算。科学。，9553, 126-137 (2016) ·Zbl 1354.65082号
[10]	Higham，N.J.，《数值算法的准确性和稳定性》，680（2002），宾夕法尼亚州费城，SIAM:SIAM·Zbl 1011.65010号
[11]	穆勒，J.-M。；北布里斯巴雷。；de Dinechin，F。；珍妮罗德，C.-P。；列夫雷，V。；Melquiond，G。；Revol，N。；Stehlé博士。；Torres，S.，《浮点运算手册》，572（2010），Birkhäuser·Zbl 1197.65001号
[12]	臀部，S.M。；Ogita，T。；Oishi，S.，精确浮点求和第二部分：符号、K-fold忠实和四舍五入到最近值，SIAM J.Sci。计算。，31, 2, 1269-1302 (2008) ·Zbl 1190.65074号
[13]	Rump，S.M.，计算机辅助证明和自验证方法，（Einarsson，B.，科学计算准确性和可靠性手册（2005），SIAM），195-240
[14]	Bailey，D.H.，《高精度计算：应用和挑战》，（ARITH-21（2013），IEEE会议录），1，主题演讲
[15]	卢茨，D.R。；Hinds，C.N.，用于可再现浮点求和的高精度锚定累加器，（ARITH-24（2017）会议记录，IEEE:IEEE伦敦，英国），98-105
[16]	北伯吉斯。；古德耶，C。；卢茨，D.R。；Hinds，C.N.，用于可重复浮点求和的高精度锚定累加器，IEEE Trans。计算。，68, 7, 967-978 (2019) ·Zbl 07093733号
[17]	IEEE Computer Society，N.，IEEE浮点算法标准（2008），IEEE标准754-2008
[18]	D.Mukunoki，T.Ogita，K.Ozaki，《多核体系结构中使用Ozaki方案的准确和可复制BLAS例程》，摘自：Proc。并行处理与应用数学国际会议，PPAM20192019，接受。
[19]	Knuth，D.E.，《计算机编程的艺术：半数值算法》，第2卷（1969年），Addison-Wesley·Zbl 0191.18001号
[20]	Ogita，T。；臀部，S.M。；Oishi，S.，《精确和和点积》，SIAM J.Sci。计算。，26, 1955-1988 (2005) ·Zbl 1084.65041号
[21]	库利什，美国。；Snyder，V.，《精确点积作为长间隔算术的基本工具》，《计算》，91，3，307-313（2011）·Zbl 1228.65073号
[22]	Iakymchuk，R。；Collange，S。；迪福，D。；Graillat，S.，ExBLAS：可复制和准确的BLAS库，（作为SC15的一部分举行的NRE2015研讨会论文集。美国德克萨斯州奥斯汀，2015年11月15日至20日（2015年），LIP6，ICS，INRIA，DALI-LIRMM）
[23]	Hida，Y。；Li，X.S。；Bailey，D.H.，四双精度浮点算法，（ARITH-15（2001）会议记录），155-162
[24]	博尔多，S。；Melquiond，G.，《FMA和正确取整和的仿真：使用取整到奇数的证明算法》，IEEE Trans。计算。，第57462-471页（2008年）·Zbl 1388.65200号
[25]	Priest，D.M.，《任意精度浮点运算的算法》，（第十届IEEE计算机算术研讨会（1991），IEEE），132-143
[26]	Wiesenberger，M。；Einkemmer，L。；持有，M。；古铁雷斯-米拉，A。；Xavier Saez，X。；Iakymchuk，R.，并行计算机体系结构上feltor代码和库的再现性、准确性和性能，计算。物理学。通信，238145-156（2019）
[27]	HPCG-高性能共轭梯度（2015）
[28]	Dongarra，J。；Heroux，M.A.，《走向高性能计算系统排名的新标准》（2013），桑迪亚国家实验室，桑迪娅报告SAND2013-4744
[29]	佩蒂特，A。；R.C.惠利。；Dongarra，J。；Cleary，A.，HPL——分布式内存计算机的高性能Linpack基准测试的可移植实现（2008）
[30]	福斯，L。；Hanrot，G。；列夫雷，V。；Pélissier，P。；Zimmermann，P.，MPFR:具有正确舍入的多精度二进制浮点库，ACM-Trans。数学。软件，33，2，13（2007）·Zbl 1365.65302号
[31]	臀部，S.M。；Ogita，T。；Oishi，S.，快速高精度求和，非线性理论应用。，1, 1, 2-24 (2010)
[32]	J.Demmel，H.D.Nguyen，《快速再生浮点求和》，载于：《ARITH-21学报》，2013年，第163-172页。
[33]	Nguyen，H.D。；Demmel，J.，《可复制的兽皮QR》（ARITH-22（2015）会议记录），152-159
[34]	Ozaki，K。；Ogita，T。；Oishi，S。；Rump，S.M.，使用矩阵乘法快速例程进行矩阵乘法的无错误转换及其应用，Numer。算法，59,195-118（2012）·Zbl 1244.65062号
[35]	Carson，E。；Higham，N.J.，通过三种精度的迭代求精加速线性系统的求解，SIAM J.Sci。计算。，40、2、A817-A847（2018）·Zbl 1453.65067号

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

并行预处理共轭梯度的再现性策略。（英语） Zbl 1433.65368号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

并行预处理共轭梯度的再现性策略。 （英语） Zbl 1433.65368号

MSC公司：

关键词：

软件：

参考文献：

并行预处理共轭梯度的再现性策略。（英语） Zbl 1433.65368号