×

可重构硬件中的多重网格求解器。 (英文) Zbl 1131.65096号

摘要:求解偏微分方程的问题在建模现实问题中起着重要作用。在过去的几年中,多重网格求解器由于其与问题大小无关的高收敛速度,显示了其相对于其他技术的鲁棒性。为此,人们尝试了许多利用多重网格固有并行性的方法,以达到所需的效率和可扩展性。然而,由于软件实现所控制的许多因素(时间、资源),在这方面大多数工作都失败了。
本文给出了求解二维泊松方程的V循环多重网格方法的硬件实现。我们使用Handel-C实现硬件设计,并将其映射到可用的现场可编程门阵列(FPGA)上。我们使用FPGA供应商的工具分析了实现性能。我们在硬件和软件上证明了多重网格相对于其他类似迭代求解器的鲁棒性,如Jacobi和逐次过松弛(SOR)。我们将我们的发现与每种算法的C++版本进行了比较。与现有软件版本相比,获得的结果显示了更好的性能。

MSC公司:

65号55 多重网格方法;含偏微分方程边值问题的区域分解
35J05型 拉普拉斯算子、亥姆霍兹方程(约化波动方程)、泊松方程
65层10 线性系统的迭代数值方法
65号06 含偏微分方程边值问题的有限差分方法
65N12号 含偏微分方程边值问题数值方法的稳定性和收敛性
2005年5月 并行数值计算
65日元 数值算法的封装方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Altera\(\langle;\)网址:http://www.altera.com\(\rangle;\)。;Altera\(\langle;\)网址:http://www.altera.com\(\rangle;\)。
[2] N.Bagherzade、F.Kurdahi、H.Singh、G.Lu、M.Lee、E.Filho,《MorphoSys:MorphoSis可重构计算处理器的设计与实现》,J.VLSI信号处理-系统信号图像视频技术。24 (2-3) (2000) 147-164.; N.Bagherzade,F.Kurdahi,H.Singh,G.Lu,M.Lee,E.Filho,《MorphoSys:MorphoSis可重构计算处理器的设计与实现》,J.VLSI信号处理-系统信号图像视频技术。24 (2-3) (2000) 147-164.
[3] D.Bailey,J.M.Borwein,《计算机辅助数学的未来展望》,加拿大数学学会笔记,第37卷,第8期,2005年,第2-6页。;D.Bailey,J.M.Borwein,《计算机辅助数学的未来展望》,加拿大数学学会笔记,第37卷,第8期,2005年,第2-6页。
[4] Barr,M.,《可重构计算入门》(1998),弗里曼公司:弗里曼公司-米勒
[5] 巴雷特·R。;贝里,M。;Chan,T.F。;德梅尔,J。;J.多纳托。;Dongarra,J。;埃伊霍特,V。;波佐,R。;罗明,C。;Van der Vorst,H.,《线性系统解的模板:迭代方法的构建块》(1994),SIAM:SIAM Philadelphia,PA
[6] S.Barsky,Barsky,(2003\langle;)www.mgnet.org/mgnet-codes-Barsky.html(\rangle;)。;S.Barsky,Barsky,(2003\langle;)www.mgnet.org/mgnet-codes-Barsky.html(\rangle;)。
[7] Bertsekas,D。;Tsitsiklis,J.,《并行和分布式迭代算法的一些方面:综述》,Automatica,27,1,3-21(1991)·Zbl 0728.65041号
[8] Bolz,J。;农民,I。;格林斯彭,E。;Shroder,P.,《GPU上的稀疏矩阵解算器:共轭梯度和多重网格》,ACM Trans。图形,22,3(2003)
[9] A.Borzi,《多重网格方法介绍》,Mthematik und Wissenschaftliches Rechnen研究所,(1999\langle;)www.kfunigraz.ac.at/imawww/Borzi/mgintro.pdf\(\rangle;\);A.Borzi,《多重网格方法介绍》,Mthematik und Wissenschaftliches Rechnen研究所,(1999\langle;)www.kfunigraz.ac.at/imawww/Borzi/mgintro.pdf\(\rangle;\)
[10] J.Bramble,多重网格方法,《数学系列中的皮特曼研究笔记》,第294卷,朗曼科学出版社,纽约,1993年。;J.Bramble,多重网格方法,《数学系列中的皮特曼研究笔记》,第294卷,朗曼科学出版社,纽约,1993年·Zbl 0786.65094号
[11] Brandt,A.,边值问题的多级自适应解决方案,数学。公司。,1, 31, 333-390 (1977) ·Zbl 0373.65054号
[12] 布里格斯,W.L。;亨森,V.E。;Mccormick,S.F.,《多重网格教程》(2000),SIAM:宾夕法尼亚州费城SIAM·Zbl 0958.65128号
[13] Celoxica\(\langle;\)www.Celoxica.com\(\rangle;\)。;Celoxica\(\langle;\)www.Celoxica.com\(\rangle;\)。
[14] Chrzanowska-Jeske,M.,《建筑与综合问题FPGA》(NORTHCON’93电气与电子会议论文集(1993)),102-105
[15] 康普顿,K。;Hauck,S.,《可重构计算:系统和软件调查》,ACM Compute。调查,34,171-210(2002)
[16] Cong,J.,FPGA合成与可重构计算(1997),加利福尼亚大学洛杉矶分校,www.ucop.edu/research/micro/\(96_9 7/96_176\).pdf\(\rangle\)
[17] 达马吉一世。;Diab,H.,使用可重构计算的线性代数函数性能评估,国际。超级计算机杂志。,24, 1, 91-107 (2003) ·Zbl 1033.68139号
[18] 达马吉一世。;霍金斯,J。;Abdallah,A.,将高级算法映射到大规模并行可重构硬件,(IEEE国际计算机系统和应用会议(2003)),14-22
[19] K.Datta,S.Merchant,《钛合金心脏模拟的多重网格方法》。2006年1月检索自加州大学伯克利分校计算机科学系网站:\(\langle;\)网址:http://www.cs.berkeley.edu/\(\sim;\)kdatta/classes/cs267.doc\(\rangle;\。;K.Datta,S.Merchant,《钛合金心脏模拟的多重网格方法》。2006年1月检索自加州大学伯克利分校计算机科学系网站:\(\langle;\)网址:http://www.cs.berkeley.edu/\(\sim;\)kdatta/classes/cs267.doc \(\rangle;\”)。
[20] Douglas,C.,MadPack:抽象多重网格或多级解算器家族,计算。申请。数学。,14, 3-20 (1995) ·Zbl 0836.65125号
[21] A.J.Elbirt,C.Paar,Serpent块密码的FPGA实现和性能评估,载于:ACM/SIGDA FPGA国际研讨会,2000年,第33-40页。;A.J.Elbirt,C.Paar,蛇块密码的FPGA实现和性能评估,载于:ACM/SIGDA FPGA国际研讨会,2000年,第33-40页。
[22] R.Enzler,《可重构计算的现状》,《技术报告》,苏黎世瑞士联邦理工学院电子实验室,1999年。;R.Enzler,《可重构计算的现状》,《技术报告》,苏黎世瑞士联邦理工学院电子实验室,1999年。
[23] FPGA4Fun,FPGA设计条目,\(2005\langle;\)www.FPGA4Fun.com/DesignEntry.html \(\rangle;\)。;FPGA4Fun,FPGA设计条目,\(2005\langle;\)www.FPGA4Fun.com/DesignEntry.html \(\rangle;\)。
[24] 晚安,N。;Woolley,C。;Lewin,G。;Luebke,D。;Humphreys,G.,《使用可编程图形硬件解决边界值问题的多重网格解算器》,(ACM SIGGRAPH/EUROGRAPHICS图形硬件会议论文集(2003),102-111
[25] Hackbusch,W.,多网格方法与应用(1985),施普林格:施普林格柏林·Zbl 0577.65118号
[26] Y.Khaliollahi,交换元件,FPGA架构的关键,收录于:WESCON会议记录,1994年,第682-687页。;Y.Khaliollahi,交换元件,FPGA架构的关键,收录于:WESCON会议记录,1994年,第682-687页。
[27] MGNet主页:\(\langle;\)http://www.mgnet.org/\(\rangle;\)。;MGNet主页:\(\langle;\)http://www.mgnet.org/\(\rangle;\)。
[28] 佩莱林,D。;Thibault,S.,《C语言中的实用FPGA编程》(Prentice-Hall Professional Technical Reference,2005),《Prentice-Hall:新泽西州普伦蒂斯·霍尔上鞍河》
[29] Peter,C.,《概述:硬件编译和Handel-C语言》(2002),牛津大学计算实验室http://web.com.lab.ox.uk/oucl/work/christian.peter网址/\(\操作员姓名{概述}\operatorname{andelc}\).html\(\rangle\)
[30] A.K.Sharma,可编程逻辑手册PLD、CPLD和FPGA,McGraw Hill,纽约,1998年。;A.K.Sharma,可编程逻辑手册PLD、CPLD和FPGA,McGraw Hill,纽约,1998年。
[31] J.Shewel,使用可配置计算技术的硬件/软件协同设计系统,(1998年)http://ipdps.cc.gatech.edu/1998/it/schewel.pdf\(\rangle;\)。;J.Shewel,使用可配置计算技术的硬件/软件协同设计系统,(1998年)http://ipdps.cc.gatech.edu/1998/it/schewel.pdf\(\rangle;\)。
[32] Smedinghoff,M.L.,用多重网格求解泊松方程(2005)http://cd-amr.fnal.gov/aas/poisson.pdf\(\等级\)
[33] 术语。伯恩茅斯大学设计、工程与计算学院http://dec.bournemouth.ac.uk/\(\操作员姓名{图纸}_{\operatorname{l}}\operator名称{ib}\)/terminology.html\(\rangle;\)。;术语。伯恩茅斯大学设计、工程和计算学院\(\langle;\)http://dec.bournemouth.ac.uk/\(\操作员姓名{图纸}_{\operatorname{l}}\operatername{ib}\)/terminology.html\(\rangle;\)。
[34] 托德曼,T.J。;Constantinides,G.A。;Wilton,S.J.E。;曼瑟,O。;卢克,W。;Cheung,P.Y.K.,可重构计算:体系结构和设计方法,IEE计算机与数字技术论文集,152,2193-197(2005)
[35] 托尔斯蒂,T。;海斯卡宁,M。;Puska,M。;Nieminen,R.,MIKA:基于多重网格的电子结构计算程序包,国际。量子化学杂志。,91, 2, 171-176 (2003)
[36] Turely,J.,《芯片是如何设计的》(Prentice-Hall Professional Technical Reference(2003),Prentice-Hall:新泽西州普伦蒂斯·霍尔上鞍河),(\langle\)www.phptr.com/articles/\(\rangle\)
[37] 瓦希德,F。;Givargis,T.,《嵌入式系统设计:统一硬件/软件介绍》(2002),威利出版社:威利纽约
[38] 瓦伦蒂娜,S.K.,用VHDL设计数字系统,学术开放互联网杂志,11(2004)
[39] Wesseling,P.,《多重网格方法导论》(1992),威利:威利纽约·Zbl 0760.65092号
[40] 锡林克斯\(\langle;\)www.Xilinx.com\(\rangle;\)。;Xilinx\(\langle;\)www.Xilinx.com\(\rangle;\)。
[41] D.Young,迭代方法的历史回顾。报告CNA-206,德克萨斯大学奥斯汀分校数值分析中心,1987年。;D.Young,迭代方法的历史回顾。报告CNA-206,德克萨斯大学奥斯汀分校数值分析中心,1987年。
[42] J.Yström,Multigrid methods improved solvers for both speed and memory,\(2005\langle;\)www.comsol.fr/femlab2005/sample.doc\(\rangle;\)。;J.Yström,Multigrid methods improved solvers for both speed and memory,\(2005\langle;\)www.comsol.fr/femlab2005/sample.doc\(\rangle;\)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。