×

批量标量和块三对角解算器的多核算法。 (英语) Zbl 1369.65047号


MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] AMD公司。2013.AMD64架构程序员’s手册第1-5卷。2006年5月17日检索自http://developer.amd.com/resources/documentation-articles/developer-guides-manuals/#manuals。
[2] 斯特凡·邦德利。1991.分治:求解三对角线性方程组的并行算法。并行计算17、45、419–434。内政部:http://dx.doi.org/10.1016/S0167-8191(05)80145-0 ·Zbl 0739.65016号 ·doi:10.1016/S0167-8191(05)80145-0
[3] 张立文(Li-Wen Chang)、约翰·斯特拉顿(John A.Stratton)、金喜硕(Hee-Seok Kim)和文美·W.Hwu。2012.使用GPU的可扩展、数值稳定、高性能三对角解算器。《高性能计算、网络、存储和分析国际会议论文集》(SC’12)。IEEE计算机学会出版社,加利福尼亚州洛斯阿拉米托斯,第27条,11页。http://dl.acm.org/citation.cfm?id和equals;2388996.2389033.
[4] I.J.D.Craig和A.D.Sneyd。1988.混合导数抛物方程的交替方向隐式格式。计算机与数学应用16、4、341-350。内政部:http://dx.doi.org/10.1016/0898-1221(88)90150-2 ·Zbl 0654.65072号 ·doi:10.1016/0898-1221(88)90150-2
[5] Duy M.Dang、Christina Christara和Kenneth R.Jackson。2010.抛物线偏微分方程ADI有限差分方法的GPU并行实现及其在金融中的应用。社会科学研究网络工作论文系列。http://ssrn.com/abstract=1580057. ·Zbl 1229.91335号
[6] Craig C.Douglas、Sachit Malhotra和Martin H.Schultz。1998年,具有二维ADI类平滑器的并行多重网格。http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.36.3502&代表等于&等于;rep1&type&equals&等于;pdf格式·Zbl 0931.65121号
[7] J.Douglas和H.H.Rachford。1956.关于两个和三个空间变量中热传导问题的数值解。美国数学学会学报82,421-489·Zbl 0070.35401号 ·doi:10.1090/S0002-9947-1956-0084194-4
[8] 小吉姆·道格拉斯和詹姆斯·冈恩。1964.交替方向法的一般公式。数字数学6,1,428–453。内政部:http://dx.doi.org/10.1007/BF01386093 ·Zbl 0141.33103号 ·doi:10.1007/BF01386093
[9] B.Dring、M.Fourni和A.Rigal。2014.带混合导数项的对流扩散方程的高阶ADI格式。在偏微分方程的谱和高阶方法(ICOSAHOM’12)中,Mejdi Azaez、Henda El Fekih和Jan S.Hesthaven(编辑)。《计算科学与工程讲义》,第95卷。施普林格国际出版公司,217-226。内政部:http://dx.doi.org/10.1007/978-3-319-01601-6_17 ·Zbl 1282.65101号 ·doi:10.1007/978-3-319-01601-6_17
[10] Walter Gander和Gene H.Golub。1997年。循环还原-历史和应用。科学计算研讨会论文集·Zbl 0921.65023号
[11] S.P.Hirshman、K.S.Perumalla、V.E.Lynch和R.Sanchez。BCYCLIC:并行块三对角矩阵循环求解器。计算物理杂志229,18,6392–6404。内政部:http://dx.doi.org/10.1016/j.jcp.2010.04.049 ·兹比尔1197.65032 ·doi:10.1016/j.jcp.2010.04.049
[12] 英特尔。2012年a。英特尔64与IA-32体系结构优化参考手册。英特尔。2006年5月17日检索自http://www.intel.com/content/dam/doc/manual/64-ia-32-architectures-optimization-manual.pdf。
[13] 英特尔。2012年b。Intel Xeon Phi协处理器指令集体系结构参考手册。英特尔。2006年5月17日检索自https://software.intel.com/sites/default/files/forum/278102/327364001en.pdf。
[14] 英特尔。2015.数学内核库。2006年5月17日检索自http://software.intel.com/en-us/articles/intel mkl/。
[15] 萨米尔·卡拉和张军。2004.求解非定常对流扩散问题的高阶{ADI}方法。计算物理杂志198,1,1–9。内政部:http://dx.doi.org/10.1016/j.jcp.2004.01.002 ·Zbl 1053.65067号 ·doi:10.1016/j.jcp.2004.01.002
[16] Nathan Mattor、Timothy J.Williams和Dennis W.Hewett。1995.并行求解三对角矩阵问题的算法。并行计算21、11、1769–1782。DOI:“>http://dx.doi.org/10.1016/0167-8191(95)00033-0 ·doi:10.1016/0167-8191(95)00033-0
[17] 英伟达。2010年,特斯拉C2050/C2070 GPU计算处理器。2006年5月17日检索自http://www.nvidia.com/docs/IO/43395/NV_DS_Tesla_C2050_C2070_jul10_lores.pdf。
[18] 英伟达。2015年a。CUDA C编程指南。2006年5月17日检索自http://docs.nvidia.com/cuda/cuda-c-programming-guide/#axzz3aTPUq4Jo。
[19] NVIDIA 2015年b。保管库v7.0。2006年5月17日检索自http://docs.nvidia.com/cuda/cusparse/index.html#axzz3aTPUq4Jo。
[20] D.W.Peaceman和H.H.Rachford,Jr.1955年。抛物型和椭圆型微分方程的数值解。工业和应用数学学会杂志。3, 1, 28–41. http://www.jstor.org/stable/2098834 ·Zbl 0067.35801号 ·数字对象标识代码:10.1137/0103003
[21] William H.Press、Saul A.Teukolsky、William T.Vetterling和Brian P.Flannery。2007年,《数字配方:科学计算的艺术》(第三版)。剑桥大学出版社,纽约州纽约市·Zbl 1132.65001号
[22] 托马斯·普利亚姆(Thomas H.Pulliam)。计算流体动力学中的隐式解方法。应用数值数学2,6441–474。内政部:http://dx.doi.org/10.1016/0168-9274(86)90002-4 ·Zbl 0619.76095号 ·doi:10.1016/0168-9274(86)90002-4
[23] I.Reguly、E.Laszlo、G.Mudalige和M.Giles。2016.对多核架构的非结构化网格计算进行矢量化。并发与计算:实践与经验28,2557-577。http://dx.doi.org/10.1002/cpe.3621。 ·doi:10.1002/cpe.3621
[24] Subhash Saini、Johnny Chang和Haoqiang Jin。2015年,使用科学和工程应用程序对基于Intel Sandy Bridge的NASA昴宿星团进行性能评估。技术报告。NASA高级超级计算部门,NASA艾姆斯研究中心,加利福尼亚州莫菲特菲尔德。https://www.nas.nasa.gov/assets/pdf/papers/nas_Technical_Report_nas-2015-05.pdf。
[25] 尼古拉·萨哈尼赫(Nikolai Sakharnykh)。2009年。GPU上的三对角解算器及其在流体模拟中的应用。在加利福尼亚州圣何塞举行的GPU技术会议上发表。2006年5月17日检索自http://www.nvidia.com/content/gtc/documents/1058_gtc09.pdf。
[26] 尼古拉·萨哈尼赫(Nikolai Sakharnykh)。2010年,ADI方法和流体模拟的高效三对角求解器。发表于加利福尼亚州圣何塞市GPU技术会议。2006年5月17日检索自http://on-demand.gputechconf.com/gtc/2010/presentations/S12015-Tridiagonal-Solvers-ADI-Methods-Fluid-Simulation.pdf。
[27] Sudip K.Seal、Kalyan S.Perumalla和Steven P.Hirshman。2013年,重温块三对角方程组的并行循环约简和基于前缀的并行算法。并行与分布式计算杂志73,2,273–280。内政部:http://dx.doi.org/10.1016/j.jpdc.2012.10.03 ·Zbl 1270.68386号 ·doi:10.1016/j.jpdc.2012.10.03
[28] G.Spaletta和D.J.Evans。1993。求解三对角线性系统的并行递归解耦算法。并行计算19、5、563–576。内政部:http://dx.doi.org/10.1016/0167-8191(93)90006-7 ·Zbl 0783.65021号 ·doi:10.1016/0167-8191(93)90006-7
[29] 克里斯托弗·P·斯通、伯爵·P·N·杜克、姚张、大卫·卡尔、约翰·D·欧文斯和罗杰·戴维斯。2011.结构化网格CFD代码的GPGPU并行算法。第20届AIAA计算流体动力学会议论文集,第3221卷·doi:10.2514/6.2011-3221
[30] 哈罗德·斯通。1973.求解三对角线性方程组的有效并行算法。ACM杂志20,1,27–38。内政部:http://dx.doi.org/10.1145/321738.321741 ·Zbl 0269.65018号 ·数字对象标识代码:10.1145/321738.321741
[31] L.H.托马斯。1949年。网络上线性微分方程中的椭圆问题。技术报告。纽约哥伦比亚大学。
[32] 亨克·范德福斯特(Henk A.van der Vorst)。1987.向量机和并行计算机上的大型三对角和块三对角线性系统。并行计算5、12、45–54。内政部:http://dx.doi.org/10.1016/0167-8191(87)90005-6应用研究与开发中向量和并行计算问题国际会议论文集·Zbl 0632.65034号 ·doi:10.1016/0167-8191(87)90005-6
[33] H.H.Wang。1981.三对角方程的一种并行方法。ACM数学软件汇刊7、2、170–183。内政部:http://dx.doi.org/10.1145/355945.355947 ·Zbl 0473.65010号 ·数字对象标识代码:10.1145/355945.355947
[34] H.Wong、M.-M.Papadopoulou、M.Sadooghi-Alvandi和A.Moshovos。2010年。通过微基准测试揭开GPU微体系结构的神秘面纱。在IEEE系统软件性能分析国际研讨会(ISPASS’10)上。235–246. 内政部:http://dx.doi.org/10.109/ISPASS.2010.5452013 ·doi:10.1109/ISPASS.2010.5452013
[35] 姚张、乔纳森·科恩和约翰·欧文斯。2010年。GPU上的快速三对角解算器。SIGPLAN通知45、5、127–136。内政部:http://dx.doi.org/10.1145/1837853.1693472 ·doi:10.1145/1837853.1693472
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。