×

宇宙微波天空高阶相关器的可分离投影积分:加速度因子超过100。 (英语) Zbl 1349.85001号

摘要:我们提供了一个案例研究,描述了优化和现代化“Modal”的努力,该模拟和分析管道用于普朗克卫星实验,通过宇宙微波背景辐射的双谱(或三点相关器)限制早期宇宙的一般非高斯模型。我们关注代码中的一个特定元素:从膨胀结束到解耦时球壳的双谱投影,这定义了我们今天观察到的CMB。该代码涉及两个函数之间的三维内积,其中一个函数需要在包含稀疏网格的非矩形域上进行积分。我们表明,通过使用可分离方法,此计算可以简化为一维求和加上两个积分,将整体维度从四个减少到三个。可分离函数的引入也解决了非矩形稀疏网格的问题。这种可分离方法在某些情况下可能会变得不稳定,因此必须计算较慢的不可分离积分。我们将讨论这两种方法的优化。我们展示了00{\(\次\)}的显著加速,这是算法改进和架构软件优化的结合,旨在改进线程和矢量化行为。生成的MPI/OpenMP混合代码能够在包含处理器和/或协处理器的集群上执行,在多达16个节点上的扩展效率高达98.6%。我们发现,单个协处理器比两个处理器套接字的性能好1.3倍,并且在两个微体系结构的组合中运行相同的代码可以使每个节点的性能提高3.38倍。通过使双谱计算与功率谱(或两点相关器)的计算具有竞争力,我们现在可以考虑对宇宙学科学新数据的开发进行联合分析。

MSC公司:

85-04 天文学和天体物理学相关问题的软件、源代码等
65日元 数值算法的封装方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Martinez-Gonzalez,E。;朱利奥·加列戈斯(Julio E.Gallegos)。;Argueso,F。;Cayon,L。;Sanz,J.L.,《球面小波检测CMB天空中非高斯性的性能》,孟买。不是。R.阿斯顿。《社会学杂志》,336,22(2002)
[2] 安托万,J.-P。;Vandergheynst,P.,《n球面上的小波及相关流形》,J.Math。物理。,393987-4008(1998年8月)·Zbl 0929.42029号
[3] Cayon,L。;Martinez-Gonzalez,E。;Argueso,F。;Banday,A.J。;Gorski,K.M.,非线性耦合参数的COBE-DMR约束:一种基于小波的方法,Mon。不是。R.阿斯顿。《社会学杂志》,339,1189(2003)
[4] 兰,X。;Marinucci,D.,针刺双谱,电子。J.Stat.,2332-367(2008)·Zbl 1320.62106号
[5] Rudjord,Ø。;Hansen,F.K。;兰,X。;利古里,M。;Marinucci,D。;Matarrese,S.,非高斯参数的方向变化\(f_{NL}\),天体物理学。J.,7081321-1325(2010年1月)
[6] Donzelli,S。;汉森,F.K。;利古里,M。;Marinucci,D。;Matarrese,S.,关于针状/小波非高斯估计的线性项校正,天体物理学。J.,755,19(2012年8月)
[7] 小松、一郎;斯佩格尔(David N.Spergel)。;Wandelt,Benjamin D.,《在宇宙微波背景下测量原始非高斯性》,天体物理学。J.,634,14-19(2005)
[8] 小松,E.,威尔金森微波各向异性探测器(WMAP)第一年观测:高斯检验,天体物理学。补充期刊。,148, 119-134 (2003)
[9] 马丁·巴彻(Martin Bucher);Van Tent,Bartjan;Carvalho,Carla Sofia,使用新的灵活估计器检测通货膨胀引起的双谱声学振荡(2009年)
[10] Münchmeyer,M。;Bouchet,F。;Jackson,M.G。;Wandelt,B.,《宇宙微波背景双谱中振荡的小松-斯伯格-Wandert估计器》,Astron。天体物理学。,570,第A94条pp.(2014年10月)
[11] Fergusson,J.R。;Edward P.S.Shellard,《原始非高斯性和CMB双谱》,《物理学》。D版,第76、8条,第083523页(2007年)
[12] Fergusson,J.R。;利古里,M。;Shellard,E.P.S.,《一般CMB和原始双谱估计:模式扩展、地图制作和测量》,Phys。D版,82,2,第023502条,pp.(2010)
[13] Ade,P.A.R.,普朗克2013年结果。二十四、。原始非高斯约束,Astron。天体物理学。,571,第A24条pp.(2014)
[14] Ade,P.A.R.,普朗克2015年结果。十七、。原始非高斯性约束(2015)
[15] 彭尼库克,S.J。;克里斯托弗·休斯(Christopher J.Hughes)。;米哈伊尔·斯梅尔扬斯基(Mikhail Smelyanskiy);Jarvis,S.A.,使用Intel Xeon处理器和Intel Xeon-Phi协处理器探索分子动力学的SIMD,(IEEE国际并行与分布式处理研讨会论文集。IEEE国际平行与分布式处理会议论文集,IPDPS’13,马萨诸塞州波士顿(2013年5月))
[16] 马里兰州Mostafa Ali Patwaray。;纳达图尔·萨蒂什;纳拉亚南·桑达拉姆;Fredrik Manne;哈比卜、萨勒曼;Dubey,Pradeep,PARDICLE:并行近似密度聚类,《高性能计算、网络、存储和分析国际会议论文集》。高性能计算、网络、存储和分析(SC)国际会议记录,SC’14,新奥尔良,LA(2014年11月)
[17] 桑奇特·米斯拉;Kiran Pamnany;Aluru,Srinivas,Intel Xeon Phi协处理器上基于并行互信息的全基因组网络构建,(IEEE国际并行与分布式处理研讨会论文集。IEEE国际平行与分布式处理会议论文集,IPDPS’14,亚利桑那州凤凰城(2014年5月))
[18] Joo,巴林特;Dhiraj D.Kalamkar。;瓦迪亚纳桑,卡提基扬;斯梅尔扬斯基,米哈伊尔;Kiran Pamnany;Victor W.Lee。;Pradeep Dubey;Watson,William,Lattice QCD on Intel Xeon Phi协处理器,(IEEE国际超级计算会议论文集。IEEE国际超计算会议论文集中,ISC’13,德国莱比锡(2013年6月))
[19] 埃多亚多·阿普拉;迈克尔·克莱姆(Michael Klemm);Kowalski,Karol,在(Intel®)Xeon(Phi™)协处理器上高效实现多体量子化学方法,(高性能计算、网络、存储和分析国际会议论文集(2014),IEEE出版社),674-684
[20] 尼古拉斯·黑尔(Nicholas Hale);Townsend,Alex,Gauss-Legendre和Gauss-Jacobi求积节点和权重的快速准确计算,SIAM J.Sci。计算。,35、2、A652-A674(2013)·Zbl 1270.65017号
[21] 詹姆斯·杰弗斯(James Jeffers);Reinders,James,Intel Xeon Phi协处理器高性能编程(2013),Newnes
[22] John D.McCalpin,《当前高性能计算机中的内存带宽和机器平衡》,(IEEE计算机学会计算机体系结构技术委员会(TCCA)通讯(1995年12月),19-25
[24] Reinders,James,Intel Threading Building Blocks:Outfitting C++for Multi-core Processor Parallelism(2007),O'Reilly Media,Inc。
[25] 梅多斯,拉里,车速表:你的代码有多快?,访问时间:2015年3月
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。