×

基于OpenMP的Kronecker描述符处理算法的性能评估。 (英语) Zbl 1242.65008号

小结:马尔科夫模型的数值分析与科学和工程中多个领域的性能评估和系统行为的概率分析相关。这些模型可以使用克罗内克代数以紧凑的方式表示。向量描述子乘积(VDP)是获得基于Kronecker描述子的模型稳态和瞬态解的关键操作。VDP算法通常是CPU密集型的,需要数据分区等替代方案才能在更短的时间内产生结果。本文介绍了一组用于处理描述符的混合算法的并行实现,并对四个实马尔科夫模型进行了详细的性能分析。这些实现基于使用OpenMP的不同调度策略、现有的静态和动态负载平衡技术以及文献中介绍的数据分区。性能评估研究包括对加速、同步和调度开销、任务映射策略和内存关联的分析。本文给出的结果深入了解了共享内存系统上应用程序的不同实现选择,以及该应用程序如何从该体系结构中获益。

MSC公司:

65C20个 概率模型,概率统计中的通用数值方法
2005年5月 并行数值计算
68平方米 计算机系统环境下的性能评估、排队和调度
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴尔多,L。;布伦纳,L。;费尔南德斯,L.G。;费尔南德斯,P。;销售,A.:主/从并行程序的性能模型,理论计算机科学电子笔记(ENTCS)128,第4期,101-121(2005)
[2] 贝尔,A。;Haverkort,B.R.:用于模型检查的基于磁盘的分布式算法,《系统设计中的形式化方法》29,第2期,177-196(2006)·Zbl 1110.68071号 ·doi:10.1007/s10703-006-0007-0
[3] Benoit,A。;费尔南德斯,P。;高原,B。;Stewart,W.J.:《关于使用函数转换和Kronecker代数的好处》,《性能评估》58,第4期,367-390(2004)
[4] ,Lncs 4486(2007)
[5] 布利克伯格,R。;Sörevik,T.:嵌套并行的负载平衡和openmp实现,并行计算31,第10–12期,984-998(2005)
[6] 布洛姆,S。;B.R.Haverkort。;Kuntz,M。;Van De Pol,J.:针对CSL模型检查的分布式马尔可夫互模拟简化,理论计算机科学电子笔记(ENTCS)220,第2期,35-50(2008)·Zbl 1286.68306号
[7] 布伦纳,L。;费尔南德斯,P。;Sales,A.:Kronecker结构表示的广义张量代数的需要和优势,国际仿真杂志:系统,科学技术(IJSIM)6,第3-4期,52-60(2005)
[8] J.M.Bull,《衡量OpenMP中的同步和调度开销》,载于:欧洲OpenMP研讨会,1999年。
[9] Bungartz,H.J。;海涅克,A。;Pfluger,D。;Schraufstetter,S.:基于有限元和稀疏网格的black-Scholes解算器的并行化,1-8(2010)·Zbl 1255.91448号
[10] 查普曼,B。;Jost,G。;Van Der Pas,R.:使用openmp:可移植共享内存并行编程,(2007)
[11] Chiola,G。;Marsan,A.M。;Balbo,G。;Conte,G.:广义随机Petri网:网级定义及其含义,IEEE软件工程事务19,第2期,89-107(1993)
[12] 小E.G.Coffman;Garey,M.R。;Johnson,D.S.:装箱的近似算法:一项调查(1997)·Zbl 0558.68062号
[13] R.M.Czekster,C.A.F.De Rose,P.Fernandes,A.M.Lima,T.Webber,并行算法的Kronecker描述符划分,摘自:《2010年春季模拟多会议论文集》,SpringSim 2010年第242期,2010年,第1-4页。
[14] R.M.Czekster,P.Fernandes,A.Sales,T.Webber,重组张量积以增强结构化马尔可夫链的数值解,收录于:《第六届马尔可夫链条数值解国际会议论文集》,NSMC’10,2010年,第36-39页。
[15] R.M.Czekster、P.Fernandes、J.-M Vincent、T.Webber,《分裂:向量描述符乘积的灵活高效算法》,载于:《第二届性能评估方法和工具国际会议论文集》,ValueTools 2007年,第3212007卷,第1-8页。
[16] Czekster,R.M。;费尔南德斯,P。;Webber,T.:Gtaexpress:处理Kronecker描述符的软件包,281-282(2009)
[17] R.M.Czekster,P.Fernandes,T.Webber,《利用时间记忆权衡的高效矢量描述符产品》,ACM SIGMETRICS性能评估评论(2012)1-8(出版中)。
[18] Da Cunha,R.D。;Hopkins,T.:非对称线性方程组重新启动的GMRES迭代算法的并行实现,计算数学进展2,第3期,261-277(1994)·Zbl 0829.65035号 ·doi:10.1007/BF02521112
[19] Davio,M.:Kronecker乘积和shuffle代数,计算机上的IEEE事务30,第2期,116-125(1981)·Zbl 0455.94050号 ·doi:10.1109/TC.1981.1675863
[20] 迪沃斯,D.D。;Sanders,W.H.:用于求解大型马尔可夫模型的高效磁盘工具,性能评估33,第1期,67-84(1998)
[21] 新泽西州丁格尔。;哈里森·P·G。;Knottenbelt,W.J.:超大马尔可夫模型中响应时间密度分布式计算的均匀化和超图划分,并行与分布式计算杂志64,第8期,908-920(2004)·Zbl 1068.68023号 ·doi:10.1016/j.jpdc.2004.03.017
[22] Erhel,J.:通用稀疏矩阵的并行GMRES版本,数值分析电子交易3,160-176(1995)·Zbl 0860.65021号
[23] 费尔南德斯,P。;高原,B。;Stewart,W.J.:随机自动机网络中的高效描述符向量乘法,ACM杂志45,第3期,381-414(1998)·Zbl 1065.68578号 ·数字对象标识代码:10.1145/278298.278303
[24] 费尔南德斯,P。;销售额,A。;桑托斯,A.R。;Webber,T.:《软件开发团队的绩效评估:一个实际案例研究》,《理论计算机科学电子笔记》275,第100期,第73-92页(2011年)
[25] 多明戈·吉梅内斯;吉姆·内兹,C。;Majado,M.J。;马里恩,n。;Martín,A.:解决处理器网络上的特征值问题,Lncs 1573,85-99(1999)
[26] 格罗普,W。;Lusk,E。;Skjellum,A.:使用MPI:具有消息传递接口的可移植并行编程(1999)·兹伯利0875.68206
[27] Kemper,P.:大型结构马尔可夫链的并行随机化,657-668(2002)
[28] A.Kleen,《Linux的NUMA API》,Novell,Inc.,技术白皮书,2005年。
[29] W.J.Knottenbelt,P.G.Harrison,大型马尔可夫模型的分布式基于磁盘的求解技术,摘自:第三届马尔可夫链数值解国际研讨会论文集,NSMC’99,1999,第58–75页。
[30] Krawezik,G。;Cappello,F.:共享内存多处理器上MPI和三种openmp编程风格的性能比较,118-127(2003)
[31] Kwiatkowska,M。;Mehmood,R。;诺曼,G。;Parker,D.:马尔可夫模型的符号核外求解方法,理论计算机科学电子笔记(ENTCS)68,第4期,589-604(2002)·Zbl 1270.68232号
[32] D.Mallón、G.Taboada、C.Teijeiro、J.Touriño、B.Fraguela、A.Gómez、R.Doallo和J.Mourino,多核架构上MPI、UPC和OpenMP的性能评估,收录于:并行虚拟机和消息传递接口的最新进展,2009年,第174–184页。
[33] 玛丽斯,V。;Wannamaker,P.E.:使用openmp在多核PC上并行3D有限差分MT反演算法,计算机地球科学36,第10期,1384-1387(2010)
[34] Mattson,T.G.:开放有多好,科学编程11,第2期,81-93(2003)
[35] Plateau,B.:关于分布式算法的并行和同步模型的随机结构,ACM SIGMETRICS性能评估评论13,第2期,147-154(1985)
[36] Quinn,M.J.:使用MPI和openmp的C语言并行编程,(2003)
[37] Saad,Y.:稀疏线性系统的迭代方法,(1995)·Zbl 1002.65042号
[38] Stewart,W.J.:概率、马尔可夫链、队列和模拟,(2009)·Zbl 1176.60003号
[39] Tadonki,C。;Philippe,B.:向量与矩阵的Kronecker乘积的并行乘法,并行数值线性代数,71-89(2001)
[40] 特博文,C。;Mey,D.An;施密德尔,D。;Jin,H。;Reichstein,T.:openmp程序中的数据和线程亲和力,8(2008)
[41] C.Terboven,A.Spiegel,D.an Mey,S.Gross,V.Reichelt,用C++编写的Navier-Stokes解算器DROPS的OpenMP并行化经验,载于:OpenMP第一次国际研讨会论文集,IWOMP 20052005。
[42] 威尔金森,B。;Allen,M.:《并行编程:使用网络工作站和并行计算机的技术和应用》(1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。