×

ParVec:向量化PARSEC基准套件。 (英语) Zbl 1343.68018号

摘要:能源效率最近已取代性能成为所有细分市场微处理器的主要设计目标。矢量化、并行化、专业化和异构是学术界和工业界实现能源效率的关键方法。针对实际应用验证新的体系结构方案,以确保正确性并进行性能和能量评估。然而,在保持类似工作负载和算法(出于比较目的)的同时,跟上架构的变化是一个真正的挑战。如果基准测试针对某些特性而不是其他特性进行了优化,那么架构师最终可能会高估某些技术的影响,而低估其他技术的影响。这项工作的主要贡献是对ParVec的详细描述和评估,ParVec是PARSEC基准套件的矢量化版本(作为常用应用程序集的案例研究)。ParVec可以瞄准SSE、AVX和NEON(^{\mathrm{TM}});通过自定义矢量化和数学库实现SIMD体系结构。矢量化的性能和能效改进在很大程度上取决于可以矢量化的代码的比例。矢量化友好基准测试每个线程可获得高达10倍的能量改进。ParVec基准套件可供研究社区使用,作为评估未来计算机系统的新基准。

MSC公司:

2007年7月68日 计算机体系结构的数学问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bienia,C.:现代多处理器基准测试。普林斯顿大学博士论文(2011)
[2] Borkar S,Chien AA(2011)《微处理器的未来》。纽约州ACM
[3] Cebrian,J.M.,Natvig,L.:温度对芯片能量测量的影响。摘自:《国际绿色计算会议(IGCC)会议记录》,2013年,第78-87页。IEEE计算机学会,Los Alamitos(2012)
[4] Cebrian,J.M.、Natvig,L.、Jahre,M.:Parvec:向量化PARSEC基准(2014年)。http://www.ntnu.edu/ime/eecs/parvec ·Zbl 1343.68018号
[5] Cebrian,J.M.、Natvig,L.、Meyer,J.C.:通过Intel Core i5和i7处理器上的并行化和矢量化提高能效。摘自:《2012 SC Companion:高性能计算、网络存储和分析》(2012)
[6] Cebrian,J.M.、Jahre,M.、Natvig,L.:针对次优软件的优化硬件:支持SIMD的基准测试案例。2014年IEEE系统和软件性能分析国际研讨会论文集ISPASS(2014)
[7] Che,S.等人:Rodinia:异构计算的基准套件。摘自:2009年IEEE工作负荷特性国际研讨会论文集,IEEE(2009)
[8] Dennard,R.等人:具有极小物理尺寸的离子注入Mosfet的设计(1974)
[9] Donald,J.,Martonosi,M.:多核热管理技术:分类和新探索。In:程序。第33国际交响乐团。公司。架构(architecture)。(2006)
[10] Esmaeilzadeh,H.等人:暗硅和多核缩放的结束。In:程序。第38届计算机体系结构国际年会,ISCA,ACM(2011)
[11] Feng,W.C.,Lin,H.,Scogland,T.,Zhang,J.:Opencl和13个小矮人:一项正在进行的工作。In:程序。第三届ACM/SPEC性能工程国际会议,ICPE’12,ACM(2012)
[12] Ferdman,M.等人:《清除云:现代硬件上新兴横向扩展工作负载的研究》。In:第17届国际编程语言和操作系统体系结构支持会议(2012年)
[13] Firasta,N.等人:白皮书:Intel AVX:性能改进和能效的新前沿(2008)
[14] Gerber,R.:《软件优化食谱》。英特尔出版社(2002)
[15] Ghose,S.、Srinath,S.和Tse,J.:使用可移植子字SIMD加速PARSEC基准测试。在:CS 5220:最终项目报告中。康奈尔大学工程(2011)
[16] Hennessy JL,Patterson DA(2006)《计算机体系结构:定量方法》,第4版。Morgan Kaufmann Publishers Inc.,旧金山·Zbl 1112.68001号
[17] Hennessy,J.L.,Patterson,D.A.:《计算机体系结构:定量方法》,第5版。摩根考夫曼出版公司(2012)·Zbl 0752.68014号
[18] ITRS:半导体国际技术路线图报告(2012年)。http://www.itrs.net/Links/2012ITRS/Home2012.htm
[19] Kaxiras,S.,Martonosi,M.:《电力效率的计算机架构技术》,第1版。摩根和克莱普尔出版社(2008)
[20] Kim,C.等人:《技术报告:通过传统编程和编译器技术缩小忍者性能差距》(2012年)
[21] Li,J.,Martínez,J.F.:芯片多处理器并行计算的功率性能考虑,第397-422页。ACM,纽约(2005)
[22] Li,M.,Sasanka,R.,Adve,S.V.,kuang Chen,Y.,Debes,E.:阿尔卑斯基准套件。In.In过程。IEEE国际交响乐团。工作负荷特征(2005)
[23] Li,S.:案例研究:使用Intel高级向量扩展计算黑胆(2012)。http://software.intel.com/en-us/articles/case-study-computing-black-scholes-with-intel-advanced-vector-extensions
[24] Lien,H.、Natvig,L.、Hasib,A.A.、Meyer,J.C.:基于任务的项目中多核能源效率的案例研究。In:ICT-GLOW,第44-54页(2012年)
[25] Lotze,J.,Sutton,P.D.,Lahlou,H.:多核加速libor互换投资组合定价。In:程序。2012 SC Companion:High Performance Computing,Networking Storage and Analysis,SCC’12,IEEE Computer Society(2012年)
[26] Molka D等人(2011)《HPC集群效率基准的灵活工作负荷生成》。柏林施普林格
[27] Mucci,P.J.、Browne,S.、Deane,C.、Ho,G.:PAPI:硬件性能计数器的便携式接口。In:程序。国防部用户小组会议(1999)
[28] Pommier,J.:简单SSE和SSE2 sin,cos,log and exp(2007)。http://gruntthepeon.free.fr/ssemath/
[29] Totoni,E.,Behzad,B.,Ghike,S.,Torrellas,J.:比较Intel的SCC与最先进的CPU和GPU的功率和性能,第78-87页。IEEE计算机协会,洛斯阿拉米托斯(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。