×

ILP处理器中分支和值预测的建模和性能评估。 (英语) Zbl 1010.68018号

摘要:推测执行是提高下一代微处理器性能的关键问题之一。在本文中,我们介绍了一种评估分支和值预测效果的新方法,它允许处理器执行超出控制和真实数据依赖性限制的指令。到目前为止,几乎所有对其在不同场景下的性能潜力的估计都是使用跟踪驱动或执行驱动模拟获得的。偶尔会使用一些简单的确定性模型。我们使用一个基于最近引入的流体随机Petri网(FSPN)的分析模型,通过积极使用预测技术和推测执行来捕获ILP处理器的动态行为。在这里,我们定义了FSPN模型,推导了潜在随机过程的状态方程,并给出了性能评估结果,以说明其在推导感兴趣的度量中的用途。我们的独立于实现的随机建模框架揭示了在这一领域使用偏微分方程组的数值解和/或FSPN模型的离散事件模拟进行进一步研究的巨大潜力。

MSC公司:

68平方米 计算机系统环境下的性能评估、排队和调度
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bechern C.,IEEE Micro第26页–(1999)
[2] Black,B.、Huang,A.、Lipasti,M.和Shen,J.P.追踪驱动模拟器能准确预测超标量性能吗?IEEE计算机设计国际会议论文集:计算机和处理器中的超大规模集成电路。美国圣安东尼奥
[3] Black,B.、Rychlik,B.和Shen,J.P.基于块的跟踪缓存。第26届计算机体系结构国际研讨会论文集。美国亚特兰大,196-207页。
[4] Burger D.,技术报告#1342,in:简单标量工具集,2.0版。(1997年)
[5] Chang,P.Y.,Hao,E.和Patt,Y.混合分支预测器的替代实现。程序。第28届国际微体建筑学年会。美国安娜堡,第252-263页。
[6] Chang,P.Y,Hao,E.,Yeh,T.Y和Patt,Y.分支分类:提高分支预测器性能的新机制。程序。第27届国际微体建筑学年会。美国圣何塞,第22-31页。
[7] Ciardo,G.,Nicol,D.和Trivedi,K.流体随机petri网的离散事件模拟。程序。第七届Petri网和性能模型国际研讨会(PNPM'97)。法国圣马约。第217-225页。
[8] Diep,T.A.、Shen,J.P.和Phillip,M.Explorer是一个用于超标量处理器的可重定目标、基于可视化的跟踪驱动模拟器。程序。第26届国际微体建筑学研讨会。美国奥斯汀,第225-235页。
[9] Diep T.A.,IEEE Computer第57页–(1995)·doi:10.1009/24.76200
[10] Feziger J.H.,流体动力学计算方法(1997)
[11] Gabbay F.,EE部门技术报告#1080,in:基于值预测的推测执行(1996)
[12] Gabbay,F.和Mendelson,A.指令获取带宽对值预测的影响。第25届计算机体系结构国际研讨会论文集。西班牙巴塞罗那。第272-281页。
[13] 内政部:10.1145/290409.290411·doi:10.1145/290409.290411
[14] Gonzalez,J.和Gonzarez,A.数据价值推测提升ILP的潜力。程序。第十二届ACM超级计算国际会议。澳大利亚墨尔本。
[15] Gribaudo,M.和Sereno,M.流体随机petri网的模拟。程序。第八届计算机和通信系统建模、分析和仿真国际研讨会。美国旧金山,第231–239页。
[16] Gribaudo,M.、Sereno,M.和Bobbio,A.《流体随机petri网:包含非马尔科夫模型的扩展形式主义》。程序。第八届Petri网和性能模型国际研讨会。西班牙萨拉戈萨·Zbl 0972.93040号
[17] Gribaudo,M.,Sereno,M.、Horvath,A.和Bobbio,A.,用flushout弧增强的流体随机petri网:建模和分析。离散事件动态系统。第11卷,第97-117页。Kluwer学术出版社。1/2号·Zbl 0972.93040号
[18] Gusev,M.、Popovski,G.和Misev,A.超标量处理器的模拟。程序。第20届信息技术接口国际会议。克罗地亚普亚。
[19] Hauns,M.,Salee,P.和Farrens,M.Branch转换率:改进分支分类分析的新度量。第六届高性能计算机体系结构国际研讨会论文集(HPCA 6。法国图卢兹。第241-250页。
[20] Hennessy J.L.,《计算机体系结构:定量方法》,第2页。编辑(1996)·Zbl 0844.68003号
[21] Hoffmann K.A.,《工程师计算流体动力学》(1993年)
[22] DOI:10.1016/S0377-2217(97)00028-3·Zbl 0957.90011号 ·doi:10.1016/S0377-2217(97)00028-3
[23] 黄J.,技术报告ARCTIC-99-06,in:利用操作数和输出值局部性改进值预测(1999)
[24] Lee J.K.F.,IEEE Computer第6页–(1984)·doi:10.1109/MC.1984.1658927
[25] Lipasti M.,《EUROPAR-97会议记录》(1997年)
[26] Lipasti,M.和Shen,J.P.通过数值预测超过数据流限制。程序。第29届国际微体建筑学年会。法国巴黎。第226-237页。
[27] Lipasti,M.、Wilkerson,C.和Shen,J.P.值位置和负荷值预测。程序。第七届编程语言和操作系统体系结构支持国际会议。美国剑桥,第138-147页。
[28] McFarling S.,技术报告TN-36,in:组合分支预测因子(1993)
[29] Michaud,P.、Seznec,A.和Jourdan,S.探索宽超标量处理器中的指令提取带宽需求。程序。并行体系结构和编译技术国际会议。美国纽波特海滩·Zbl 1006.68675号
[30] Milton J.S.,《概率与统计导论:工程与计算科学的原理与应用》,第2页。编辑(1990)
[31] Mitrevski,P.,开始?eva-Popstojanova,K.和Grnarov,A.使用马尔可夫再生随机petri网对实时环境中的N版本容错软件进行可靠性和性能建模。程序。第四届世界系统学、控制论和信息学多会议(SCI 2000)。美国奥兰多第七卷,第463-468页。
[32] Mitrevski,P.,Gu?ev、M.和Mi?ev,A.ILP中的预测和推测技术。程序。第22届信息技术接口国际会议(ITI 2000)。克罗地亚普亚。第67-72页。
[33] DOI:10.1016/S1383-7621(98)00011-3·doi:10.1016/S1383-7621(98)00011-3
[34] Rajan R.,排队网络的通用流体模型(1995)
[35] Rotenberg,E.,Bennett,S.和Smith,J.Trace缓存:一种低延迟的高带宽指令获取方法。程序。第29届国际微体建筑学年会。法国巴黎。第24-35页。
[36] Rychlik B.,技术报告CM{\(\mu\)}ART-1998-01,in:使用动态分类进行高效准确的值预测(1998)
[37] Rychlik,B.、Faistl,J.、Krug,B.和Shen,J.P.价值预测的疗效和绩效影响。程序。并行体系结构和编译技术国际会议。法国巴黎。
[38] Sazeides Y.,值可预测性分析及其在超标量处理器中的应用(1999)
[39] Sazeides Y.,技术报告ECE97-8,in:基于上下文的价值预测工具的实现(1997)
[40] Seznec,A.、Jourdan,S.、Sainrat,P.和Michaud,P..多重阻塞超前分支预测因子。程序。第七届编程语言和操作系统体系结构支持国际会议。剑桥。第116–127页。美国
[41] Sherwood,T.、Perelman,E.和Calder,B.进行基本块分布分析,以发现应用中的周期行为和模拟点。程序。并行体系结构和编译技术国际会议。西班牙巴塞罗那。
[42] Smith,J.分支预测策略研究。程序。第八届计算机体系结构国际年会。第135–148页。
[43] Trivedi,K.和Kulkami,V.FSPNs:流体随机petri网。计算机科学讲义,第691卷。程序。第14届国际Petri网应用与理论会议。德国海德堡。编辑:Ajmone Marsan,M.,第24-31页。
[44] Wallace,S.和Bagherzadeh,N.多分支和区块预测。程序。第三届高性能计算机体系结构国际研讨会。美国圣安东尼奥。
[45] Wang,K.和Franklin,M.使用混合预测因子进行高精度数据值预测。程序。第30届国际微建筑研讨会。美国,第281-290页。研究三角形Pk
[46] Walter K.,二阶流体随机petri网的性能和可靠性建模(1999)
[47] Walter K.,《1996-13年技术报告》,载于:非马尔可夫流体随机petri网(1996)
[48] Yeh,T.Y.和Patt,Y.N.二级自适应分支预测。程序。第24届国际微体建筑学年会。阿尔伯克基。第51-61页。美国
[49] Yeh,T.Y.和Patt,Y.N.两级自适应分支预测的替代实现。程序。第19届计算机体系结构国际研讨会。第124-134页。澳大利亚黄金海岸
[50] Yeh,T.Y,Marr,D.和Patt,Y.通过多分支预测和分支地址缓存提高指令获取速率。程序。超级计算国际会议。东京。第67-76页。日本
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。