跳到主要内容
研究论文
开放式访问

基于梯度的缓存分区算法

出版:2012年1月26日 出版历史
  • 获取引文提醒
  • 摘要

    本文解决了在存在硬件预取的情况下,在多个并发线程之间划分缓存的问题。设计用于保留时间局部性的缓存替换(例如,LRU)将分配与每个竞争线程的未命中率成比例的缓存资源,而不管是否将利用缓存空间[Qureshi和Patt 2006]。这显然是次优的,因为应用程序在使用最近访问的数据方面差异很大。我们通过划分共享缓存来解决这个问题,从而优化全局优度度量。本文介绍了基于梯度的缓存分区算法(GPA),其变体优化命中率、每周期总指令数(IPC)或加权IPC度量,该度量旨在加强服务质量(QoS)[Iyer 2004]。在QoS上下文中,GPA使我们能够获得低优先级线程的最大吞吐量,同时确保高优先级线程的高性能。GPA机制稳健、低成本,易于与现有缓存设计集成,并将共享8MB L3缓存的有序8核系统的吞吐量提高了约14%。

    工具书类

    [1]
    Albonesi,D.H.1999年。选择性缓存方式:按需缓存资源分配。《微生物学学报》,32。
    [2]
    Al-Zoubi,H.、Milenkovic,A.和Milenkovi,M.,2004年。SPEC CPU2000基准套件缓存替换策略的性能评估。ACMSE会议记录。
    [3]
    Chang,J.和Sohi,G.S.,2006年。芯片多处理器的协同缓存。ISCA 33的程序中。
    [4]
    Chiou,D.T.1999年。扩展微处理器的覆盖范围:列和奇怪的缓存。麻省理工学院博士论文。
    [5]
    Dhodapkar,A.S.和Smith,J.E.,2002年。通过动态工作集分析管理多配置硬件。ISCA 29会议记录。
    [6]
    Dybdahl,H.、Stenstrom,P.和Natvig,L.,2006年。一种支持缓存分区的芯片多处理器替换策略。在HiPC 13的会议记录中。
    [7]
    Guo,F.和Solihin,Y.2006。缓存替换策略性能的分析模型。SIGMETRICS/性能会议记录。
    [8]
    Guo,F.、Solihin,Y.、Zhao,L.和Iyer,R.,2007年。在芯片多处理器中提供服务质量的框架。在MICRO 40的会议记录中。
    [9]
    Guo,F.、Kannan,H.、Zhao,L.、Illikkal,R.、Iyer,R.,Newell,D.、Solihin,Y.和Kozyrakis,C.,2007年。从混沌到QoS:CMP资源管理案例研究。ACM SIGARCH计算。Architec新闻35,1。
    [10]
    Iyer,R.2004年。CQoS:在CMP平台的共享缓存中启用QoS的框架。ICS 18会议记录。
    [11]
    Iyer,R.、Zhao,L.、Guo,F.、Solihin,Y.、Markineni,S.、Newell,D.、Illikkal,R.,Hsu,L.和Reinhardt,S.,2007年。CMP平台中缓存/内存的QoS策略和体系结构。在ACM SIGMETRICS会议记录中。
    [12]
    Jaleel,A.、Hasenplaugh,W.、Qureshi,M.K.、Sebot,J.、Steely Jr.,S.和Emer,J.2008年。用于管理CMP上共享缓存的自适应插入策略。在PACT诉讼程序中17。
    [13]
    Jaleel,A.、Theobald,K.B.、Steely Jr.,S.和Emer,J.,2010年。使用重新引用间隔预测(RRIP)进行高性能缓存替换。ISCA 37会议记录。
    [14]
    Kim,S.、Chandra,D.和Solihin,Y.,2004年。芯片多处理器体系结构中的公平缓存共享和分区。在第13号协议的程序中。
    [15]
    Luo,K.、Gummaraju,J.和Franklin,M.,2001年。平衡SMT处理器的吞吐量和公平性。ISPASS会议记录。
    [16]
    Nesbit,K.J.、Laudon,J.和Smith,J.E.,2007年。虚拟专用缓存。ISCA 34会议记录。
    [17]
    Palachara,S.和Kessler,R.E.,1994年。正在将流缓冲区评估为辅助缓存替换。ISCA 21会议记录。
    [18]
    Qureshi,M.K.和Patt,Y.,2006年。基于实用程序的缓存分区:一种低开销的高性能运行时机制,用于对共享缓存进行分区。在MICRO 39的会议记录中。
    [19]
    Qureshi,M.K.、Lynch,D.N.、Mutlu,O.和Patt,Y.N.,2006年。支持MLP的缓存替换案例。ISCA 33会议记录。
    [20]
    Qureshi,M.K.、Jaleel,A.、Patt,Y.N.、Steely Jr.,S.C.和Emer,J.,2007年。用于高性能缓存的自适应插入策略。ISCA 34会议记录。
    [21]
    Rafique,N.、Lim,W.和Thottehodi,M.,2006年。操作系统驱动的CMP缓存管理的体系结构支持。在第15号协议的程序中。
    [22]
    Stone,H.S.、Turek,J.和Wolf,J.L.,1992年。缓存内存的最佳分区。IEEE传输。计算。4, 9.
    [23]
    Suh,G.E.,Rudolph,L.和Devadas,S.2004。共享缓存的动态分区。J.超级计算机。28, 1.

    引用人

    查看全部
    • (2024)AIRIC:具有噪声邻居的虚拟无线电接入网络的编排IEEE通信选定领域杂志10.1109/JSAC.2023.33974942:2(432-445)在线发布日期:2024年2月1日
    • (2023)一种在运行时优化缓存预取器攻击性的强化学习方法2023年第十届软件定义系统国际会议10.1109/SDS59856.2023.10329059(95-102)在线发布日期:2023年10月23日
    • (2022)CASHT:共有盗窃层级中的冲突分析ACM体系结构和代码优化汇刊10.1145/349453819:1(1-27)在线发布日期:2022年1月23日
    • 显示更多引用者

    索引术语

    1. 基于梯度的缓存分区算法

      建议

      评论

      信息和贡献者

      问询处

      发布于

      封面图片ACM架构和代码优化汇刊
      ACM体系结构和代码优化汇刊 第8卷第4期
      高性能嵌入式体系结构和编译器专题
      2012年1月
      765页
      国际标准编号:1544-3566
      EISSN公司:1544-3973
      内政部:10.1145/2086696
      期刊目录
      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      出版:2012年1月26日
      认可的:2011年11月1日
      修订过的:2011年10月1日
      收到:2011年7月1日
      在TACO中发布体积8,问题4

      权限

      请求对此文章的权限。

      检查更新

      作者标记

      1. 缓存替换
      2. 自适应缓存
      3. 切尔诺夫界
      4. 动态缓存分区
      5. 动态控制
      6. 梯度下降
      7. 爬山
      8. 插入策略

      限定符

      • 研究文章
      • 研究
      • 推荐

      贡献者

      其他指标

      文献计量学和引文

      文献计量学

      文章指标

      • 下载次数(过去12个月)50
      • 下载次数(最近6周)7

      其他指标

      引文

      引用人

      查看全部
      • (2024)AIRIC:虚拟化无线接入网络与噪声邻居的协调IEEE通信选定领域杂志10.1109/JSAC.2023.33974942:2(432-445)在线发布日期:2024年2月1日
      • (2023)一种在运行时优化缓存预取器攻击性的强化学习方法2023年第十届软件定义系统国际会议(SDS)10.1109/SDS59856.2023.10329059(95-102)在线发布日期:2023年10月23日
      • (2022)CASHT:共有盗窃层级中的冲突分析ACM体系结构和代码优化汇刊10.1145/349453819:1(1-27)在线发布日期:2022年1月23日
      • (2017)CSALT公司第50届IEEE/ACM微体系结构国际研讨会论文集10.1145/3123939.3124549(449-462)在线发布日期:2017年10月14日
      • (2017)多核处理器中缓存分区技术综述倒排索引综述10.1145/306239450:2(1-39)在线发布日期:2017年5月10日
      • (2015)用于有效缓存共享的空间位置感知缓存分区2015年第44届国际并行处理大会(ICPP)会议记录10.1109/ICPP.2015.24(150-159)在线发布日期:2015年9月1日
      • (2015)Talus:一种简单的方法来消除缓存性能中的悬崖2015年IEEE第21届高性能计算机体系结构国际研讨会(HPCA)10.1109/HPCA.2015.7056022(64-75)在线发布日期:2015年3月
      • (2015)通过共享指令内存缓存块降低重新配置上下文的存储成本应用可重构计算10.1007/978-3-319-16214-0_1(3-14)在线发布日期:2015年3月31日
      • (2014)改进peLIFO CACHE替换政策:减少硬件和扩展线程电路、系统与计算机杂志10.1142/S021812661450046723:04(1450046)网上发布日期:2014年4月
      • (2014)面对多个热点和较少缓冲区时避免树饱和2014年IEEE高性能计算与通信国际会议会议记录、2014年第六届IEEE网络空间安全与保障国际研讨会、2014年EEE第十一届嵌入式软件与系统国际会议(HPCC、CSS、ICESS)10.1109/HPCC.2014.79(472-481)在线发布日期:2014年8月20日
      • 显示更多引用者

      视图选项

      查看选项

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用联机查看电子阅读器.

      电子阅读器

      获取访问权限

      登录选项

      完全访问权限

      媒体

      数字

      其他

      桌子

      分享

      分享

      共享此出版物链接

      在社交媒体上分享