1 W.Abu-Sufah、D.J.Kuck和D.H.Lawrie。虚拟内存计算机的自动程序转换。 程序。 1979年全国计算机会议,第969-974页,1979年6月。 谷歌学者 交叉引用 2 J-L.Baer和T-F.Chen。 一种有效的片上预加载方案,可减少数据访问代价。 1991年《超级计算学报》。 谷歌学者 数字图书馆 3 D.Bailey、J.Barton、T.Lasinski和H.Simon。 NAS平行基准。 技术报告RNR-91-002,NASA艾姆斯研究中心,1991年8月。 谷歌学者 4 D.卡拉汉、K.肯尼迪和A.波特菲尔德。 软件预取。 《第四届编程语言和操作系统体系结构支持国际会议论文集》,第40-52页,1991年4月。 谷歌学者 数字图书馆 5 W.Y.Chen、S.A.Mahlke、P.P.Chang和W.W.Hwu’。 用于具有编译器辅助数据预取功能的超标量处理器的数据访问微体系结构。 《微计算学报》1991年第24期。 谷歌学者 数字图书馆 6 R.P.Colwell、R.P.Nix、I.$。 O'Donnell、D.B.Papworth和P.K.Rodman。 进程中跟踪调度编译器的vliw体系结构。 第二届国际编程语言和操作系统体系结构支持大会,第180-192页,1987年10月。 谷歌学者 交叉引用 7 J.C.Dehnert、P.Y.-T.Hsu和J.P.Bratt。 cydra 5中的重叠环路支持。 1989年4月,第三届编程语言和操作系统架构支持国际会议(ASPLOS III),第26-38页。 谷歌学者 数字图书馆 8 I.Ferrante、V.$arkar和W.Thrash。 关于评估和增强缓存有效性。 在1991年8月举行的第四次并行计算语言和编译器研讨会上。 谷歌学者 数字图书馆 9 K.Gallivan、W.Jalby、U.Meier和A.Sameh。 分层存储系统对线性代数算法设计的影响。 1987年伊利诺大学UIUCSRD 625技术报告。 谷歌学者 10 D.Gannon和W.Jalby。 内存层次结构对算法组织的影响:在向量多处理器上编程FFT。 在并行算法的特性中。 麻省理工学院出版社,1987年。 谷歌学者 11 D.Gannon、W.Jalby和K.Gallivan。 通过全局程序转换进行缓存和本地内存管理的策略。 并行与分布式计算杂志,5:587-6161988。 谷歌学者 数字图书馆 12 G.H.Golub和C.F.Van Loan。 矩阵计算。 约翰·霍普金斯大学出版社,1989年。 谷歌学者 13 E.Gomish、E.Granston和A.Veidenbaum。 编译器-具有内存层次结构的多处理器中的定向数据预取。 在1990年国际超级计算会议上。 谷歌学者 数字图书馆 14 E.H.戈米什。 编译时间分析以进行数据预取。 1989年12月,伊利诺伊大学香槟分校硕士论文。 谷歌学者 15 A.Gupta、I.Hennessy、K.Gharachorloo、T.Mowry和W-D.Weber。 潜伏期减少和耐受技术的比较评估。 第18届计算机体系结构国际研讨会论文集,第254-263页,1991年5月。 谷歌学者 数字图书馆 16 A.C.Klaiber和H.M.Levy。 软件控制数据预取的体系结构。 1991年5月,第18届计算机体系结构国际研讨会论文集,第43-63页。 谷歌学者 数字图书馆 17 D.克罗夫特。 锁定ffee指令获取/预取缓存组织。 第八届计算机体系结构国际研讨会论文集,第81-85页,1981年。 谷歌学者 数字图书馆 18 M.S.Lain先生。 软件流水线:一种有效的vliw机器调度技术。 程序中。 ACM SIGPLAN 88编程语言设计与实现会议,第318-328页,1988年6月。 谷歌学者 数字图书馆 19 M.S.Lam、E.E.Rothberg和M.E.Wolf。 阻塞算法的缓存性能和优化。 《第四届编程语言和操作系统体系结构支持国际会议论文集》,第63-74页,1991年4月。 谷歌学者 数字图书馆 20 R.L.Lee。 大规模共享内存多处理器中缓存和数据预取缓冲区的有效性。 1987年5月,伊利诺伊大学厄本那-香槟分校计算机科学系博士论文。 谷歌学者 数字图书馆 21 A.C.McKeller和E.G.Coffman。 在分页多道程序设计环境中对矩阵和矩阵操作的组织。 CACM,12(3)’153-1651969年。 谷歌学者 数字图书馆 22 T.Mowry和A.Gupta。 通过共享内存多处理器中的软件控制预取容忍延迟。 并行与分布式计算杂志,12(2):87-1061991。 谷歌学者 数字图书馆 23 A.K.波特菲尔德。 提高超级计算机应用程序缓存性能的软件方法。 莱斯大学计算机科学系博士论文,1989年5月。 谷歌学者 数字图书馆 24 B.R.Rau和C.D.Glaeser。 高性能科学计算的一些调度技术和易于调度的水平体系结构。 1981年10月,第14届微程序设计年度研讨会论文集,第183-198页。 谷歌学者 数字图书馆 25 J·P·辛格、W·D·韦伯和A·古普塔。 Splash:共享内存的斯坦福并行应用程序。 技术报告CSL-TR-91-469,斯坦福大学,1991年4月。 谷歌学者 数字图书馆 26 M.D.史密斯。 用精灵追踪。 技术报告CSL-TR-91-497,斯坦福大学,1991年11月。 谷歌学者 27 SPEC。SPEC基准报告。 Waterside Associates,加利福尼亚州弗里蒙特,1990年1月。 谷歌学者 28 S.W.K.Tjiang和J.L.Hennessy。 Sharlit:构建优化器的工具。 在1992年SiGPLAN编程语言设计与实现会议上。 谷歌学者 数字图书馆 29 M.E.Wolf和M.S.Lain。 一种数据局部性优化算法。 1991年6月,《SIGPLAN’91编程语言设计与实现会议记录》,第30-44页。 谷歌学者 数字图书馆
建议
通过编译器定向数据预取维护缓存一致性 在本文中,我们提出了一种编译器导向的缓存一致性方案,该方案利用数据预取来增强大规模分布式共享内存(DSM)系统中的缓存一致。 缓存与数据预取的一致性(CCDP)方案使用。。。 编译器定向缓存一致性和数据预取的高效集成 在大规模分布式共享内存(DSM)多处理机的设计中,缓存一致性的增强、内存延迟的减少和隐藏是非常重要和具有挑战性的问题。 我们提出了一种综合方法来解决这些问题。。。