跳到主要内容
研究论文

为异构CPU加速器平台优化共享虚拟内存系统

出版:2011年2月18日 出版历史
  • 获取引文提醒
  • 摘要

    客户端计算平台正在向异构体系结构发展,该体系结构结合了面向标量的CPU内核和面向吞吐量的加速器内核。认识到现有的用于此类异构平台的编程模型对大多数程序员来说仍然很困难,我们提倡共享虚拟内存编程模型来提高可编程性。在本文中,我们关注性能,并证明用户无需为了可编程性而牺牲性能。我们描述了我们在由CPU和Aubrey Isle加速器组成的异构平台上优化MYO的方法、经验和结果。我们的工作涉及整个系统软件堆栈,包括操作系统、运行时和应用程序。

    工具书类

    [1]
    Seiler L.、Carmean D.、Sprangle E.、Forsyth T.、Abrash M.、Dubey P.、Junkins S.、Lake A.、Sugerman J.、Cavin R.、Espasa R.、Grochowski E.、Juan T.、Hanrahan P.Larrabee:可视化计算的多核x86架构。ACM图形交易,2008年8月
    [2]
    Saha,B.、Zhou,X.、Chen,H.、Gao,Y.、Yan,S.、Rajagopalan,M.、Fang,J.、Zhang,P.、Ronen,R.和Mendelson,A.,2009年。异构x86平台的编程模型。2009年ACM SIGPLAN编程语言设计与实现会议记录(爱尔兰都柏林,2009年6月15日至21日)。2009年1月。ACM,纽约州纽约市,431-440。
    [3]
    英伟达公司,CUDA编程环境,www.Nvidia.com/object/CUDA_what_is.html。
    [4]
    AMD CTM公司http://ati.amd.com/companyinfo/researcher/documents/ati_CTM_Guide.pdf
    [5]
    AMD Stream SDK,ati.AMD.com/technology/streamcomputing。
    [6]
    Dubey P.识别、挖掘和合成将计算机推向了tera时代。技术@英特尔2005年2月。
    [7]
    Luebke,D.、Harris,M.、Krüger,J.、Purcell,T.、Govindaraju,N.、Buck,I.、Woolley,C.和Lefohn,A.,2004年。GPGPU:图形硬件上的通用计算。SIGGRAPH 2004。
    [8]
    寿梦岩;周小成;应高;胡晨;赛洛;张培南;北卡罗来纳州彻鲁库里。;Ronen,R。;萨哈,B。;,Terascale芯片多处理器存储器层次结构和编程模型,高性能计算(HiPC),2009年国际会议,第卷,第号,第150-159页,2009年12月16-19日
    [9]
    Navarro,J.、Iyer,S.、Druschel,P.和Cox,A.,2002年。对超级页面的实用、透明的操作系统支持。SIGOPS操作。系统。第36版,SI(2002年12月),89--104。
    [10]
    Saraswat,V.A.、Sarkar,V.和von Praun,C.,2007年。X10:现代架构的并发编程。2007年PPoPP。
    [11]
    周,S。;斯图姆,M。;李凯。;Wortman博士。;,“异构分布式共享内存”,并行和分布式系统,IEEE汇刊,第3卷,第5期,第540-554页,1992年9月
    [12]
    Gelado,I.、Stone,J.E.、Cabezas,J.、Patel,S.、Navarro,N.和Hwu,W.W.,2010年。异构并行系统的非对称分布式共享内存模型。《关于编程语言和操作系统的架构支持的ASPLOS第十五版会议录》(美国宾夕法尼亚州匹兹堡,2010年3月13日至17日)。阿斯普洛斯10。ACM,纽约州纽约市,347-358。
    [13]
    王志刚(Zhigang Wang)、吴甘莎(Gansha Wu)、杜朝晖(Zhaohui Du)、刘章林(Zhanglin Liu)、陈永建(Yongjian Chen)、郭鹏(Peng Guo)、张丹(Dan Zhang)、安瓦尔(Anwar Ghu。,加速器编译器引导的智能数据传输,提交给CGO 2011,2011年4月2-6日。
    [14]
    Dwarkadas,S.、Cox,A.L.和Zwaenepoel,W.,1996年。一个集成的编译时/运行时软件分布式共享内存系统。第七届编程语言和操作系统体系结构支持国际会议论文集(美国马萨诸塞州剑桥,1996年10月1日至4日)。ASPLOS-VII。ACM,纽约州纽约市,186-197。
    [15]
    Manoj,N.P.、Manjunath,K.V.和Govindarajan,R.,2004年。CAS-DSM:编译器辅助的软件分布式共享内存。国际J并行程序。32,2(2004年4月),77-122。
    [16]
    Bianchini,R.、Kontothanasis,L.I.、Pinto,R.,De Maria,M.、Abud,M.和Amorim,C.L.,1996年。在软件DSM中隐藏通信延迟和一致性开销。SIGOPS操作。系统。第30版,第5版(1996年12月),198-209。
    [17]
    Bianchini,R.、Pinto,R.和Amorim,C.L.1998年。软件DSM的数据预取。第十二届超级计算国际会议论文集(澳大利亚墨尔本)。ICS’98。ACM,纽约州纽约市,385--392。
    [18]
    英特尔,“英特尔新闻稿:英特尔推出高性能计算的新产品计划,”http://www.intel.com/pressroom/archive/releases/20100531comp.htm2010年5月。

    引用人

    查看全部
    • (2018)CPU-MIC异构系统编程与性能优化综述2018 IEEE第三届图像、视觉和计算国际会议(ICIVC)109年10月10日/国际刑事法院.2018.8492841(894-900)在线发布日期:2018年6月
    • (2014)InfiniBand多核多核集群系统的多PVAS设计第21届欧洲MPI用户小组会议记录10.1145/2642769.2642795(133-138)在线发布日期:2014年9月9日
    • (2013)RSVM公司第22届并行体系结构和编译技术国际会议论文集10.5555/2523721.2523758(269-278)在线发布日期:2013年10月7日
    • 显示更多引用者

    索引术语

    1. 为异构CPU加速器平台优化共享虚拟内存系统

      建议

      评论

      信息和贡献者

      问询处

      发布于

      封面图片ACM SIGOPS操作系统评论
      ACM SIGOPS操作系统审查 第45卷第1期
      2011年1月
      160页
      ISSN公司:0163-5980
      内政部:10.1145/1945023
      期刊目录

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      出版:2011年2月18日
      在SIGOPS中发布体积45,问题1

      检查更新

      作者标记

      1. 异构平台
      2. 操作系统
      3. 程序设计模型
      4. 共享虚拟内存

      限定符

      • 研究文章

      贡献者

      其他指标

      文献计量学和引文

      文献计量学

      文章指标

      • 下载次数(过去12个月)6
      • 下载次数(最近6周)0

      其他指标

      引文

      引用人

      查看全部
      • (2018)CPU-MIC异构系统编程与性能优化综述2018 IEEE第三届图像、视觉和计算国际会议(ICIVC)109年10月10日/国际刑事法院.2018.8492841(894-900)在线发布日期:2018年6月
      • (2014)InfiniBand多核多核集群系统的多PVAS设计第21届欧洲MPI用户小组会议记录10.1145/2642769.2642795(133-138)在线发布日期:2014年9月9日
      • (2013)RSVM公司第22届并行体系结构与编译技术国际会议论文集10.5555/2523721.2523758(269-278)在线发布日期:2013年10月7日
      • (2013)使用暴露的灵活微体系结构打破SIMD束缚,访问执行PDG第22届并行体系结构与编译技术国际会议论文集10.1109/PACT.2013.6618823(341-352)在线发布日期:2013年10月
      • (2013)非相干多核系统的虚拟共享存储器2013年IEEE第27届并行和分布式处理研讨会暨博士论坛论文集10.1109/IPDPSW.2013.73(1186-1193)在线发布日期:2013年5月20日
      • (2013)大型多核和加速器平台上的高效异构执行并行与分布式计算杂志10.1016/j.jpdc.2013.07.01273:12(1578-1591)在线发布日期:2013年12月1日
      • (2012)用于数值模拟的双精度浮点数据无损压缩:用于GPU计算的高度并行算法IEICE信息与系统交易10.1587/传输。E95.D.2778号E95.D版:12(2778-2786)网上发布日期:2012年

      视图选项

      获取访问权限

      登录选项

      完全访问权限

      视图选项

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用联机查看电子阅读器.

      电子阅读器

      媒体

      数字

      其他

      桌子

      分享

      分享

      共享此出版物链接

      在社交媒体上分享