跳到主要内容
跳过页眉部分
异构计算:硬件和软件视角2019年3月
出版商:
  • 计算机协会
  • 纽约
  • 纽约州
  • 美国
国际标准图书编号:978-1-4503-6097-5
出版:2019年3月1日
页:
131
出现位置:
ACM公司ACM图书
购买本书推荐ACM DL
已经是订户了吗?登录
跳过书目计量部分
文献计量学
跳过抽象节
摘要

如果你环顾四周,你会发现所有的计算机系统,从便携式设备到最强的超级计算机,本质上都是异构的。最明显的异质性是存在不同功能的计算节点(例如多核、GPU、FPGA等)。但是,计算系统中还存在其他异构因素,如内存系统组件、互连等。这些不同类型异构的主要原因是要具有良好的性能和能效。

异构计算带来了挑战和机遇。这本书讨论了这两者。它表明我们需要在计算堆栈的所有级别上应对这些挑战:从算法到处理技术。我们从不同的角度讨论了异构计算的主题:硬件挑战、当前的硬件技术、软件问题、如何充分利用当前的异构系统以及未来的发展方向。

这本书的目的是介绍异构计算的大背景。无论你是硬件设计师还是软件开发人员,你都需要知道拼图的各个部分是如何组合在一起的。主要目标是将研究人员和工程师带到几年前开始并预计将持续几十年的新时代的研究前沿前沿。我们相信,学者、研究人员、从业者和学生将从本书中受益,并将准备应对即将到来的异构计算的大潮。

工具书类

  1. A.Abella和A.Gonzalez。2006年6月。异构路径大小缓存。超级计算国际会议第239-248页。33谷歌学者谷歌学者
  2. A.阿布沙米。1998年6月。PGP磁盘的安全性大大降低了犯罪率。网络计算, 9(10): 54. 47谷歌学者谷歌学者数字图书馆数字图书馆
  3. O.Aciiçmez公司。2007年,又一次微体系结构攻击:利用i-cache。2007年ACM计算机安全体系结构研讨会会议记录CSAW'07,第11-18页。ACM,纽约。49谷歌学者谷歌学者数字图书馆数字图书馆
  4. O.Aciiçmez、B.B.Brumley和P.Grabher。2010.指令缓存攻击的新结果。第十二届密码硬件和嵌入式系统国际会议论文集,CHES’10,第110-124页。斯普林格·弗拉格,柏林,海德堡。49谷歌学者谷歌学者
  5. S.Aga、S.Jeloka、A.Subramanian、S.Narayanasamy、D.Blaauw和R.Das。2017年2月。计算缓存。第23届IEEE高性能计算机体系结构(HPCA)研讨会。91谷歌学者谷歌学者
  6. A.Agarwal等人,1988年。对目录方案进行缓存一致性评估。25年ISCA:回顾与重印第353-362页。34谷歌学者谷歌学者交叉引用交叉引用
  7. A.Agarwal等人,2004年。评估原始微处理器:用于ILP和流的暴露线延迟架构。第32届计算机体系结构国际研讨会论文集,第2-13页。34谷歌学者谷歌学者
  8. A.Agarwal和S.D.Pudar。1993.列关联缓存:一种降低直接映射缓存未命中率的技术。第20届计算机体系结构国际研讨会论文集第179-190页。33谷歌学者谷歌学者
  9. H.Al-Zoubi、A.Milenkovic和M.Milenkovi。2004.SPEC CPU2000基准套件缓存替换策略的性能评估。第42届ACM东南会议记录第267至272页。35谷歌学者谷歌学者
  10. D.H.阿尔博内西。2002.选择性缓存方式:按需缓存资源分配。教学水平平行性杂志第248-259页。33, 34谷歌学者谷歌学者
  11. J.Allred、S.Roy和K.Chakraborty。2012.暗硅设计:节能系统的方法论观点。2012 ACM/IEEE低功耗电子与设计国际研讨会论文集ISLPED’12,第255-260页。ACM,纽约。3谷歌学者谷歌学者
  12. J.Archibald和J.-L.Baer。1986年5月。缓存一致性协议:使用多处理器仿真模型进行评估。计算机系统ACM事务第273-298页。34谷歌学者谷歌学者数字图书馆数字图书馆
  13. E.Azarkhish、D.Rossi、I.Loi和L.Benini。2016年,设计和评估智能内存立方体的内存中处理架构。2016年第29届国际计算系统体系结构会议记录,第9637卷,第19-31页。纽约施普林格-弗拉格91谷歌学者谷歌学者
  14. R.Balasubramonian、J.Chang、T.Manning、J.H.Moreno、R.Murphy、R.Nair和S.Swanson。2014年7月。近数据处理:来自micro-46研讨会的见解。IEE MICRO杂志, 34(4): 36--42. 91谷歌学者谷歌学者交叉引用交叉引用
  15. B.贝克曼和D.伍德。2004年12月。管理大型芯片多处理器缓存中的线延迟。第37届国际微体建筑学年会论文集(Micro-37)第319-330页。34谷歌学者谷歌学者
  16. L.Benini和G.DeMicheli。2002年1月。芯片上的网络:一种新的SoC范式。IEEE计算机第70-78页。34谷歌学者谷歌学者
  17. M.T.Billingsley III、B.R.Tibbitts和A.D.George,2010年。通过集成开发工具提高UPC生产力。第四届分区全球地址空间规划模型会议记录PGAS’10,第8:1-8:9页。ACM,纽约。68谷歌学者谷歌学者
  18. S.Borkar、P.Dubey、K.Kahn、D.Kuck、H.Mulder、S.Pawlowski和J.Rattner。2006.2015平台:未来十年英特尔处理器和平台的发展。英特尔公司白皮书。35谷歌学者谷歌学者
  19. A.Boroumand、S.Ghose、M.Patel、H.Hassan、B.Lucia、K.Hsieh、K.T.Malladi、H.Zheng和O.Mutlu。2017年1月。Lazypim:用于内存中处理的高效缓存一致性机制。IEEE计算机体系结构快报, 16(1): 46--50. 91谷歌学者谷歌学者数字图书馆数字图书馆
  20. P.Bose。2013年2月。暗硅是真的吗?技术角度。ACM通信, 56(2): 92--92. 谷歌学者谷歌学者数字图书馆数字图书馆
  21. J.Boukhobza、S.Rubini、R.Chen和Z.Shao。2017年11月。新兴NVM:关于架构集成和研究挑战的调查。ACM电子系统设计自动化汇刊, 23(2): 14:1--14:32. 7谷歌学者谷歌学者数字图书馆数字图书馆
  22. R.K.Braithwaite、W.c.Feng和P.S.McCormick。2012.使用cbench自动进行NUMA特征化。第三届ACM/SPEC性能工程国际会议记录,ICPE’12,第295--298页。ACM,纽约。6谷歌学者谷歌学者
  23. S.Bratus、N.D'Cunha、E.Sparks和S.W.Smith。2008年。Toctou、陷阱和可信计算。第一届可信计算与信息技术信任国际会议论文集:可信计算——挑战与应用第14-32页。斯普林格·弗拉格,柏林,海德堡。47谷歌学者谷歌学者
  24. Broadcom Corporation,2006年。BCM1455:四核64位MIPS处理器。http://www.broadcom.com/collateral/pb/1455-PB04-R.pdf。35谷歌学者谷歌学者
  25. B.Calder、D.Grunwald和J.Emer.1996年。预测顺序关联缓存。第二届高性能计算机体系结构国际研讨会论文集第244-253页。33, 34谷歌学者谷歌学者
  26. B.Calder、C.Krintz、S.John和T.Austin。1998.缓存感知数据放置。编程语言和操作系统架构支持国际会议记录第139-149页。33谷歌学者谷歌学者
  27. F.Cantonet、Y.Yao、M.Zahran和T.El Ghazawi。2004年4月。UPC语言的生产力分析。第三届并行和分布式系统性能建模、评估和优化国际研讨会(PMEO-PDS)。68谷歌学者谷歌学者
  28. A.M.Caulfield、E.S.Chung、A.Putnam、H.Angepat、J.Fowers、M.Haselman、S.Heil等人,2016年。云级加速架构。第49届IEEE/ACM国际微体系结构年会,MICRO-49,第7:1--7:13页。新泽西州皮斯卡塔韦IEEE出版社。http://dl.acm.org/citation.cfm?id=3195638.3195647。23谷歌学者谷歌学者数字图书馆数字图书馆
  29. S.Chandrasekaran和G.Juckeland,2018年编辑。面向程序员的OpenACC:概念和策略。Addison Wesley,马萨诸塞州波士顿。83谷歌学者谷歌学者
  30. J.Chang和G.S.Sohi。2006.芯片多处理器的协作缓存。第33届计算机体系结构国际年会(ISCA)会议记录第264-276页。34谷歌学者谷歌学者
  31. L.Cheng、N.Muralimanohar、K.Ramani、R.Balasubramonian和J.Carter。2006年6月。芯片多处理器的互连软件一致性协议。第33届IEEE/ACM计算机体系结构国际研讨会论文集第339-351页。34谷歌学者谷歌学者
  32. B.Childers、J.W.Davidson和M.L.Soffa。2003.持续编译:一种新的主动和自适应代码转换方法。第17届并行与分布式处理国际研讨会论文集,IPDPS’03,第205-214页。71谷歌学者谷歌学者
  33. Z.Chishti、M.D.Powell和T.N.Vijaykumar。2003.高性能节能非均匀缓存架构的距离关联性。第36届IEEE/ACM微体系结构国际研讨会论文集第55-66页。6谷歌学者谷歌学者
  34. J.Clark、S.Leblanc和S.Knight。2009.基于意外USB通道的硬件特洛伊木马设备。2009年第三届网络和系统安全国际会议记录,NSS’09,第1-8页。IEEE计算机协会,华盛顿特区。49谷歌学者谷歌学者
  35. J.Coburn、S.Ravi、A.Raghunathan和S.Chakradhar。2005年,SECA:安全增强通信体系结构。2005年嵌入式系统编译器、体系结构和综合国际会议论文集,案例'05,第78-89页。47谷歌学者谷歌学者
  36. C.Cowan、C.Pu、D.Maier、H.Hinton和J.Walpole。1998年1月。StackGuard:自动自适应检测和防止缓冲区溢出攻击。第七届USENIX安全研讨会会议记录第63-78页。48谷歌学者谷歌学者
  37. W.Dally和B.Towles。2001.路由数据包,而非电线:芯片互连网络。第38届设计自动化会议记录第684-689页。34谷歌学者谷歌学者
  38. R.H.Dennard、F.H.Gaensslen、V.L.Rideout、E.Bassous和A.R.LeBlanc。1974年10月。具有非常小的物理尺寸的离子注入MOSFET的设计。IEEE固态电路杂志9(5): 256--268. 2谷歌学者谷歌学者数字图书馆数字图书馆
  39. R.V.der Pas、E.Stotzer和C.Terboven。2017使用OpenMP—下一步。麻省理工学院出版社,马萨诸塞州剑桥,77谷歌学者谷歌学者
  40. A.S.Dhodapkar和J.E.Smith。2002.通过动态工作集分析管理多配置硬件。第17届计算机体系结构国际研讨会论文集第233-244页。33谷歌学者谷歌学者
  41. G.Di Crescenzo先生。2005.可擦除存储器对自适应对手的安全性。2005年ACM存储安全和生存能力研讨会论文集《存储》SS’05,第115-122页。47谷歌学者谷歌学者数字图书馆数字图书馆
  42. S.J.Eggers和R.H.Katz。1989.评估四种侦听缓存一致性协议的性能。第22届计算机体系结构国际年会论文集,第2-15页。34谷歌学者谷歌学者
  43. M.Ekman、F.Dahlgren和P.Stenstrom。2002年8月。使用虚拟缓存实现低功耗芯片多处理器的TLB和嗅探节能。IEEE/ACM低功耗电子与设计国际研讨会论文集第243-246页。34谷歌学者谷歌学者
  44. R.Elbaz、L.Torres、G.Sassatelli、P.Guillemin、C.Anguille、M.Bardouillet、C.Buatois和J.B.Rigaud。2005.总线加密硬件引擎:现有技术调查。欧洲设计、自动化和测试会议记录,日期:2005年,第3卷,第40-45页。47谷歌学者谷歌学者
  45. H.Esmaeilzadeh、E.Blem、R.St.Amant、K.Sankaralingam和D.Burger。2011年,暗硅和多核缩放的结束。第38届计算机体系结构国际年会论文集ISCA’11,第365-376页。ACM,纽约。3谷歌学者谷歌学者
  46. K.I.Farkas、P.Chow、N.P.Jouppi和Z.Vranesic。1997年。多集群体系结构:通过分区减少周期时间。第30届微体建筑学国际研讨会论文集第149-159页。34谷歌学者谷歌学者
  47. F.菲奥里和F.穆索利诺。2001.微控制器操作产生的EME分析。欧洲设计、自动化和测试会议记录,日期01,第341-347页。新泽西州皮斯卡塔韦IEEE出版社。49谷歌学者谷歌学者
  48. A.Fiskiran和R.Lee。2004年10月。运行时执行监控(REM),用于检测和防止恶意代码执行。IEEE国际计算机设计会议记录第452-457页。49谷歌学者谷歌学者
  49. K.Flautner、N.Kim、S.Martin、D.Blaauw和T.Mudge。2002年5月。昏昏欲睡的缓存:减少泄漏功率的简单技术。计算机体系结构年度国际研讨会论文集第147-157页。34谷歌学者谷歌学者
  50. K.Gandolfi、C.Mourtel和F.Olivier。2001年,电磁分析:具体结果。第三届密码硬件和嵌入式系统国际研讨会论文集,CHES’01,第251--261页。斯普林格·弗拉格,伦敦。49谷歌学者谷歌学者
  51. B.Gassend、G.E.Suh、D.Clarke、M.V.Dijk和S.Devadas。2003.缓存和哈希树,用于有效的内存完整性验证。第九届高性能计算机体系结构国际研讨会第295--306页。49谷歌学者谷歌学者
  52. O.Gelbart、P.Ott、B.Narahari、R.Simha、A.Choudhary和J.Zambreno。2005年5月。CODESSEAL:用于保护应用程序安全的编译器/FPGA方法。IEEE智能与安全信息学国际会议记录,第530-535页。49谷歌学者谷歌学者
  53. K.Ghose和M.Kamble。1999年8月。使用子银行、多行缓冲区和位线分段降低超标量处理器缓存的功耗。IEEE/ACM低功耗电子与设计国际研讨会论文集第70-75页。34谷歌学者谷歌学者
  54. B.Grigorian、N.Farahpour和G.Reinman。2015年2月。Brainiac:为神经实现的近似计算带来可靠的准确性。高性能计算机体系结构(HPCA),2015 IEEE第21届国际研讨会第615-626页。26谷歌学者谷歌学者
  55. F.Guo和Y.Solihin。2006年6月。缓存替换策略性能的分析模型。SIGMETRICS’06/Performance’06:计算机系统测量和建模联合国际会议记录第228-239页。35谷歌学者谷歌学者
  56. 郭彦宏、诸葛、胡锦涛、易建联、邱明明和沙华明。2013年6月。带临时存储器的嵌入式多核系统的数据放置和复制。IEEE集成电路和系统计算机辅助设计汇刊, 32(6): 809--817. 35谷歌学者谷歌学者数字图书馆数字图书馆
  57. L.Hammond、B.Nayfeh和K.Olukotun。1997。单片多处理器。IEEE计算机第79-85页。34谷歌学者谷歌学者
  58. T.D.Han和T.S.Abdelrahman。2011年。减少GPU程序中的分支分歧。图形处理单元通用处理第四次研讨会会议记录GPGPU-4,第3:1--3:8页。ACM,纽约。22谷歌学者谷歌学者
  59. K·黑泽尔伍德。2011动态二进制修改:工具、技术和应用。Morgan&Claypool Publishers,加利福尼亚州圣拉斐尔71谷歌学者谷歌学者
  60. N.Hemsoth和T.P.Morgan。2017FPGA前沿:可重构计算的新应用。Next Platform Press,北卡罗来纳州高点,23谷歌学者谷歌学者
  61. J.-M.Hoc,1990年版。程序设计心理学,1。纽约爱思唯尔69谷歌学者谷歌学者
  62. R.Huang、D.Y.Deng和G.E.Suh。2010年3月。Orthors在多核上提供高效的软件完整性保护。编程语言和操作系统的体系结构支持国际会议记录第371-384页。49谷歌学者谷歌学者
  63. G.F.Hughes和J.F.Murray。2005年2月。使用SATA磁盘驱动器的RAID存储系统和D2D存档的可靠性和安全性。IEEE存储事务, 1(1): 95--107. 47谷歌学者谷歌学者数字图书馆数字图书馆
  64. W.W.Hwu。2015异构系统体系结构:一种新的计算平台基础设施, 1. 马萨诸塞州伯灵顿市Morgan Kaufmann,85谷歌学者谷歌学者
  65. K.Inoue、V.Moshnyaga和K.Murakami。2002年2月。高性能、低功耗缓存体系结构的发展趋势。IEICE电子交易,E85-C(2):303--314。34谷歌学者谷歌学者
  66. T.B.Jablin、P.Prabhu、J.A.Jablin,N.P.Johnson、S.R.Beard和D.I.August。2011.自动CPU-GPU通信管理和优化。第32届ACM SIGPLAN编程语言设计与实现会议记录,PLDI’11,第142-151页。19谷歌学者谷歌学者
  67. A.Jaleel、W.Hasenplaugh、M.Qureshi、J.Sebot、S.Steely和J.Emer.2008年。用于管理共享缓存的自适应插入策略。PACT’08:第17届并行体系结构和编译技术国际会议论文集第208-219页。51谷歌学者谷歌学者
  68. A.Jaleel、J.Nuzman、A.Moga、S.Steely和J.Emer.2015年2月。服务器工作负载的高性能缓存层次结构:放宽包含以捕获独占缓存的延迟优势。高性能计算机体系结构(HPCA),2015 IEEE第21届国际研讨会第343-353页。51谷歌学者谷歌学者
  69. J.Jeong和M.Dubois。2003年2月。成本敏感的缓存替换算法。第九届IEEE高性能计算机体系结构研讨会论文集第327-337页。35, 51谷歌学者谷歌学者
  70. N.E.Jerger、T.Krishna和L.-S.Peh。2017芯片上网络。Morgan&Claypool Publishers,加利福尼亚州圣拉斐尔36谷歌学者谷歌学者
  71. Y.Jin、N.Kupp和Y.Makris,2009年。有硬件木马设计和实现经验。2009 IEEE面向硬件的安全与信任国际研讨会会议记录,HST’09,第50-57页。IEEE计算机协会,华盛顿特区。49谷歌学者谷歌学者
  72. N.P.Jouppi、C.Young、N.Patil、D.Patterson、G.Agrawal、R.Bajwa、S.Bates等人,2017年。张量处理单元的数据中心内性能分析。第44届计算机体系结构国际年会论文集ISCA’17,第1-12页。ACM,纽约。27谷歌学者谷歌学者数字图书馆数字图书馆
  73. D.R.Kaeli、P.Mistry、D.Schaa和D.P.Zhang。2015使用OpenCL 2.0的异构计算, 3. 马萨诸塞州伯灵顿市Morgan Kaufmann,78谷歌学者谷歌学者
  74. M.Kamble和K.Ghose。1997年8月。低功耗缓存的分析能量耗散模型。IEEE/ACM低功耗电子与设计国际研讨会论文集第143-148页。34谷歌学者谷歌学者
  75. S.Kang、H.J.Choi、C.H.Kim、S.W.Chung、D.Kwon和J.C.Na.2011年。探索CPU/GPU协同执行:从性能、能量和温度的角度。2011年ACM应用计算研究研讨会论文集RACS’11,第38-43页。17谷歌学者谷歌学者
  76. T.Karkhanis和J.E.Smith。2002年6月。数据缓存未命中的一天记忆性能问题(WMPI)第二届年度研讨会论文集。33谷歌学者谷歌学者
  77. R.Karri、J.Rajendran、K.Rosenfeld和M.Tehranipoor。2010.值得信赖的硬件:识别和分类硬件木马。电脑类, 43: 39--46. 47, 49谷歌学者谷歌学者数字图书馆数字图书馆
  78. R.Karri、K.Wu、P.Mishra和Y.Kim。2001.128位对称分组密码基于故障的并行信道密码分析的并发错误检测。第38届设计自动化年会会议记录,DAC’01,第579--584页。ACM,纽约。49谷歌学者谷歌学者
  79. S.Kaxiras、Z.Hu和M.Martonosi。2001年6月。缓存衰退:利用代行为降低缓存泄漏功率。第28届IEEE/ACM计算机体系结构国际研讨会论文集第240-251页。34谷歌学者谷歌学者
  80. G.S.Kc、A.D.Keromytis和V.Prevelakis。2003.使用指令集随机化对抗代码注入攻击。第十届ACM计算机和通信安全会议记录CCS’03,第272--280页。ACM,纽约。48谷歌学者谷歌学者
  81. M.Kharbutli和Y.Solihin。2005年10月。基于计数器的缓存替换算法。计算机设计国际会议论文集第61-68页。51谷歌学者谷歌学者
  82. H.Kim、N.Vijaykrishnan、M.Kandimer、A.Sivasubramaniam、M.Irwin和E.Geethanjali。2001年8月。功能软件分区缓存体系结构。IEEE/ACM低功耗电子与设计国际研讨会论文集第64-67页。34谷歌学者谷歌学者
  83. J.Kim、W.J.Dally、S.Scott和D.Abts。2008.技术驱动、高度可缩放的蜻蜓拓扑结构。第35届计算机体系结构国际年会论文集ISCA’08,第77-88页。IEEE计算机协会,华盛顿特区。41谷歌学者谷歌学者
  84. N.Kim、K.Flautner、D.Blaauw和T.Mudge。2002年11月。昏昏欲睡的指令缓存:使用动态电压缩放和缓存子银行预测降低泄漏功耗。IEEE/ACM第35届微体系结构国际研讨会论文集第219-230页。34谷歌学者谷歌学者
  85. N.Kim、K.Flautner、D.Blaauw和T.Mudge。2004年2月a。用于降低缓存泄漏功率的电路和微体系结构技术。IEEE超大规模集成电路汇刊12(2): 167--184. 34谷歌学者谷歌学者数字图书馆数字图书馆
  86. S.Kim、D.Chandra和Y.Solihin。2004年b。芯片多处理器体系结构中的公平缓存共享和分区。PACT’04:第13届并行体系结构和编译技术国际会议论文集第111-122页。34谷歌学者谷歌学者
  87. J.Kin、M.Gupta和W.H.Mangione-Smith。1997.过滤器缓存:一种节能内存结构。第30届微体系结构国际年会(MICRO-30)会议记录第184-193页。33谷歌学者谷歌学者
  88. M.J.Kobrinsky、B.A.Block、J.-F.Zheng、B.C.Barnett、E.Mohammed、M.Reshotko、F.Robinson、S.List、I.Young和K.Cadien。2004年5月。芯片上的光互连。英特尔技术杂志, 8(2): 129--142. 39谷歌学者谷歌学者
  89. A.K.Kodi和A.Louri,2007年3月。用于高性能计算(HPC)系统的电源带宽可配置光互连。IEEE并行和分布式处理研讨会。IPDPS 2007,第1-10页。39谷歌学者谷歌学者
  90. J.Kong、O.Aciicmez、J.-P.Seifert和H.Zhou。2008.解构新的缓存设计,以阻止基于软件缓存的侧通道攻击。第二届ACM计算机安全体系结构研讨会会议记录CSAW'08,第25-34页。ACM,纽约。49谷歌学者谷歌学者
  91. P.Kongetira、K.Aingaran和K.Olukotun。2005年3月。尼亚加拉:32路多线程SPARC处理器。IEEE微型, 25(2): 21--29. 35谷歌学者谷歌学者数字图书馆数字图书馆
  92. V.Krishnan和J.Torrellas。1999.一种具有推测性多线程的芯片多处理器体系结构。电气电子工程师学会计算机期刊, 48(9): 866--880. 34谷歌学者谷歌学者数字图书馆数字图书馆
  93. R.Kumar、V.Zyuban和D.Tullsen。2005年6月。多核架构中的互连:了解机制、开销和扩展。计算机体系结构国际研讨会第408-419页。36谷歌学者谷歌学者
  94. G.Kurian、J.E.Miller、J.Psota、J.Eastep、J.Liu、J.Michel、L.C.Kimerling和A.Agarwal。2010年。Atac:具有片上光学网络的1000核高速缓存相干处理器。年第19届并行体系结构和编译技术国际会议论文集第10章,第477-488页。ACM,纽约。39谷歌学者谷歌学者
  95. H.Lee、G.Tyson和M.Farrens。2000年12月。急切的写回—一种提高带宽利用率的技术。IEEE/ACM第33届微体系结构国际研讨会论文集第11-21页。60谷歌学者谷歌学者
  96. J.-H.Lee和S.-D.Kim。2002.应用自适应智能缓存系统。嵌入式计算系统ACM事务, 1(1): 56--78. 33谷歌学者谷歌学者数字图书馆数字图书馆
  97. R.B.Lee、D.K.Karig、J.P.McGregor和Z.Shi。2003年3月。注册硬件体系结构以阻止恶意代码注入。普适计算安全国际会议记录,第237-252页。48谷歌学者谷歌学者
  98. J.Lin.2008年。关于恶意软件分类。2008年智能信息技术应用研讨会论文集第368-371页。IEEE计算机协会,华盛顿特区。47谷歌学者谷歌学者数字图书馆数字图书馆
  99. J.L.Lo、J.S.Emer、H.M.Levy、R.L.Stamm和D.M.Tullsen。1997.通过同时多线程将线程级并行转换为指令级并行。计算机系统ACM事务, 15(3): 322--354. 3, 35谷歌学者谷歌学者数字图书馆数字图书馆
  100. G.H.Loh、N.Jayasena、M.Oskin、M.Nutter、D.Roberts、M.R.Meswani、D.P.Zhang和M.Ignatowski。2013年,处理内存分类法和固定功能PIM研究案例。第一次近距离数据处理研讨会,与第46届IEEE/ACM微体系结构国际研讨会(MICRO 46)。91谷歌学者谷歌学者
  101. D.麦金·库姆斯。2007年2月。安全体系结构和模型。http://www.giac.org/resources。47谷歌学者谷歌学者
  102. N.Megiddo和D.s.Modha,2004年。使用自适应替换缓存算法超越LRU。电脑类37(4): 58--65. 35谷歌学者谷歌学者数字图书馆数字图书馆
  103. D.S.Modha、R.Ananthanaarayanan、S.K.Esser、A.Ndirango、A.J.Sherbondy和R.Singh。2011年8月。认知计算。ACM通信, 54(8): 62--71. 25谷歌学者谷歌学者数字图书馆数字图书馆
  104. G.E.摩尔。1965年4月。把更多的元件塞进集成电路。数码产品第114-117页。2谷歌学者谷歌学者
  105. A.莫斯科。2005年6月。区域cout:在基于snoop的一致性中利用粗粒度共享。第32届IEEE/ACM计算机体系结构国际研讨会论文集第234-245页。34谷歌学者谷歌学者数字图书馆数字图书馆
  106. B.A.不。1998年。单芯片多处理器的案例。斯坦福大学博士论文,加利福尼亚州斯坦福34谷歌学者谷歌学者
  107. 内格尔。2001年12月。高级返回到库(c)漏洞利用(PaX案例研究)。http://www.phrack.org/。48谷歌学者谷歌学者
  108. M.Nijim、X.Qin和T.Xie。2006年11月。为写密集型工作负载建模并改进本地磁盘系统的安全性。ACM存储事务, 2(4): 400--423. 47谷歌学者谷歌学者数字图书馆数字图书馆
  109. C.J.Nitta、M.K.Farrens和V.Akella。2013片上光子互连:计算机架构师的视角。Morgan&Claypool Publishers,加利福尼亚州圣拉斐尔39谷歌学者谷歌学者
  110. NVIDIA,2017年。NVIDIA Tesla v100 GPU架构。http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf19谷歌学者谷歌学者
  111. K.Patel和S.Parameswaran。2008年6月。SHIELD:一种用于MPSoC安全性和可靠性的软硬件设计方法。ACM/IEEE设计自动化会议记录第858-861页。50谷歌学者谷歌学者
  112. J.-K.Peir、W.Hsu、H.Young和S.Ong。1996.通过平衡的标记和数据路径提高缓存性能。编程语言和操作系统架构支持国际会议记录第268--278页。34谷歌学者谷歌学者
  113. J.-K.Peir、Y.Lee和W.Hsu。1998.使用自适应缓存拓扑捕获动态内存引用行为。编程语言和操作系统架构支持国际会议记录第240-250页。33谷歌学者谷歌学者
  114. G.Pekhimenko、T.Huberty、R.Cai、O.Mutlu、P.Gibbons、M.Kozuch和T.Mowry。2015年2月。利用压缩块大小作为未来重用的指标。高性能计算机体系结构(HPCA),2015 IEEE第21届国际研讨会第51-63页。35谷歌学者谷歌学者
  115. M.Potkonjak、A.Nahapetian、M.Nelson和T.Massey。2009。使用门级特征的硬件特洛伊木马检测。第46届设计自动化年会会议记录,DAC’09,第688-693页。ACM,纽约。49谷歌学者谷歌学者
  116. S.M.波特。2001.人工智能能从神经科学中得到什么?人工智能盛会:未来50年第174-185页。纽约施普林格-弗拉格26谷歌学者谷歌学者
  117. K.Punniyamurthy和A.Gerstlauer。2017.探索非均匀处理内存体系结构。最小化数据移动的硬件/软件技术第一次研讨会与PACT共同持有。91谷歌学者谷歌学者
  118. M.Qureshi、A.Jaleel、Y.Patt、S.C.Steely和J.Emer,2007年6月。用于高性能缓存的自适应插入策略。第34届计算机体系结构国际研讨会论文集第381-391页。51, 60谷歌学者谷歌学者
  119. M.Qureshi、D.Lynch、O.Mutlu和Y.Patt。2006年6月。支持MLP的缓存替换案例。第33届计算机体系结构国际研讨会(ISCA)会议记录第167-178页。35, 51谷歌学者谷歌学者
  120. M.K.Qureshi和Y.N.Patt。2006.基于实用程序的缓存分区:一种低开销、高性能的运行时机制,用于对共享缓存进行分区。第39届IEEE/ACM微体系结构国际研讨会论文集第423-432页。34谷歌学者谷歌学者
  121. 拉马纳桑(R.Ramanathan)。2006.英特尔多核处理器:向四核及更高级别迈进。英特尔公司白皮书。35谷歌学者谷歌学者
  122. J.Reineke、D.Grund、C.Berg和R.Wilhelm。2006年9月。缓存替换策略的可预测性。SFB/TR 14 AVACS 9报告。网址:http://www.avacs.org35谷歌学者谷歌学者
  123. A.Ros、M.Davari和S.Kaxiras。2015年2月。分层私有/共享分类:集群缓存层次结构的简单高效一致性的关键。高性能计算机体系结构(HPCA),2015 IEEE第21届国际研讨会第186-197页。35谷歌学者谷歌学者
  124. X.阮、A.Manzanares、S.Yin、M.Nijim和X.Qin。2009年。我们能否在不修改安全机制的情况下提高安全磁盘系统的能效?2009年IEEE网络、架构和存储国际会议记录,NAS’09,第413-420页。47谷歌学者谷歌学者
  125. K.卢比。2018年42年微处理器趋势数据。https://github.com/karlrupp/microprocessor-trend-data(上次访问时间为2018年3月)。2谷歌学者谷歌学者
  126. S.K.Sadasivam、B.W.Thompto、R.Kalla和W.J.Starke,2017年3月。IBM power9处理器体系结构。IEEE微型, 37(2): 40--51. 15谷歌学者谷歌学者数字图书馆数字图书馆
  127. S.Sayyaparaju、G.Chakma、S.Amer和G.S.Rose。2017年,CMOS磁敏电阻神经形态系统中记忆突触在线学习的电路技术。2017年大湖区超大规模集成电路研讨会会议记录,GLSVLSI’17,第479-482页。ACM,纽约。26,92谷歌学者谷歌学者
  128. M.Schuette和J.Shen。1987年3月。使用签名指令流的处理器控制流监视。电气电子工程师学会计算机期刊,C-36(3):264--276。49谷歌学者谷歌学者数字图书馆数字图书馆
  129. C.D.Schuman、T.E.Potok、R.M.Patton、J.D.Birdwell、M.E.Dean、G.S.Rose和J.S.Plank。2017年5月。神经形态计算和神经网络硬件概述。ArXiv电子打印。https://arxiv.org/abs/1705.0696392谷歌学者谷歌学者
  130. V.Seshadri、D.Lee、T.Mullins、H.Hassan、A.Boroumand、J.Kim、M.A.Kozuch、O.Mutlu、P.B.Gibbons和T.C.Mowry。2016.Buddy-RAM:使用DRAM提高批量位操作的性能和效率。https://arxiv.org/abs/1611.0998891谷歌学者谷歌学者
  131. A.Shafiee、A.Nag、N.Muralimanohar、R.Balasubramonian、J.P.Strachan、M.Hu、R.S.Williams和V.Srikumar。2016年,Isaac:一种在交叉杆中具有原位模拟算法的卷积神经网络加速器。第43届计算机体系结构国际研讨会论文集,《国际标准分类法》第16卷,第14-26页。新泽西州皮斯卡塔韦IEEE出版社。92谷歌学者谷歌学者
  132. R.Sheikh和M.Kharbutli。2010年10月。通过在缓存替换算法中结合成本敏感性和局部性原则来提高缓存性能。国际计算机设计会议记录第76-83页。51谷歌学者谷歌学者
  133. P.Siegl、R.Buchty和M.Berekovic。2016.数据中心计算前沿:内存中处理的调查。第二届记忆系统国际研讨会论文集《MEMSYS’16》,第295--308页。纽约ACM,91谷歌学者谷歌学者
  134. B.Sinharoy、R.N.Kalla、J.M.Tendler、R.J.Eickemeyer和J.B.Joyner。2005.Power5系统微体系结构。IBM研究与开发杂志, 49(4/5): 505--521. 35谷歌学者谷歌学者数字图书馆数字图书馆
  135. A.史密斯。1982.缓存内存。倒排索引综述, 14(3): 473--530. 33谷歌学者谷歌学者数字图书馆数字图书馆
  136. F.-X.Standaert、T.G.Malkin和M.Yung。2009.用于分析副通道密钥恢复攻击的统一框架。第28届密码学进展国际年会论文集:密码技术的理论和应用欧洲密码'09,第443-461页。斯普林格·弗拉格,柏林,海德堡,第443-461页。47, 49谷歌学者谷歌学者
  137. L.Su、S.Courcambeck、P.Guillemin、C.Schwarz和R.Pacalet。2009年。SecBus:操作系统控制的基于分层页面的内存总线保护。欧洲设计、自动化和测试会议记录,日期'09,第570--573页。47谷歌学者谷歌学者
  138. H.萨特。2005年3月。免费午餐结束了:软件并发性的根本转变。Dobb博士杂志, 30(3): 202--210. 4谷歌学者谷歌学者
  139. TCG公司。2008年4月。可信平台模块(TPM)摘要。http://www.trustedcomputinggroup.org/。47谷歌学者谷歌学者
  140. M.Tehranipoor和F.Koushanfar。2010年1月。硬件木马分类和检测综述。IEEE计算机设计与测试, 27(1): 10--25. 49谷歌学者谷歌学者数字图书馆数字图书馆
  141. A.特雷什金。2010年,邪恶女佣追求PGP全磁盘加密。第三届信息和网络安全国际会议记录,SIN’10,第2页。ACM,纽约。49谷歌学者谷歌学者数字图书馆数字图书馆
  142. K.Tiri,2007年。侧通道攻击陷阱。第44届设计自动化年会会议记录,DAC’07,第15-20页。ACM,纽约。47、49谷歌学者谷歌学者数字图书馆数字图书馆
  143. 托马塞维奇和米卢蒂诺维奇。1993共享内存多处理器中的缓存一致性问题:硬件解决方案。IEEE计算机学会出版社,加利福尼亚州洛斯阿拉米托斯34谷歌学者谷歌学者
  144. D.M.Tullsen、S.Eggers和H.M.Levy。1995.同步多线程:最大化片上并行性。第22届计算机体系结构国际研讨会论文集第392-403页。3, 14, 34, 35谷歌学者谷歌学者
  145. D.Unat、A.Dubey、T.Hoefler、J.Shalf、M.Abraham、M.Bianco、B.L.Chamberlain等人,2017年10月。HPC系统数据局部性抽象的趋势。IEEE并行和分布式系统汇刊,20(10):3007-3020。64谷歌学者谷歌学者交叉引用交叉引用
  146. 美国能源部,2013年4月。exascale计算的技术挑战。技术报告JSR-12-310。https://fas.org/irp/agency/dod/jason/exascale.pdf。谷歌学者谷歌学者
  147. 美国能源部,2016年。神经形态计算、架构、模型和应用:未来计算的超越CMOS方法。技术报告,橡树岭国家实验室。94谷歌学者谷歌学者
  148. A.S.Vaidya、A.Shayesteh、D.H.Woo、R.Saharoy和M.Azimi。2013.通过包内压缩实现SIMD发散优化。第40届计算机体系结构国际年会论文集ISCA’13,第368-379页。ACM,纽约。22谷歌学者谷歌学者
  149. K.Varadarajan、S.Nandy、V.Sharda、A.Bharadwaj、R.Iyer、S.Makineni和D.Newell。2006年6月。分子缓存:用于动态创建特定于应用程序的异构缓存区域的缓存结构。第39届IEEE/ACM微体系结构国际研讨会论文集(MICRO-39)第433-442页。34谷歌学者谷歌学者
  150. R.Vaslin、G.Gogniat、J.-P.Diguet、E.Wanderley、R.Tessier和W.Burleson。2009年2月。嵌入式微处理器系统中片外存储器的安全方法。微处理器和微系统, 33(1): 37--45. 47谷歌学者谷歌学者数字图书馆数字图书馆
  151. A.V.Veidenbaum、W.Tang、R.Gupta、A.Nicolau和X.Ji。1999.根据应用程序行为调整缓存线大小。1999年超级计算国际会议记录第145-154页。33, 34谷歌学者谷歌学者
  152. A.Waksman和S.Sethumadhavan。2010年。篡改明显的微处理器。2010年IEEE安全与隐私研讨会会议记录,SP'10,第173-188页。IEEE计算机协会,华盛顿特区。47, 49谷歌学者谷歌学者
  153. K.Wang、K.Angstadt、C.Bo、N.Brunelle、E.Sadredini、T.Tracy II、J.Wadden、M.Stan和K.Skadron。2016年,Micron自动化处理器概述。第十一届IEEE/ACM/IFIP硬件/软件协同设计和系统综合国际会议论文集,《法典》第16卷,第14:1--14:3页。ACM,纽约。24谷歌学者谷歌学者
  154. P.Wang、D.Feng、W.Wu和L.Zhang。2009年。关于反旁道攻击方法的正确性。第五届信息安全实践与经验国际会议记录ISPEC’09,第336--344页。斯普林格·弗拉格,柏林,海德堡。47、49谷歌学者谷歌学者
  155. X.Wang、H.Salmani、M.Tehranipoor和J.Plusquellic。2008.使用当前集成和本地化当前分析检测和隔离硬件特洛伊木马。2008 IEEE VLSI系统缺陷和容错国际研讨会论文集第87-95页。IEEE计算机协会,华盛顿特区。49谷歌学者谷歌学者
  156. E.惠勒。2008年9月。重放攻击。http://www.sans.org/。48谷歌学者谷歌学者
  157. W.Wong和J.-L.Baer。2000年1月。修改了LRU策略以改进二级缓存行为。第六届高性能计算机体系结构国际研讨会(HPCA-6)第49-60页。35谷歌学者谷歌学者
  158. S.C.Woo、M.Ohara、E.Torrie、J.P.Singh和A.Gupta。1995年,SPLASH-2项目:特征和方法考虑。第22届计算机体系结构国际年会论文集1995年国际会计准则理事会,第24-36页。ACM,纽约。51谷歌学者谷歌学者
  159. 谢X.、梁Y.、王Y.、孙G.Wang和王T.Wang。2015年2月。GPU的协调静态和动态缓存旁路。高性能计算机体系结构(HPCA),2015 IEEE第21届国际研讨会第76-88页。35谷歌学者谷歌学者
  160. J.Xue、A.Garg、B.Ciftcioglu、J.Hu、S.Wang、I.Savidis、M.Jain等人,2010年。芯片内自由空间光互连。第37届计算机体系结构国际年会论文集ISCA’10,第94-105页。ACM,纽约。39谷歌学者谷歌学者数字图书馆数字图书馆
  161. C.Yan、D.Englender、M.Prvulovic、B.Rogers和Y.Solihin。2006.提高内存加密和身份验证的成本、性能和安全性。第33届计算机体系结构国际年会论文集2006年国际会计准则理事会,第179-190页。47谷歌学者谷歌学者
  162. H.Yang、R.Govindarajan、G.R.Gao和Z.Hu.2005年12月。通过编译器辅助的缓存替换提高能效。嵌入式计算杂志, 1(4): 487--499. 51谷歌学者谷歌学者数字图书馆数字图书馆
  163. T.T.Ye,2003年。片上多处理器网络和交换结构的物理规划。第14届IEEE专用系统、架构和处理器国际会议(ASAP’03)第97-107页。34谷歌学者谷歌学者交叉引用交叉引用
  164. 应先生(M.Ying)。2016量子编程基础, 1. Morgan Kaufmann,马萨诸塞州伯灵顿,95谷歌学者谷歌学者
  165. M.Zahran。2016年3月。灵感机器:我们到底在寻找什么?IEEE脉冲, 7(2): 48--51. 26谷歌学者谷歌学者交叉引用交叉引用
  166. W.Zhang、M.Kandimer、M.Krakoy和G.Chen。2005年8月。使用基于编译器的方法减少数据缓存泄漏能量。嵌入式计算系统ACM事务, 4(3): 652--678.谷歌学者谷歌学者数字图书馆数字图书馆

引用人

  1. Fernandes L、Kharate P和Singh B(2024).仿生学中高性能计算的未来和一些挑战仿生学的高性能计算,10.1007/978-981-97-1017-1_15,(287-303),
  2. Carratalá-Sáez R、Torres Y、Sierra Pallares J、López Huguet S和Llanos D(2023).UVaFTLE:流体动力学应用的拉格朗日有限时间Lyapunov指数提取,超级计算杂志,10.1007/s11227-022-0017-x,79:9, (9635-9665),在线发布日期:2023年6月1日.
  3. Nikolic G、Dimitrijevic B、Nikolic T和Stojcev M(2022).CPU、GPU和TPU 2022三类处理器概览第57届信息、通信和能源系统与技术国际科学会议(ICEST),10.1109/ICEST55168.2022.9828625,978-1-6654-8500-5, (1-6)
  4. Cérin C、Kimura K和Sow M(2022).低成本机器的数据流群集,并行与分布式计算杂志,2016年10月10日/j.jpdc.2022.04.009,在线发布日期:2022年4月1日.
  5. Nikolic G、Dimitrijevic B、Nikolic T和Stojcev M(2022).微处理器五十年的发展:从单CPU到多核多核系统,Facta Universititis系列:电子学和能量学,10.2298/FUEE2202155N,35:2, (155-186),
  6. Zahran M公司(2021).高性能计算的未来2021年第17届国际计算机工程会议(ICENCO),10.1109/ICENCO49852.2021.9698918,978-1-7281-6448-9, (129-134)
  7. Long D、Morkos B和Ferguson S(2021).使用个人游戏机实现超额价值的量化证据,机械设计杂志, 10.1115/1.4049520,143:3,在线发布日期:2021年3月1日.
  8. 阿姆斯特朗M(2020).地理空间应用的高性能计算:地理空间应用高性能计算展望,10.1007/978-3-030-47998-5_15,(271-284),
贡献者

建议