跳到主要内容
10.1145/3582016.3582026acm会议文章/章节视图摘要出版物页面阿斯普洛斯会议记录会议集合
研究论文
开放式访问

ABNDP:近数据处理中数据访问和负载平衡的协同优化

出版:2023年3月25日出版历史

摘要

近数据处理(NDP)是解决数据密集型应用程序的内存墙挑战的一种有前途的体系结构范例。基于3D堆叠存储器的典型NDP系统包含大量并行处理单元,每个并行处理单元都可以访问其本地存储器以及系统中的其他远程存储器区域。在这样的体系结构中,最小化远程数据访问和实现计算负载平衡是一个基本的折衷,现有的解决方案只能改进一个,而牺牲另一个。我们提出ABNDP,它利用新颖的硬件和软件协同优化来同时缓解这两个问题,而不会做出权衡。ABNDP使用一种新颖高效的分布式DRAM缓存来允许系统中的其他数据缓存位置,在该位置可以分布和平衡原始数据热点的计算负载,而不会显著增加远程访问。ABNDP还采用了一种混合任务调度策略,该策略同时考虑了远程访问成本和负载不平衡影响,并利用多个数据缓存位置的灵活性来决定最佳计算位置。我们的评估表明,ABNDP成功地实现了最小化远程访问成本和保持负载平衡这两个目标,并且在性能(1.7×)和能耗(25%)方面显著优于基线系统。

参考文献

  1. Shaizeen Aga、Nuwan Jayasena和Mike Ignatowski。2019.Co-ML:使用近数据处理的协作ML加速案例。在记忆系统国际研讨会上。谷歌学者谷歌学者
  2. 安俊焕、洪松柏、柳成祖、欧努尔·穆特鲁和崔建英。2015.用于并行图形处理的可扩展内存中处理加速器。第42届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 安俊焕、孙国佑、奥努尔·穆特鲁和崔金英。2015.支持PIM的指令:低开销、本地感知的内存处理体系结构。第42届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者
  4. 巴哈尔·阿斯加里(Bahar Asgari)、拉米亚德·哈迪迪(Ramyad Hadidi)、曹家深(Jiashen Cao)、大恩欣(Da Eun Shim)、宋庆林(Sung Kyu Lim)和海森·金(Hyeson Kim)。2021.FAFNIR:通过使用高效的近内存智能缩减加速稀疏数据收集。在第27届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者交叉引用交叉引用
  5. Hadi Asghari-Moghaddam、Young Hoon Son、Jung Ho Ahn和Nam Sung Kim。2016.变色龙:大型内存系统的多功能实用近DRAM加速架构。第49届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  6. Rajeev Balasubramonian、Jichuan Chang、Troy Manning、Jaime H Moreno、Richard Murphy、Ravi Nair和Steven Swanson。2014.近数据处理:来自MICRO-46研讨会的见解。IEEE Micro,34,4(2014)。谷歌学者谷歌学者
  7. 拉杰夫·巴拉索布拉蒙尼(Rajeev Balasubramonian)、安德鲁·卡恩(Andrew B.Kahng)、纳文·穆拉利马诺哈(Naveen Muralimanohar)、阿里·沙菲(Ali Shafiee)和瓦什纳夫·斯里尼瓦斯(Vaishnav Srinivas)。2017年,CACTI 7:创新非芯片存储器互连探索的新工具。ACM架构和代码优化汇刊(TACO),14,2(2017)。谷歌学者谷歌学者
  8. 内森·贝克曼和丹尼尔·桑切斯。2013.Jigsaw:可扩展软件定义的缓存。在第22届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  9. 内森·贝克曼(Nathan Beckmann)、蔡宝安(Po An Tsai)和丹尼尔·桑切斯(Daniel Sanchez)。2015。通过计算和数据联合调度扩展分布式缓存层次结构。在第21届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者交叉引用交叉引用
  10. 佩曼·贝纳姆(Payman Behnam)和马赫迪·纳兹姆·博伊诺迪(Mahdi Nazm Bojnordi)。2020年。RedCache:减少DRAM缓存。在第57届ACM/IEEE设计自动化会议(DAC)上。谷歌学者谷歌学者
  11. Naama Ben David、Ziv Scully和Guy E.Blelloch。2019.NUMA架构中的不公平调度模式。在第28届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  12. 马西耶·贝斯塔(Maciej Besta)、拉格汉德拉·卡纳卡吉里(Raghavendra Kanakagiri)、格热戈兹·克瓦西涅夫斯基(Grzegorz Kwasniewski)、拉查塔·奥萨瓦隆尼伦(Rachata Ausavarungnirun)、雅库布·贝内克(Jakub Beránek)、康斯坦蒂诺斯·卡内洛普洛斯(Konstantinos Kanellopoulos)、卡普尔·詹达(Kacper Janda)、苏尔·沃纳博格·什马里亚(Zur Vonarburg-Shmaria)、卢卡斯·吉安尼亚齐(Lukas Gianinazzi)和艾奥娜。2021.SISA:处理器内存系统上图形挖掘的以集合为中心的指令集体系结构。在第54届IEEE/ACM国际微体系结构研讨会(MICRO)上。谷歌学者谷歌学者
  13. 罗伯特·德·布鲁莫夫(Robert D Blumofe)和查尔斯·雷瑟森(Charles E Leiserson)。1999.通过工作窃取调度多线程计算。美国医学会杂志(JACM),46,5(1999)。谷歌学者谷歌学者数字图书馆数字图书馆
  14. 阿米拉利·博鲁曼(Amirli Boroumand)、索加塔·戈泽(Saugata Ghose)、金永硕(Youngsok Kim)、拉查塔·奥萨瓦隆尼伦(Rachata Ausavarungnirun)、埃里克·希乌(Eric Shiu)、拉胡尔·塔库尔(Rahul Thakur)、大云·金(Daehyun Kim),阿基·库塞拉。2018年,谷歌消费设备工作量:缓解数据移动瓶颈。在第23届编程语言和操作系统(ASPLOS)架构支持国际会议上。谷歌学者谷歌学者数字图书馆数字图书馆
  15. 阿米拉利·博鲁曼(Amiria Boroumand)、索加塔·戈泽(Saugata Ghose)、米内什·帕特尔(Minesh Patel)、哈桑·哈桑(Hasan Hassan)、布兰登·卢西亚(Brandon Lucia)、拉查塔·奥萨瓦隆尼伦(Rachata Ausavarungnirun)、谢文·纳斯塔兰·哈吉纳扎尔(Nastaran Ha。2019.CoNDA:对近数据加速器的高效缓存一致性支持。第46届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  16. 阿米拉利·博罗曼德、索加塔·戈泽、米内什·帕特尔、哈桑·哈桑、布兰登·露西亚、纳斯塔兰·哈吉纳扎尔、凯文·谢赫、克里希纳·塔马拉迪、郑洪忠和奥努尔·穆特鲁。2017.LazyPIM:有效支持处理内存体系结构中的缓存一致性。在arXiv预印本arXiv:1706.03162中。谷歌学者谷歌学者
  17. Damla Senol Cali、Gurpreet S.Kalsi、Zulal Bingöl、Can Firtina、Lavanya Subramanian、Jeremie S.Kim、Rachata Ausavarungnirun、Mohammed Alser、Juan Gomez-Luna、Amirli Borumand、Anant Norion、Allison Scibisz、Sreenivas Subramoneyon、Can Alkan、Saugata Ghose和Onur Mutlu。2020年。GenASM:用于基因组序列分析的高性能、低功耗近似字符串匹配加速框架。在第53届IEEE/ACM国际微体系结构研讨会(MICRO)上。谷歌学者谷歌学者
  18. Niladrish Chatterjee、Mike O'Connor、Donghyuk Lee、Daniel R Johnson、Stephen W Keckler、Minsoo Rhu和William J Dally。2017.为GPU构建节能DRAM系统。在第23届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者交叉引用交叉引用
  19. 陈全、陈亚文、黄志毅和郭敏毅。2012.WATS:非对称多核架构中的工作负载感知任务调度。在IEEE第26届国际并行和分布式处理研讨会(IPDPS)上。谷歌学者谷歌学者
  20. 陈爽、江毅、克里斯蒂娜·德里米特鲁和何塞·马丁内斯。2022.PIMCloud:具有QoS-Aware意识的内存中处理的云中关键延迟应用程序的资源管理。在第28届IEEE高性能计算机体系结构国际研讨会上。谷歌学者谷歌学者
  21. Chiachen Chou、Aamer Jaleel和Moinuddin K.Qureshi。2016.CANDY:为多节点系统启用相干DRAM缓存。第49届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  22. OpenMP委员会。2013.OpenMP 4.0完整规范。https://openmp.org/wp-content/uploads/OpenMP4.0.0.pdf谷歌学者谷歌学者
  23. Vidushi Dadu和Tony Nowatzki。2022.TaskStream:通过恢复程序结构加快任务并行工作负载。在第27届编程语言和操作系统(ASPLOS)架构支持国际会议上。谷歌学者谷歌学者数字图书馆数字图书馆
  24. 戴国浩、黄天浩、池玉泽、赵继申、孙光裕、刘永潘、王瑜、谢元和杨华忠。2019.GraphH:用于大规模图形处理的内存中处理架构。IEEE集成电路与系统计算机辅助设计汇刊(TCAD),38,4(2019)。谷歌学者谷歌学者交叉引用交叉引用
  25. 戴国浩、朱振华、傅天宇、魏赤岳、王邦彦、李湘玉、谢元、杨华忠和王瑜。2022.DIMMining:基于近内存计算的高效删减和并行图挖掘。第49届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  26. Reetuparna Das、Rachata Ausavarungnirun、Onur Mutlu、Akhilesh Kumar和Mani Azimi。2013.减少多核系统中内存系统干扰的应用程序到内核映射政策。在第19届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者数字图书馆数字图书馆
  27. 蒂莫西·戴维斯(Timothy A Davis)和胡一凡(Yifan Hu),2011年。佛罗里达大学稀疏矩阵收藏。ACM数学软件汇刊(TOMS),38,1(2011)。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 安迪·德雷贝斯(Andi Drebes)、安东尼乌·波普(Antoniu Pop)、卡琳·海德曼(Karine Heydemann)、阿尔伯特·科恩(Albert Cohen)和娜塔莉·德拉赫(Nathalie Drach)。2016年,NUMA的可伸缩任务并行性:协调调度和内存管理的统一抽象。在第25届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  29. 安迪·德雷贝斯(Andi Drebes)、安东尼乌·波普(Antoniu Pop)、卡琳·海德曼(Karine Heydemann)、纳撒利·德拉赫(Nathalie Drach)和阿尔伯特·科恩(Albert Cohen)。2016.支持NUMA的数据流任务并行应用程序调度和内存分配。第21届ACM SIGPLAN并行编程原理与实践研讨会(PPoPP)。谷歌学者谷歌学者
  30. 马里奥·德鲁蒙德(Mario Drumond)、亚历山大·达格利斯(Alexandros Daglis)、努申·米尔扎德(Nooshin Mirzadeh)、德米特里·乌斯提乌戈夫(Dmitrii Ustiugov)、哈维尔·皮科雷尔(Javier Picorel)、巴巴克·法尔萨菲(Babak Falsafi)、。2017年,蒙德里安数据引擎。在第44届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者
  31. Amin Farmahini-Farahani、Jung Ho Ahn、Katherine Morrow和Nam Sung Kim。2015年NDA:利用商品DRAM设备和标准内存模块的近DRAM加速架构。在第21届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者
  32. 冯思颖(Siying Feng)、何欣(Xin He)、陈冠宇(Kuan Yu Chen)、刘珂(Liu Ke)、张宣(Xuan Zhang)、大卫·布劳(David Blaauw)、特雷弗·穆奇(Trevor Mudge)和罗纳德·德雷斯。2022.MeNDA:稀疏转置和数据流的近内存多路合并解决方案。在第49届ACM/IEEE年度国际计算机体系结构研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  33. 高明宇(Mingyu Gao)、格兰特·艾尔斯(Grant Ayers)和克里斯托斯·科兹拉基斯(Christos Kozyrakis)。2015.内存分析框架的实际近数据处理。在第24届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  34. Mingyu Gao和Christos Kozyrakis。2016年HRL:高效灵活的可重构逻辑,用于近数据处理。在第22届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者
  35. 高明宇、浦晶、杨轩、马克·霍洛维茨和克里斯托斯·科兹拉基斯。2017年,俄罗斯方块:可扩展且高效的3D记忆神经网络加速。在第20届编程语言和操作系统(ASPLOS)架构支持国际会议上。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 克里斯蒂娜·吉安诺拉(Christina Giannoula)、南迪塔·维贾库马尔(Nandita Vijaykumar)、尼古拉·帕帕佐普鲁(Nikela Papadopoulou)、瓦西里奥斯·卡拉科斯塔斯(Vasileios Karakostas)、伊万·费尔南德斯(Ivan Fernandez)、胡安·戈梅斯·卢纳(Juan Gómez-Luna。2021.SynCron:对近数据处理架构的高效同步支持。在第27届IEEE高性能计算机体系结构国际研讨会上。谷歌学者谷歌学者
  37. Joseph E.Gonzalez、Yucheng Low、Haijie Gu、Danny Bickson和Carlos Guestrin,2012年。PowerGraph:自然图上的分布式图并行计算。在第十届USENIX操作系统设计与实现会议(OSDI)上。谷歌学者谷歌学者
  38. 顾鹏、谢新峰、丁玉飞、陈国洋、张伟峰、牛迪敏、谢元。2020年。iPIM:使用近库架构的可编程内存图像处理加速器。在第47届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  39. Nagendra Gulur、Mahesh Mehendale、R.Manikantan和R.Govindarajan。2015.双模DRAM缓存:提高命中率、命中延迟和带宽。第48届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  40. Nikos Hardavellas、Michael Ferdman、Babak Falsafi和Anastasia Ailamaki。2009.反应式NUCA:分布式缓存中接近最佳的块放置和复制。在第36届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  41. 谢凯文(Kevin Hsieh)、埃曼·易卜拉希米(Eiman Ebrahimi)、金光顺(Gwangsun Kim)、尼拉德里什·查特吉(Niladrish Chatterjee)、迈克·奥康纳(Mike O'Connor)、南迪塔·维贾库玛(Nandita Vijaykumar)、奥努尔·穆特鲁(。2016.透明卸载和映射(TOM)实现GPU系统中的程序员透明近数据处理。在第43届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者
  42. Cheng Chieh Huang和Vijay Nagarajan。2014.ATCache:通过小型SRAM标记缓存减少DRAM缓存延迟。在第23届国际并行体系结构与编译会议(PACT)上。谷歌学者谷歌学者数字图书馆数字图书馆
  43. Aamer Jaleel、Hashem H.Najaf-abadi、Samantika Subramaniam、Simon C.Steely和Joel Emer.2012年。CRUISE:缓存替换和实用程序感知调度。在第17届编程语言和操作系统(ASPLOS)架构支持国际会议上。谷歌学者谷歌学者
  44. JEDEC公司。2021.高带宽内存(HBM)DRAM。https://www.jedec.org/standards-documents/docs/jesd235a谷歌学者谷歌学者
  45. Mark C.Jeffrey、Suvinay Subramanian、Maleen Abeydeera、Joel Emer和Daniel Sanchez。2016年,以数据为中心执行推测性并行程序。第49届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  46. Mark C.Jeffrey、Suvinay Subramanian、Cong Yan、Joel Emer和Daniel Sanchez。2015.有序并行的可扩展架构。第48届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  47. 乔杰·杰夫季奇(Djordje Jevdjic)、加布里埃尔·H·洛(Gabriel H.Loh)、坎苏·卡纳克(Cansu Kaynak)和巴巴克·法尔萨菲(Babak Falsafi)。2015.Unison Cache:一种可扩展且有效的叠层DRAM缓存。在第48届IEEE/ACM年度微体系结构国际研讨会(MICRO)上。谷歌学者谷歌学者
  48. 乔杰·杰夫季奇(Djordje Jevdjic)、斯塔夫罗斯·沃洛斯(Stavros Volos)和巴巴克·法尔萨菲(Babak Falsafi)。2013.服务器命中率、延迟或带宽的堆叠DRAM缓存?使用Footprint Cache实现一切。在第40届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者
  49. Jun Honshin、Jinhee Cho、Kangseol Lee、Ho Young Son、Kwiwok Kim、Hanho Jin和Keith Kim。2017年,HBM(高带宽存储器)DRAM技术和架构。2017年IEEE国际记忆研讨会(IMW)。谷歌学者谷歌学者
  50. 2021年,Kal Hongju、Lee Seokmin、Gun Ko和Won Woo Ro。空间:针对个性化建议的异构内存中的局部感知处理。第48届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  51. 刘科、乌迪特·古普塔、本杰明·扬嘉·赵、大卫·布鲁克斯、维卡斯·钱德拉、乌特库·迪里尔、阿明·菲鲁兹沙欣、金·哈泽尔伍德、比尔·贾、辛·李、孟莉、伯特·马赫、德赫瓦萨·穆迪盖雷、马克西姆·诺莫夫、马丁·沙茨、米哈伊尔·斯迈扬斯基、王晓东、布兰登·里根、卡罗尔·让·吴、马克·亨普斯特德和张宣。2020年,RecNMP:通过近内存处理加速个性化推荐。在第47届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者
  52. Duckhwan Kim、Jaeha Kung、Sek Chai、Sudhakar Yalamanchili和Saibal Mukhopadhyay。2016年,NeuroCube:具有高密度3D内存的可编程数字神经形态结构。在第43届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  53. 金光顺(Gwangsun Kim)、金约翰(John Kim),安正浩(Jung Ho Ahn)和金在哈(Jaeha Kim)。2013年,采用混合内存立方体的以内存为中心的系统互连设计。在第22届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  54. Jeremie S.Kim、Damla Senol Cali、Hongyi Xin、Donghyuk Lee、Saugata Ghose、Mohammed Alser、Hasan Hassan、Oguz Ergin、Can Alkan和Onur Mutlu。2018年。GRIM-Filter:使用内存中处理技术在DNA读取映射中进行快速种子位置过滤。BMC基因组学,19,2(2018)。谷歌学者谷歌学者
  55. Orhan Kislal、Jagadish Kotra、Xulong Tang、Mahmut Taylan Kandimir和Myoungsoo Jung。2018年,利用物理位置信息加强计算到核心的分配。在第39届ACM SIGPLAN编程语言设计与实现(PLDI)会议上。谷歌学者谷歌学者
  56. 2019年,Youngeun Kwon、Yunjae Lee和Minsoo Rhu。TensorDIMM:用于深度学习中嵌入和张量操作的实用近内存处理架构。第52届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  57. Young-Cheon Kwon、Suk Han Lee、Jaehoon Lee、Sang-Hyuk Kwon,Je Min Ryu、Jong-Pil Son、O Seongil、Hak-Soo Yu、Haesuk Lee,Soo Young Kim、Youngmin Cho、Jin Guk Kim、Jongyoon Choi、Hyung Shin、Jin Kim、BengSeng Phuah、Hyong Min Kim、Myeong Jun Song、Ahn Choi,Daeho Kim,Soo Yeng Bong Kim,David Wang,Shinhang Kang,Yuwan Ro,Seungwoo Seo、JoonHo Song、Jaeyoun Youn、Kyomin Sohn和Nam Sung Kim。2021.基于HBM2的20nm 6GB功能内存DRAM,带有1.2TFLOPS可编程计算单元,使用银行级并行,用于机器学习应用。2021年IEEE国际固态电路大会(ISSCC)。谷歌学者谷歌学者交叉引用交叉引用
  58. 李勇军、金钟文、张学友、杨贤云、金章武、金敬奎和李在伟。2015.完全关联的无标记DRAM缓存。第42届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者
  59. Baptiste Lepers、Vivien Quéma和Alexandra Fedorova。2015年,NUMA系统上的线程和内存放置:不对称性很重要。2015年USENIX年度技术会议(USENIXATC)。谷歌学者谷歌学者
  60. Leskovec和Rok Sosič法官。2016年,SNAP:通用网络分析和图形挖掘库。ACM智能系统与技术交易(TIST),8,1(2016)。谷歌学者谷歌学者
  61. 加布里埃尔·洛。2009.使用自适应多队列策略扩展3D-Stacked DRAM缓存的有效性。第42届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  62. Gabriel H.Loh和Mark D.Hill。2011.高效实现超大叠片DRAM缓存的传统块大小。第44届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  63. 格列戈兹·马莱维茨、马修·奥斯汀、阿尔特·杰克·比克、詹姆斯·德内特、伊兰·霍恩、纳蒂·雷瑟和格列戈斯·查伊科夫斯基。2010年,Pregel:大尺度图形处理系统。2010年,ACM SIGMOD国际数据管理会议。谷歌学者谷歌学者数字图书馆数字图书馆
  64. 莎莉·A·麦基。2004年,关于记忆墙的反思。在第一届计算机前沿会议的会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  65. 微米。2018年,混合记忆立方——HMC Gen2。https://www.micron.com/-/media/client/global/documents/products/data-sheet/hmc/gen2/hmc_gen2.pdf谷歌学者谷歌学者
  66. Onur Mutlu和Srinivas Devadas。2017年。Banshee:通过软件/硬件合作实现带宽高效DRAM缓存高带宽封装DRAM。第50届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  67. Lifeng Nai、Ramyad Hadidi、Jaewoong Sim、Hyojong Kim、Pranith Kumar和Hyeson Kim。2017.GraphPIM:在图形计算框架中实现指令级PIM卸载。在第23届IEEE高性能计算机体系结构(HPCA)研讨会上。谷歌学者谷歌学者
  68. 拉维·奈尔(Ravi Nair)、塞缪尔·法·安托(Samuel F Antao)、卡洛·贝托利(Carlo Bertolli)、普拉迪普·博斯(Pradip Bose)、何塞尔·布伦赫罗托(Jose R Brunheroto)、童晨(Tong Chen)、C-Y Cher、卡洛斯·哈·科斯塔(Carlos HA。2015.活动内存多维数据集:Exascale系统的内存处理架构。IBM研究与开发杂志,59,2/3(2015)。谷歌学者谷歌学者数字图书馆数字图书馆
  69. Jaehyun Park、Byeongho Kim、Sungmin Yun、Eojin Lee、Minsoo Rhu和Jung Ho Ahn。2021.TRiM:使用可伸缩张量减少增强处理器-内存接口。第54届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  70. 阿努吉·帕塔尼亚。2018.S-NUCA缓存多核任务调度。欧洲会议展览(DATE)设计、自动化和测试专业。谷歌学者谷歌学者
  71. 马修·波伦巴(Matthew Poremba)、伊蒂尔·阿克根(Itir Akgun)、尹杰明(Jieming Yin)、奥努尔·卡伊兰(Onur Kayiran)、袁谢(Yuan Xie)和加布里埃尔·H·卢(Gabriel H.Loh)。2017年,《此起彼伏:优化存储器立方体网络的互连》。在第44届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者
  72. Iraklis Psaroudakis、Tobias Scheuer、Norman May、Abdelkader Sellami和Anastasia Ailamaki。2016。主内存列存储中分析工作负载的自适应NUMA感知数据放置和任务调度。在第46届国际超大数据库会议(VLDB)上。谷歌学者谷歌学者
  73. Seth H Pugsley、Jeffrey Jestes、Huihui Zhang、Rajeev Balasubramonian、Vijayalakshmi Srinivasan、Alper Buyuktosunoglu、Al Davis和Feifei Li.2014。NDC:分析3D堆叠内存+逻辑设备对MapReduce工作负载的影响。2014年IEEE系统和软件性能分析国际研讨会(ISPASS)。谷歌学者谷歌学者交叉引用交叉引用
  74. Moinuddin K Qureshi和Gabe H Loh。2012.构建DRAM缓存的基本延迟权衡:以简单实用的设计超越不实用的SRAM包。第45届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  75. Martin Rapp、Anuj Pathania、Tulika Mitra和Jörg Henkel。2019.S-NUCA多核上基于预测的任务迁移。欧洲会议展览(DATE)设计、自动化和测试专业。谷歌学者谷歌学者
  76. 阿弥陀佛罗伊、伊沃·米哈伊洛维奇和威利·兹瓦尼波尔。2013.X-Stream:使用流分区的边缘中心图形处理。第24届ACM操作系统原理研讨会(SOSP)。谷歌学者谷歌学者数字图书馆数字图书馆
  77. 丹尼尔·桑切斯和克里斯托斯·科兹拉基斯。2013年,ZSim:千核系统的快速准确微结构模拟。在第40届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  78. Daniel Sanchez、David Lo、Richard M.Yoo、Jeremy Sugerman和Christos Kozyrakis。2011.管道并行性的动态细粒度调度。在第20届国际并行体系结构和编译技术会议(PACT)上。谷歌学者谷歌学者
  79. 安德烈·塞兹内克(AndréSeznec)和弗朗索瓦·博丹(Francois Bodin)。1993年。倾斜关联缓存。在欧洲并行体系结构和语言国际会议(PARLE)上。谷歌学者谷歌学者
  80. Yakun Sophia Shao、Jason Clemons、Rangharajan Venkatesan、Brian Zimmer、Matthew Fojtik、Nan Jiang、Ben Keller、Alicia Klinefelter、Nathaniel Pinckney和Priyanka Raina。2019.Simba:利用基于多芯片模块的架构扩展深度学习推断。第52届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  81. Shumpei Shiina和Kenjiro Taura。2019.几乎决定性的工作偷窃。参加高性能计算、网络、存储和分析(SC)国际会议。谷歌学者谷歌学者
  82. 朱利安·顺(Julian Shun)和盖伊·E·布莱洛克(Guy E.Blelloch)。2013.Ligra:用于共享内存的轻量级图形处理框架。在第18届ACM SIGPLAN并行编程原理与实践研讨会(PPoPP)上。谷歌学者谷歌学者
  83. Jaewoong Sim、Gabriel H.Loh、Hyeson Kim、Mike Oconnor和Mithuna Thottehodi。2012.最干净的DRAM缓存,用于有效的命中推测和自平衡调度。第45届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  84. Gagandeep Singh、Juan Gómez Luna、Giovanni Mariani、Geraldo F Oliveira、Stefano Corda、Sander Stuijk、Onur Mutlu和Henk Corporal。2019.Napel:通过集成学习预测近内存计算应用程序性能。在第56届ACM/IEEE设计自动化会议(DAC)上。谷歌学者谷歌学者数字图书馆数字图书馆
  85. 孙伟毅、李兆石、尹守义、魏少军和刘雷波。2021.ABC-DIMM:使用Inter-DIMM广播缓解基于DIMM的近内存处理中的通信瓶颈。第48届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者
  86. Isaac Sánchez Barrera、Miquel Moretó、Eduard Ayguadé、JesúS Labarta、Mateo Valero和Marc Casas。2018.通过利用计算依赖性减少大型共享内存系统上的数据移动。在超级计算国际会议(ICS)的会议记录中。谷歌学者谷歌学者
  87. 西希尔·塔拉蒂、叶浩杰、杨一晨、吕尔·贝莱恩、陈冠宇、大卫·布劳、特雷弗·穆奇和罗纳德·德雷斯林斯基。2022.NDMiner:使用近数据处理加速图形模式挖掘。第49届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  88. 唐旭龙、奥尔汉·基斯拉尔、马赫穆特·坎德米尔和穆斯塔法·卡拉科伊。2017.数据移动感知计算分区。第50届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  89. 蔡波安、内森·贝克曼和丹尼尔·桑切斯。2017.Jenga:软件定义的缓存层次结构。在第47届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  90. 蔡宝安、陈昌平和丹尼尔·桑切斯。2018.非对称内存层次系统的自适应调度。第51届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者
  91. 谢新峰、郑亮、彭谷、阿班蒂·巴萨克、雷登、凌亮、邢虎和袁谢。2021.SpaceA:内存处理器上的稀疏矩阵向量乘法。在第27届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者
  92. 维克多·A·英(Victor A.Ying)、马克·C·杰弗里(Mark C.Jeffrey)和丹尼尔·桑切斯(Daniel Sanchez)。2020年,T4:编译硬件中有效推测并行的顺序代码。在第47届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)上。谷歌学者谷歌学者数字图书馆数字图书馆
  93. 文森·杨(Vinson Young)、Chiachen Chou、Aamer Jaleel和Moinuddin Qureshi。2018年,ACCORD:通过协调路线安装和路线预测,实现Gigascale DRAM缓存的关联性。第45届ACM/IEEE计算机体系结构年度国际研讨会(ISCA)。谷歌学者谷歌学者数字图书馆数字图书馆
  94. 贾湛、伊蒂尔·阿克根、赵继申、艾尔·戴维斯、保罗·法拉布西、王远刚和袁谢。2016.商品服务器内存计算的统一内存网络架构。第49届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆
  95. 张东平、努万·贾亚塞纳、亚历山大·利亚舍夫斯基、约瑟夫·格里塔斯、徐力凡和迈克尔·伊格纳托夫斯基。2014.TOP-PIM:内存中面向吞吐量的可编程处理。在第23届高性能并行和分布式计算国际研讨会上。谷歌学者谷歌学者数字图书馆数字图书馆
  96. 张明兴、卓有为、王超、高明宇、吴永伟、陈康、克里斯托斯·科兹拉基斯和钱学海。2018.GraphP:使用高效数据分区减少基于PIM的图形处理的通信。在第24届IEEE高性能计算机体系结构(HPCA)国际研讨会上。谷歌学者谷歌学者
  97. 卓有为、王超、张明星、王瑞、牛迪敏、王延之和钱学海。2019.GraphQ:基于PIM的可伸缩图形处理。第52届IEEE/ACM国际微体系结构研讨会(MICRO)。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. ABNDP:在近数据处理中协同优化数据访问和负载平衡

      建议

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        封面图片ACM会议
        ASPLOS 2023:第28届ACM编程语言和操作系统架构支持国际会议记录,第3卷
        2023年3月
        820页
        国际标准图书编号:9781450399180
        内政部:10.1145/3582016

        版权所有©2023所有者/作者

        本作品根据Creative Commons Attribution 4.0国际许可证授权。

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2023年3月25日

        权限

        请求有关此文章的权限。

        请求权限

        检查更新

        限定符

        • 研究论文

        接受率

        总体验收率535属于2713年提交文件,20%

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器