{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,5,23]],“日期-时间”:“2024-05-23T15:12:10Z”,“时间戳”:1716477130450},“发布者位置”:“美国纽约州纽约市”,“引用-计数”:34,“出版商”:“ACM”,“许可证”:[{“开始”:“日期-零件”:[[2018,6,12]],“时间me“:”2018-06-12T00:00:00Z“,”时间戳“:1528761600000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“funder”:[{“DOI”:“10.13039\/501100001809”,“name”:“国家自然科学基金”,“DOI-asserted-by”:“publisher”,“award”:[“No.61572508 and 61672526”]}100010663“,”名称“:“European Research Council”,“doi-asserted-by”:“publisher”,“award”:[“No.741097”]},{“doi”:“10.13039\/501100003130”,“name”:“Fonds Wetenschappelijk Onderzoek”,”doi-assert-by“:”publisher“,”award“:[“G.0434.16N and G.0144.17N”]}],“content-domain”:{“domain”[“dl.acm.org”],“crossmark-restriction”:true},“short-container-ti”tle“:[],”published-print“用法:{“date-parts”:[[2018,6,12]]},“DOI”:“10.1145\/3205289.3205311”,“type”:“proceedings-article”,“created”:{”date-part“:[[2018,9,13]],“date-time”:“2018-09-13T12:54:52Z”,“timestamp”:1536843292000},”update-policy“:”http://\/dx.DOI.org\/10.1145\/crossmark-policy“,”source“Crossref”,“is-referenced-by-count”:20,“标题”:[“分类驱动搜索在多任务GPU中实现有效的SM划分”],“前缀”:“10.1145”,“作者”:[{“给定”:“夏”,“家族”:“赵”,”sequence“:”first“,”affiliation“:[{“name”:“Ghent University,Belgium”}]},{“given”:“志英”,“family”:“Wang”,“sequence”:“additional”,“affiliance”:[[{”name“:“中国国防科技大学”}]},{“given”:“Lieven”,“family”:“Eeckhout”,“sequence”:“additional”,“affiliation”:[{“name”:“Ghent University,Belgium”}]}],“member”:“320”,“published-online”:{“date-parts”:[[2018,6,12]},“reference”:[[{”key“:”e_1_3_2_1_1_1_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/2872362.2872368”},{,“key”:e_1_3_2_1_2_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/1996130.1996160”},{“key”:“e_1_3_2_1_3_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/2854038.2854040“},}“key:”e_1_ 3_2_1_4_1“,”first page“:”109“,“author”:“铃木Y.”,“year”:“2014”,“unstructured”:“Y.Suzuki,S.Kato,H.Yamada,and K.Kono,”GPUvm:为什么不在Hypervisor虚拟化GPU?,《USENIX年度技术会议(ATC)会议记录》,第109-120页,2014年6月。Y.Suzuki、S.Kato、H.Yamada和K.Kono,“GPUvm:为什么不在虚拟机监控程序中虚拟化GPU?”\“《USENIX年度技术会议(ATC)会议记录》,第109-120页,2014年6月。”,“journal-title”:“,”《USENIX年度技术会议记录》(ATC)“},{“key”:“e_1_3_2_1_5_1”,“unstructured”:“Amazon”Amazon web services.“https:\//aws.Amazon.com\/cn\/ec2\/.Amazonhttps:\/\/aws.amazon.com/cn\/ec2\/。“},{”key“:”e_1_3_2_1_6_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/HPCA.2012.6168946”},“key”:“e_1_3_2_1_7_1”,“doi-assert-by”:“publisher”,”doi“:”10.5555\/2665671.2665702“}”,{“非结构化”:“M.Awatramani、J.Zambreno和D。Rover,“使用内核交错线程块调度提高GPU吞吐量”,《国际计算机设计会议论文集》(ICCD),第503--506页,2013年10月。M.Awatramani、J.Zambreno和D.Rover,“使用内核交织线程块调度提高GPU吞吐量”,《国际计算机设计会议论文集》,第503-506页,2013年10月。“,”期刊标题“:“使用内核交错线程块调度增加GPU吞吐量,”在《国际计算机设计会议论文集》(ICCD)“},{“key”:“e_1_3_2_1_9_1”,“首页”:“358”,“volume-title”:“同步多核GPU:通过细粒度共享实现多任务吞吐量处理器”,《高性能计算机体系结构国际研讨会论文集》,“作者”:“Wang Z.”,“年份”:“2016”,“非结构化”:“Z.Wang,J.Yang,R.Melhem,B.Childers,Y.Zhang,and M.Guo,“同步多内核GPU:通过细粒度共享的多任务吞吐量处理器”,载于《高性能计算机体系结构国际研讨会论文集》,第358-369页,2016年3月。Z.Wang,J.Yang,R.Melhem,B。Childers,Y.Zhang和M.Guo,“同步多内核GPU:通过细粒度共享的多任务吞吐量处理器,”载于《高性能计算机体系结构国际研讨会论文集》,第358-369页,2016年3月。“},{“key”:“e_1_3_2_1_10_1”,“doi断言”:“publisher”,“doi”:“10.1109\/ISCA.26.29”},{“key”:“e_1_3_2_11_1“,”unstructured“:”\“NVIDIA Tesla V100 Volta Architecture.”\“”\“NVIDIA特斯拉V100 VoltaArchitecture.\“”},{“key”:“e_1_ 3_2_12_1”,“doi-asserted-by”:“publisher”,“doi”:“10.1145\/2818950.2818979”}、{“密钥”:“e_13_2_13_1”,”doi-assert-by“:”publisher“,”doi“:”10.1145\/3037697.3037707“},”{“key”:“e_1_3_2_14_1”,“doi-asserted-by”:“publisher”,”DOI“:”10.1145\/3123939.3123975“},{”key“:”e_1_3_2_15_1“,”volume-title“:”March“,”author“:”Wang H.“,“year”:“2018”,“unstructured”:“H.Wang,F.Luo,M.Ibrahim,O.Kayiran,and A.Jog,”通过有效带宽管理在GPU中高效公平的多程序设计“《高性能计算机体系结构(HPCA)国际研讨会论文集》,2018年3月。H.Wang,F.Luo,M.Ibrahim,O.Kayiran,和A.Jog,“通过有效带宽管理在GPU中实现高效公平的多道程序设计”,《高性能计算机体系结构(HPCA)国际研讨会论文集》,2018年3月。“},{“key”:“e_1_3_2_16_1”,“first-page”:“1”,“author”:“Jadi A.”,“year”:“2017”,“unstructured”:“A。Jadidi,M.Arjomand,M.T.Kandemir和C.R.Das,“通过反馈驱动的CTA调度优化GPUS中的能耗”,《高性能计算研讨会论文集》,第12:1-12:122017年4月。A.Jadidi、M.Arjomand、M.T.Kandemir和C.R.Das,“通过反馈驱动的CTA调度优化GPUS能耗”,《高性能计算研讨会论文集》,2017年4月,第12:1-12:12页在《高性能计算研讨会论文集》(HPC)“},{“key”:“e_1_3_2_17_1”,“volume-title”:“December”,“author”:“Jadidi A.”,“year”:“2015”,“unstructured”:“A.Jadidi,“GP Us中基于内核的能量优化”,硕士论文,宾夕法尼亚州立大学,2015年12月。A。Jadidi,“GPU中基于内核的能源优化”,宾夕法尼亚州立大学硕士论文,2015年12月。},{“key”:“e_1_3_2_1_18_1”,“first page”:1,“author”:“Vijaykumar N.”,年:“2016”,“unstructured”:“N.Vijaykomar,K.Hsieh,G.Pekhimenko,s.Khan,A.Shrestha,s.Ghose,A.Jog,P.B.Gibbons,and O。Mutlu,“Zorua:GPU中资源虚拟化的整体方法”,《微体系结构国际研讨会论文集》,第1-14页,2016年10月。N.Vijaykumar、K.Hsieh、G.Pekhimenko、S.Khan、A.Shrestha、S.Ghose、A.Jog、P.B.Gibbons和O.Mutlu,“Zorua:GPU中资源虚拟化的整体方法”,《微体系结构国际研讨会论文集》,第1-14页,2016年10月\“Zorua:GPU中资源虚拟化的整体方法,\”载于《微体系结构国际研讨会论文集》,},{“key”:“e_1_3_2_1_19_1”,“doi由”:“publisher”断言,“doi”:“10.1145\/283072.283070784”},{“key”:“e_1_3_2_20_1”,doi由”:“publisher”断言,“doi”:“10.1109\/HPCA.2012.6168947”},{“key”:“e_1_3_2_1_21_1”,“doi-asserted-by“:”publisher“,”doi“:”10.1145\/2694344.2694346“},{“key”:“e_1_3_2_1_22_1”,“unstructured”:“Nvidia\”Nvidia TESLA P100 GPU ACCELERATOR.\“https:\/\/images.Nvidia.com\/content\/TESLA\/pdf\/Nvidia-TESLA-P100-PCIe-datasheet.pdf 2016。Nvidia“Nvidia TESLA P100 GPU加速器。”https:\/\/images.Nvidia.com/content\/TESLA\/pdf\/Nvidia-TESLA-P100-PCIe-datasheet.pdf 2016.“},{”key“:”e_1_3_2_1_23_1“,”first page“:“163”,”volume-title“:”使用详细的GPU模拟器分析CUDA工作负载,“在系统和软件性能分析国际研讨会(ISPASS)上”,“作者”:“Bakhoda a.”,“年份”:“2009年”,“非结构化”:“a.Bakhoda,G.L.Yuan,W.W.L.Fung,H.Wong,和T.M.Aamodt,“使用详细的GPS模拟器分析CUDA-工作负载,\“在2009年4月举行的系统和软件性能分析国际研讨会(ISPASS)上,第163-174页。A.Bakhoda、G.L.Yuan、W.W.L.Fung、H.Wong和T.M.Aamodt,”使用详细的GPU模拟器分析CUDA工作负载,\“《系统和软件性能分析国际研讨会(ISPASS)论文集》,第163-174页,2009年4月。”},{“key”:“e_1_3_2_1_24_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145“/248592.2485964”}“,{”key“:”e_1_a_2_1_25_1“,”unstructured“:”NVIDIA CUDA SDK代码示例“https:\\/developer.NVIDIA.com/CUDA-downloads。”NVIDIA CUDA SDK代码示例\“https:\/\/developer.nvidia.com/cuda-downloads.”},{“key”:“e_1_3_2_1_26_1”,“volume-title”:“March”,“author”:“Stratton J.A.”,“year”:“2012”,“unstructured”:“J.A.Stratton,C.Rodrigues,I.-J.Sung,N.Obeid,L.-W.Chang,N.Anssari,G.D.Liu,and W.W.Hwu,\”Parbuil:科学和商业吞吐量计算的修订基准套件,“技术代表,2012年3月。J.A.Stratton,C.Rodrigues,I.-J.Sung,N.Obeid,L.-W.Chang,N.Anssari,G.D.Liu,和W.m.W.Hwu,“Parbuil:A Revised Benchmark Suite for Scientific and Commercial Throughput Computing,”技术代表,2012.3月。“},{”关键“:“e_1_3_2_1_27_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/IISWC.2009.5306797“},{“key”:“e_ 1_3_2 _1_28_1”、“first page”:”1“,”author“:”Grauer-Gray S.“,”year“:”2012“,”unstructured“:”S.Grauer-Ray,L.Xu,R.Searles,S.Ayalomayajula,and J.Cavazos,“Autotuning a High-Level Language Targeted to GPU Codes”,《创新并行计算学报》(InPar),第1-10页,2012年5月,“journal-title”:“自动调整针对GPU代码的高级语言,”《创新并行计算学报》(InPar)“},{”key“:”e_1_3_2_1_29_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/1454115.1454152”},“key”:“e_1_a_2_1_30_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/MM.2008.44“}1_1“,”首页“:”144“,“volume-title”:“海报:通过缓解内存管道暂停来加速GPU并发内核执行”,《并行体系结构与编译国际会议(PACT)论文集》,“作者”:“戴赫”,“年份”:“2017年”,“非结构化”:“戴赫,Z.Lin,C.Li,C.Zhao,F.Wang,N.Zheng,and H.Zhou,“海报:通过缓解内存管道暂停来加速GPU并发内核执行”,《并行架构与编译国际会议(PACT)论文集》,第144-145页,2017年9月。H.Dai,Z.Lin,C.Li,C.Zhao,F.Wang,N.Zheng,和H.Zhou,“海报:通过缓解内存管道暂停来加速GPU并发内核执行”,《并行架构与编译国际会议论文集》,第144-145页,2017年9月。“},{”关键“:“e_1_3_2_1_32_1”,“卷-标题”:“三月”,“作者”:“Dai H.“,“年份”:“2018年”,“非结构化”:“H.Dai、Z.Lin、C.Li、C.Zhao、F.Wang、N.Zheng和H.Zhou,“通过缓解内存管道暂停加速GPU并发内核执行”,《高性能计算机体系结构国际研讨会论文集》,2018年3月。H.Dai,Z.Lin,C.Li,C.Zhao,F.Wang,N.Zheng,and H.Zhou,“通过缓解内存管道暂停来加速GPU并发内核执行”,《高性能计算机体系结构国际研讨会论文集》,2018年3月。“},{”key“:”e_1_3_2_1_33_1“,”first page“:“440”,”volume-title“:”公平份额:为绩效和公平分配GPU资源,《国际计算机设计会议论文集》,“作者”:“Aguilera P.”,“年份”:“2014年”,“非结构化”:“P.Aguilela、K.Morrow和N.S.Kim”,“公平份额:为了绩效和公平的GPU资源分配,\“《国际计算机设计会议(ICCD)论文集》,第440-447页,2014年10月。P.Aguilera、K.Morrow和N.S.Kim,“公平份额:GPU资源在性能和公平方面的分配”,《计算机设计国际会议论文集》(ICCD:“e_1_3_2_1_34_1”,“首页”:“1”,“卷标”:“欧洲会议展览自动化测试(DATE)”,“作者”:“李X”,“年份”:“2016年”,“非结构化”:“X.Li和Y.Liang,“GPU上的高效内核管理”,载于《欧洲会议展览设计、自动化测试论文集》,第115:1-115:24页,2016年3月。Li和Y.Liang,“GPU的高效内核管理”,《欧洲会议展览设计、自动化测试会议记录》(DATE),第115:1-115:24页,2016年3月SIGARCH ACM计算机体系结构特别兴趣小组“]},“container-title”:[“2018年超级计算国际会议论文集”],“原始标题”:[],“链接”:[{“URL”:“https:\/\/dl.ACM.org\/doi\/pdf\/10.1145\/320589.3205311”,“内容类型”:“未指定”,“content-version”:“vor”,“intended-application”:“相似性检查”}],“存放“:{“date-parts”:[[2023,10]],“date-time”:“2023-01-10T16:19:29Z”,“timestamp”:1673367569000},“score”:1,“resource”:{”primary“:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/320589.3205311”}},”subtitle“:[],”shorttitle“:[],”issued“{”date-part“:[2018,6,12]]}”,“references-”count“:34,”alternative-id“:[”10.1145\/3205289.3205311“,”10.1145\/3205289“],”URL“:”http://\/dx.doi.org\/10.1145\/320589.3205311“,”关系“:{},”主题“:[],”发布“:{”日期部分“:[[2018,6,12]]},“断言”:[{”值“:”2018-06-12“,”顺序“:2,”名称“:”发布“,”标签“:”已发布“,“组”:{“名称”:“publication_history”,“标签”:“发布历史”}}]}}