{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期-部件”：[[2024,5,23]]，“日期-时间”：“2024-05-23T15:12:10Z”，“时间戳”：1716477130450}，“发布者位置”：“美国纽约州纽约市”，“引用-计数”：34，“出版商”：“ACM”，“许可证”：[{“开始”：“日期-零件”：[[2018,6,12]]，“时间me“：”2018-06-12T00:00:00Z“，”时间戳“：1528761600000}，“content-version”：“vor”，“delay-in-days”：0，“URL”：“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}]，“funder”：[{“DOI”：“10.13039\/501100001809”，“name”：“国家自然科学基金”，“DOI-asserted-by”：“publisher”，“award”：[“No.61572508 and 61672526”]}100010663“，”名称“：“European Research Council”，“doi-asserted-by”：“publisher”，“award”：[“No.741097”]}，{“doi”：“10.13039\/501100003130”，“name”：“Fonds Wetenschappelijk Onderzoek”，”doi-assert-by“：”publisher“，”award“：[“G.0434.16N and G.0144.17N”]}]，“content-domain”：{“domain”[“dl.acm.org”]，“crossmark-restriction”：true}，“short-container-ti”tle“：[]，”published-print“用法：{“date-parts”：[[2018,6,12]]}，“DOI”：“10.1145\/3205289.3205311”，“type”：“proceedings-article”，“created”：{”date-part“：[[2018，9,13]]，“date-time”：“2018-09-13T12:54:52Z”，“timestamp”：1536843292000}，”update-policy“：”http://\/dx.DOI.org\/10.1145\/crossmark-policy“，”source“Crossref”，“is-referenced-by-count”：20，“标题”：[“分类驱动搜索在多任务GPU中实现有效的SM划分”]，“前缀”：“10.1145”，“作者”：[{“给定”：“夏”，“家族”：“赵”，”sequence“：”first“，”affiliation“：[{“name”：“Ghent University，Belgium”}]}，{“given”：“志英”，“family”：“Wang”，“sequence”：“additional”，“affiliance”：[[{”name“：“中国国防科技大学”}]}，{“given”：“Lieven”，“family”：“Eeckhout”，“sequence”：“additional”，“affiliation”：[{“name”：“Ghent University，Belgium”}]}]，“member”：“320”，“published-online”：{“date-parts”：[[2018,6,12]}，“reference”：[[{”key“：”e_1_3_2_1_1_1_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1145\/2872362.2872368”}，{，“key”：e_1_3_2_1_2_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1145\/1996130.1996160”}，{“key”：“e_1_3_2_1_3_1”，“doi-asserted-by”：“publisher”，”doi“：”10.1145\/2854038.2854040“}，}“key:”e_1_ 3_2_1_4_1“，”first page“：”109“，“author”：“铃木Y.”，“year”：“2014”，“unstructured”：“Y.Suzuki，S.Kato，H.Yamada，and K.Kono，”GPUvm:为什么不在Hypervisor虚拟化GPU？，《USENIX年度技术会议（ATC）会议记录》，第109-120页，2014年6月。Y.Suzuki、S.Kato、H.Yamada和K.Kono，“GPUvm:为什么不在虚拟机监控程序中虚拟化GPU？”\“《USENIX年度技术会议（ATC）会议记录》，第109-120页，2014年6月。”，“journal-title”：“，”《USENIX年度技术会议记录》（ATC）“}，{“key”：“e_1_3_2_1_5_1”，“unstructured”：“Amazon”Amazon web services.“https:\//aws.Amazon.com\/cn\/ec2\/.Amazonhttps:\/\/aws.amazon.com/cn\/ec2\/。“}，{”key“：”e_1_3_2_1_6_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/HPCA.2012.6168946”}，“key”：“e_1_3_2_1_7_1”，“doi-assert-by”：“publisher”，”doi“：”10.5555\/2665671.2665702“}”，{“非结构化”：“M.Awatramani、J.Zambreno和D。Rover，“使用内核交错线程块调度提高GPU吞吐量”，《国际计算机设计会议论文集》（ICCD），第503--506页，2013年10月。M.Awatramani、J.Zambreno和D.Rover，“使用内核交织线程块调度提高GPU吞吐量”，《国际计算机设计会议论文集》，第503-506页，2013年10月。“，”期刊标题“：“使用内核交错线程块调度增加GPU吞吐量，”在《国际计算机设计会议论文集》（ICCD）“}，{“key”：“e_1_3_2_1_9_1”，“首页”：“358”，“volume-title”：“同步多核GPU：通过细粒度共享实现多任务吞吐量处理器”，《高性能计算机体系结构国际研讨会论文集》，“作者”：“Wang Z.”，“年份”：“2016”，“非结构化”：“Z.Wang，J.Yang，R.Melhem，B.Childers，Y.Zhang，and M.Guo，“同步多内核GPU：通过细粒度共享的多任务吞吐量处理器”，载于《高性能计算机体系结构国际研讨会论文集》，第358-369页，2016年3月。Z.Wang，J.Yang，R.Melhem，B。Childers，Y.Zhang和M.Guo，“同步多内核GPU：通过细粒度共享的多任务吞吐量处理器，”载于《高性能计算机体系结构国际研讨会论文集》，第358-369页，2016年3月。“｝，｛“key”：“e_1_3_2_1_10_1”，“doi断言”：“publisher”，“doi”：“10.1109\/ISCA.26.29”｝，｛“key”：“e_1_3_2_11_1“，”unstructured“：”\“NVIDIA Tesla V100 Volta Architecture.”\“”\“NVIDIA特斯拉V100 VoltaArchitecture.\“”}，{“key”：“e_1_ 3_2_12_1”，“doi-asserted-by”：“publisher”，“doi”：“10.1145\/2818950.2818979”}、{“密钥”：“e_13_2_13_1”，”doi-assert-by“：”publisher“，”doi“：”10.1145\/3037697.3037707“}，”{“key”：“e_1_3_2_14_1”，“doi-asserted-by”：“publisher”，”DOI“：”10.1145\/3123939.3123975“}，{”key“：”e_1_3_2_15_1“，”volume-title“：”March“，”author“：”Wang H.“，“year”：“2018”，“unstructured”：“H.Wang，F.Luo，M.Ibrahim，O.Kayiran，and A.Jog，”通过有效带宽管理在GPU中高效公平的多程序设计“《高性能计算机体系结构（HPCA）国际研讨会论文集》，2018年3月。H.Wang，F.Luo，M.Ibrahim，O.Kayiran，和A.Jog，“通过有效带宽管理在GPU中实现高效公平的多道程序设计”，《高性能计算机体系结构（HPCA）国际研讨会论文集》，2018年3月。“}，{“key”：“e_1_3_2_16_1”，“first-page”：“1”，“author”：“Jadi A.”，“year”：“2017”，“unstructured”：“A。Jadidi，M.Arjomand，M.T.Kandemir和C.R.Das，“通过反馈驱动的CTA调度优化GPUS中的能耗”，《高性能计算研讨会论文集》，第12:1-12:122017年4月。A.Jadidi、M.Arjomand、M.T.Kandemir和C.R.Das，“通过反馈驱动的CTA调度优化GPUS能耗”，《高性能计算研讨会论文集》，2017年4月，第12:1-12:12页在《高性能计算研讨会论文集》（HPC）“}，{“key”：“e_1_3_2_17_1”，“volume-title”：“December”，“author”：“Jadidi A.”，“year”：“2015”，“unstructured”：“A.Jadidi，“GP Us中基于内核的能量优化”，硕士论文，宾夕法尼亚州立大学，2015年12月。A。Jadidi，“GPU中基于内核的能源优化”，宾夕法尼亚州立大学硕士论文，2015年12月。}，{“key”：“e_1_3_2_1_18_1”，“first page”：1，“author”：“Vijaykumar N.”，年：“2016”，“unstructured”：“N.Vijaykomar，K.Hsieh，G.Pekhimenko，s.Khan，A.Shrestha，s.Ghose，A.Jog，P.B.Gibbons，and O。Mutlu，“Zorua:GPU中资源虚拟化的整体方法”，《微体系结构国际研讨会论文集》，第1-14页，2016年10月。N.Vijaykumar、K.Hsieh、G.Pekhimenko、S.Khan、A.Shrestha、S.Ghose、A.Jog、P.B.Gibbons和O.Mutlu，“Zorua:GPU中资源虚拟化的整体方法”，《微体系结构国际研讨会论文集》，第1-14页，2016年10月\“Zorua:GPU中资源虚拟化的整体方法，\”载于《微体系结构国际研讨会论文集》，}，{“key”：“e_1_3_2_1_19_1”，“doi由”：“publisher”断言，“doi”：“10.1145\/283072.283070784”}，{“key”：“e_1_3_2_20_1”，doi由”：“publisher”断言，“doi”：“10.1109\/HPCA.2012.6168947”}，{“key”：“e_1_3_2_1_21_1”，“doi-asserted-by“：”publisher“，”doi“：”10.1145\/2694344.2694346“}，{“key”：“e_1_3_2_1_22_1”，“unstructured”：“Nvidia\”Nvidia TESLA P100 GPU ACCELERATOR.\“https:\/\/images.Nvidia.com\/content\/TESLA\/pdf\/Nvidia-TESLA-P100-PCIe-datasheet.pdf 2016。Nvidia“Nvidia TESLA P100 GPU加速器。”https:\/\/images.Nvidia.com/content\/TESLA\/pdf\/Nvidia-TESLA-P100-PCIe-datasheet.pdf 2016.“}，{”key“：”e_1_3_2_1_23_1“，”first page“：“163”，”volume-title“：”使用详细的GPU模拟器分析CUDA工作负载，“在系统和软件性能分析国际研讨会（ISPASS）上”，“作者”：“Bakhoda a.”，“年份”：“2009年”，“非结构化”：“a.Bakhoda，G.L.Yuan，W.W.L.Fung，H.Wong，和T.M.Aamodt，“使用详细的GPS模拟器分析CUDA-工作负载，\“在2009年4月举行的系统和软件性能分析国际研讨会（ISPASS）上，第163-174页。A.Bakhoda、G.L.Yuan、W.W.L.Fung、H.Wong和T.M.Aamodt，”使用详细的GPU模拟器分析CUDA工作负载，\“《系统和软件性能分析国际研讨会（ISPASS）论文集》，第163-174页，2009年4月。”}，{“key”：“e_1_3_2_1_24_1”，“doi-asserted-by”：“publisher”，”doi“：”10.1145“/248592.2485964”}“，{”key“：”e_1_a_2_1_25_1“，”unstructured“：”NVIDIA CUDA SDK代码示例“https:\\/developer.NVIDIA.com/CUDA-downloads。”NVIDIA CUDA SDK代码示例\“https:\/\/developer.nvidia.com/cuda-downloads.”}，{“key”：“e_1_3_2_1_26_1”，“volume-title”：“March”，“author”：“Stratton J.A.”，“year”：“2012”，“unstructured”：“J.A.Stratton，C.Rodrigues，I.-J.Sung，N.Obeid，L.-W.Chang，N.Anssari，G.D.Liu，and W.W.Hwu，\”Parbuil:科学和商业吞吐量计算的修订基准套件，“技术代表，2012年3月。J.A.Stratton，C.Rodrigues，I.-J.Sung，N.Obeid，L.-W.Chang，N.Anssari，G.D.Liu，和W.m.W.Hwu，“Parbuil:A Revised Benchmark Suite for Scientific and Commercial Throughput Computing，”技术代表，2012.3月。“}，{”关键“：“e_1_3_2_1_27_1”，“doi-asserted-by”：“publisher”，”doi“：”10.1109\/IISWC.2009.5306797“}，{“key”：“e_ 1_3_2 _1_28_1”、“first page”：”1“，”author“：”Grauer-Gray S.“，”year“：”2012“，”unstructured“：”S.Grauer-Ray，L.Xu，R.Searles，S.Ayalomayajula，and J.Cavazos，“Autotuning a High-Level Language Targeted to GPU Codes”，《创新并行计算学报》（InPar），第1-10页，2012年5月，“journal-title”：“自动调整针对GPU代码的高级语言，”《创新并行计算学报》（InPar）“}，{”key“：”e_1_3_2_1_29_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1145\/1454115.1454152”}，“key”：“e_1_a_2_1_30_1”，“doi-assert-by”：“publisher”，”doi“：”10.1109\/MM.2008.44“}1_1“，”首页“：”144“，“volume-title”：“海报：通过缓解内存管道暂停来加速GPU并发内核执行”，《并行体系结构与编译国际会议（PACT）论文集》，“作者”：“戴赫”，“年份”：“2017年”，“非结构化”：“戴赫，Z.Lin，C.Li，C.Zhao，F.Wang，N.Zheng，and H.Zhou，“海报：通过缓解内存管道暂停来加速GPU并发内核执行”，《并行架构与编译国际会议（PACT）论文集》，第144-145页，2017年9月。H.Dai，Z.Lin，C.Li，C.Zhao，F.Wang，N.Zheng，和H.Zhou，“海报：通过缓解内存管道暂停来加速GPU并发内核执行”，《并行架构与编译国际会议论文集》，第144-145页，2017年9月。“}，{”关键“：“e_1_3_2_1_32_1”，“卷-标题”：“三月”，“作者”：“Dai H.“，“年份”：“2018年”，“非结构化”：“H.Dai、Z.Lin、C.Li、C.Zhao、F.Wang、N.Zheng和H.Zhou，“通过缓解内存管道暂停加速GPU并发内核执行”，《高性能计算机体系结构国际研讨会论文集》，2018年3月。H.Dai，Z.Lin，C.Li，C.Zhao，F.Wang，N.Zheng，and H.Zhou，“通过缓解内存管道暂停来加速GPU并发内核执行”，《高性能计算机体系结构国际研讨会论文集》，2018年3月。“}，{”key“：”e_1_3_2_1_33_1“，”first page“：“440”，”volume-title“：”公平份额：为绩效和公平分配GPU资源，《国际计算机设计会议论文集》，“作者”：“Aguilera P.”，“年份”：“2014年”，“非结构化”：“P.Aguilela、K.Morrow和N.S.Kim”，“公平份额：为了绩效和公平的GPU资源分配，\“《国际计算机设计会议（ICCD）论文集》，第440-447页，2014年10月。P.Aguilera、K.Morrow和N.S.Kim，“公平份额：GPU资源在性能和公平方面的分配”，《计算机设计国际会议论文集》（ICCD：“e_1_3_2_1_34_1”，“首页”：“1”，“卷标”：“欧洲会议展览自动化测试（DATE）”，“作者”：“李X”，“年份”：“2016年”，“非结构化”：“X.Li和Y.Liang，“GPU上的高效内核管理”，载于《欧洲会议展览设计、自动化测试论文集》，第115:1-115:24页，2016年3月。Li和Y.Liang，“GPU的高效内核管理”，《欧洲会议展览设计、自动化测试会议记录》（DATE），第115:1-115:24页，2016年3月SIGARCH ACM计算机体系结构特别兴趣小组“]}，“container-title”：[“2018年超级计算国际会议论文集”]，“原始标题”：[]，“链接”：[{“URL”：“https:\/\/dl.ACM.org\/doi\/pdf\/10.1145\/320589.3205311”，“内容类型”：“未指定”，“content-version”：“vor”，“intended-application”：“相似性检查”}]，“存放“：{“date-parts”：[[2023,10]]，“date-time”：“2023-01-10T16:19:29Z”，“timestamp”：1673367569000}，“score”：1，“resource”：{”primary“：{“URL”：“https:\/\/dl.acm.org\/doi\/10.1145\/320589.3205311”}}，”subtitle“：[]，”shorttitle“：[]，”issued“{”date-part“：[2018,6,12]]}”，“references-”count“：34，”alternative-id“：[”10.1145\/3205289.3205311“，”10.1145\/3205289“]，”URL“：”http://\/dx.doi.org\/10.1145\/320589.3205311“，”关系“：{}，”主题“：[]，”发布“：{”日期部分“：[[2018,6,12]]}，“断言”：[{”值“：”2018-06-12“，”顺序“：2，”名称“：”发布“，”标签“：”已发布“，“组”：{“名称”：“publication_history”，“标签”：“发布历史”}}]}}