{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{-“日期-部分”：[[2024,9,8]]，“日期-时间”：“2024-09-08T03:30:19Z”，“时间戳”：1725766219778}，“出版商位置”：“美国纽约州纽约市”，“参考-计数”：45，“出版者”：“ACM”，“资助者”：[{“名称”：“香港RGC”，“奖项”：[“HKBU”12200418“]}]，”内容域“：{”域“用法：[“dl.acm.org”]，“crossmark-restriction”：true}，“short-container-title”：[]，“published-print”：{“date-parts”：[[2020,2,23]]}，”DOI“：”10.1145\/3366428.3380767“，”type“：”procesedings-article“，”created“：{”date-part“：[2020,2,19]]，”date-time“：”2020-02-19T22:50:35Z“，”timestamp“：1582152635000}”，“page”：“31-40“，”更新政策“：“http://\/dx.doi.org\/10.1145\/crossmark-policy”，“source”：“Crossref”，“is-referenced-by-count”：2，“title”：[“GPGPU使用交叉基准进行频率缩放的性能估计”]，“prefix”：“10.1145”，《volume》：“29”，“author”：[{“give”：“Qiang”，“family”：“Wang”，“sequence”：“first”，“affiliation”：[}“name”：“Hong Kong Baptist University”}]}，{“given”：“Chengjian”，“family”：“Liu”，“sequence”：“additional”，“affiliation”：[{“name”：“Shenzhen Technology University”}]}，{“given”：“Xiaowen”，“家族”：“Chu”，”sequence“：”additional“，“afliation”:[{”name“：”Hong Kong Baptist University“}]]，“member”：“320”，“published on”：{“date-parts”：[[2020,2,23]]}、“reference”：[}”key“e_1_3_2_1_1_1_1”，“doi-asserted-by”：“publisher”，“DOI”：“10.1109\/IPDPS.2014.23”}，{“key”：“e_1_3_2_1_2”，“DOI-asserted-by”：“publicher”，“DI:”10.1109\/LCA.2019.2904497“}”，{”key“：”e_1_ 3_2_1_3_1“，”DOI-assert-by“：”publisher le-title“：“G-CRS:GPU加速Cauchy-Reed-Solomon编码”，“卷”：“29”，“作者”：“Liu X.Chu C.”，“年份”：“2018年”，“非结构化”：“X.Chu.C.Liu，Q.Wang和Y.W.Leung.2018.G-CRS:GPU加速Cauchy Reed-Solomon编码。IEEE TPDS 29，7（2018），1484--1498.X.Chua C.Liu、Q.Wang和Y.W.Leung。2018。G-CRS:GPU加速Cauchy Reed-Solomon编码。IEEE TPDS 29，7（2018），1484--1498.“，“新闻标题”：“IEEE TPDS.”}，{“键”：“e_1_3_2_1_5_1”，“doi-asserted-by”：“交叉引用”，“非结构化”：“文森特·周小文·楚海柳和Yiu-Wing Leung.2017。基于DVFS的CPU-GPU异构系统节能作业调度。ACM e-Energy’17。文森特·周晓文（Vincent Chau Xiaowen Chu Hai Liu）和刘耀荣（Yiu-Wing Leung）。2017.CPU-GPU异构系统使用DVFS的能效作业调度。在ACM e-Energy’17.”中，“DOI”：“10.1145\/3077839.3077855”}，{“volume-title”：“IEEE国际研讨会，44-54”，“年份”：“2009”，“作者”：“车帅”，“密钥”：“e_1_3_2_1_6_1”，“非结构化”：“Shuai Che、Michael Boyer、Meng Jiayuan、David Tarjan、Jeremy W Sheaffer、Sang Ha Lee和Kevin Skadron。2009 . Rodinia：异构计算的基准套件。2009年工作负荷特性（IISWC）。IEEE国际研讨会，IEEE，44-54。Shuai Che、Michael Boyer、Jiayuan Meng、David Tarjan、Jeremy W Sheaffer、Sang-Ha Lee和Kevin Skadron。2009年，Rodinia:异构计算的基准套件。2009年工作负荷特性（IISWC）。IEEE国际研讨会，44-54.“}，{”key“：”e_1_3_2_1_7_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1145\/29339672.2939785”}，“key”：“e_1_ 3_2_1 _8_1”，“unstructured”：“Chu Kaiyong Zhao and Mea Wang.2009。GPU上的实用随机线性网络编码。2009年，IFIP联网。朱凯勇赵晓文和王美美。2009。GPU上的实用随机线性网络编码。2009年，IFIP联网。}，{“volume-title”：“第三十届机器学习国际会议论文集.1337--1345”，“年份”：“2013年”，“作者”：“Coates Adam”，“key”：“e_1_3_2_1_9_1”，“非结构化”：“Adam Coates、Brody Huval、Tao Wang、David Wu、Bryan Catanzaro和Ng Andrew。2013 . 深入学习COTS HPC系统。第30届机器学习国际会议论文集。1337--1345 . Adam Coates、Brody Huval、Tao Wang、David Wu、Bryan Catanzaro和Ng Andrew。2013年，深入学习COTS HPC系统。第30届机器学习国际会议论文集。1337--1345.“}，{”key“：”e_1_3_2_1_10_1“，”first page“：“1800”，”article-title“：”带缓存GPU的性能模型“，”volume“：‘26’，”author“：”Dao Thanh Tuan“，”year“：”2015“，”unstructured“：”Thanh Tuan Dao，Jungwon Kim，Sangmin Seo，Bernhard Egger，and Jaejin Lee.2015.带缓存GPUs的性能模型。IEEE TPDS 26，7（2015）, 1800 -- 1813 . Thanh Tuan Dao、Jungwon Kim、Sangmin Seo、Bernhard Egger和Jaejin Lee。2015.带缓存的GPU性能模型。IEEE TPDS 26，7（2015），1800--1813.“，”journal-title“：”IEEE TPDS}，{“volume-title”：“Ng”，“year”：“2012”，“author”：“Dean Jeffrey”，“key”：“e_1_3_2_11_1”，“unstructured”：“Jeffrey Dean、Greg Corrado、Rajat Monga、Kai Chen、Matthieu Devin、Mark Mao、Andrew Senior、Paul Tucker、Ke Yang、Quoc V Le和Andrew Y。Ng.（女）。2012 . 大规模分布式深网络。神经信息处理系统进展。1223--1231. Jeffrey Dean、Greg Corrado、Rajat Monga、Kai Chen、Matthieu Devin、Mark Mao、Andrew Senior、Paul Tucker、Ke Yang、Quoc V Le和Andrew Y.Ng，2012年。大规模分布式深网络。神经信息处理系统进展。1223--1231.“}，{”key“：”e_1_3_2_12_1“，”doi-asserted-by“：”publisher“，”doi“：”10.1145 \/3337821.3337833“}”，{“key”：“e_1_ 3_2_13_1”，“doi-assert-by”：“crossref”，”unstructured“：”J.Guerreiro A.Ilic N.Roma和P.Tomas.2018。用于多域电压频率缩放的GPGPU功率建模。2018年IEEE HPCA。789--800. J.Guerreiro A.Ilic N.Roma和P.Tomas。2018.用于多域电压频率缩放的GPGPU功率建模。2018年IEEE HPCA。789--800.“，”DOI“：”10.1109\/HPCA.2018.0072“}，{”key“：”e_1_3_2_14_1“，”DOI-asserted-by“：”publisher“，“DOI”：“10.1016\/j.parco.2018.2.001”}，“key”：“e_1_ 3_2_1_15_1”，“DOI-assert-by”：“publisher”，”DOI:“10.1145\/1555754.1555775”}、{”key“：“e_ 1_3_2 _16_1”、“DOI-aserted-by”serted-by“：”crossref“，”unstructured“：”Y.Huang B.Guo和Y.Shen.2019。基于全局神经网络方法的GPU能耗优化。IEEE Access 7（2019）。Y.Huang B.Guo和Y.Shen。2019.使用基于全局的神经网络方法优化GPU能耗。IEEE Access 7（2019）。“，”DOI“：”10.1109\/ACCESS.20192915380“｝，｛”volume title“：”通过微基准剖析NVIDIA Volta GPU架构。arXiv预印本arXiv:1804.06826“，”year“：”2018“，”author“：”Jia Zhe“，”key“：”e_1_3_2_1_17_1“，”nonstructured“：”Zhe Jia，Marco Maggioni，Benjamin Staiger，and Daniele P Scarpazza。2018。通过微基准测试剖析NVIDIA Volta GPU架构。arXiv预印arXiv:1804.06826（2018）。哲佳、马可·马吉奥尼、本杰明·斯泰格和丹尼尔·斯卡帕扎。2018年，通过微基准测试剖析NVIDIA Volta GPU架构。arXiv预印arXiv:1804.06826（2018）。“}，{”key“：”e_1_3_2_18_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/CGO.2015.7054182”}，“key”：“e_1_ 3_2_19_1”，“doi-assert-by”：“publisher”，”doi“：”10.1109\/CPSNA.2015.23作者“：”Lee Jungseob“，”key“：”e_1_3_2_1_20_1“，“unstructured”：“Lee Jung seob，Vijay Sathisha，Michael Schulte，Katherine Compton，and Nam Sung Kim.2011。使用动态电压/频率和核心缩放提高功率受限GPU的吞吐量。2011年PACT国际会议。111--120 . Jungseob Lee、Vijay Sathisha、Michael Schulte、Katherine Compton和Nam Sung Kim.2011。使用动态电压/频率和核心缩放提高功率受限GPU的吞吐量。2011年PACT国际会议。111-120.“}，{”key“：”e_1_3_2_1_21_1“，”doi-asserted-by“：”crossref“，”unstructured“：”You Li Kaiyong Zhao Xiaown Chu and Jiming Liu.2010。GPU加速k-means算法。2010年IEEE CIT.115-122。You Li Kaiyong Zhao Xiaowen Chu和Jiming Liu。2010年，GPU加速k-means算法。2010年IEEE CIT.115-122.“，”DOI“：”10.1109\/CIT.2010.60“}，”{“key”：”e_1_3_2_1_22_1“，”DOI-asserted-by“：”publisher“，”DOI“：“10.1093\/生物信息学\/bts061”}，“{”key“：”e_ 1_3_2 _1_23_1“，“unstructured”：”Xiaohan Ma Mian Dong Lin Zhong and Zhigang Deng.2009。基于GPU的计算的统计功耗分析和建模。2009年ACM Hot-Power。小汉马棉董林忠和邓志刚。2009年。基于GPU的计算的统计功耗分析和建模。在ACM Hot-Power'09.“}中，{“key”：“e_1_3_2_1_24_1”，“doi-asserted-by”：“publisher”，”doi“：”10.1109\/HOTCHIPS.2015.747461“}，{”key“：”e_1_a_2_1_25_1“，”first page“：“1”，”article-title“：”Dissecting GPU Memory Hierarchy Through Microbenchmarking“，”volume“28”，“author”：“Mei Xinxin”，“year”：“2017”，“unstructured”：“梅欣欣和朱晓文。2017 . 通过微基准测试剖析GPU内存层次结构。IEEE TPDS 28，1（2017年1月），72--86。梅欣欣和朱晓文。2017.通过微基准测试剖析GPU内存层次。IEEE TPDS 28，1（2017年1月），72-86.“，”journal-title“：”IEEE TPDS}“，{”key“：”e_1_3_2_1_26_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/INFOCOM.2017.8057205”}，{“key”：“e_1_a_2_1_27_1”，“doi-assert-by”：“publisher”，”doi“：”10.1016\/j.dcan.2016.1001“}，”{“volume-title”：“网络与并行计算”，“作者”：“梅心欣”，“key”：“e_1_3_2_1_28_1”，“非结构化”：“梅欣欣、赵开勇、刘成建和朱晓文。2014.对现代GPU的内存层次进行基准测试。网络与并行计算。斯普林格，144-156。梅欣欣、赵开勇、刘成建和朱晓文。2014.对现代GPU的内存层次进行基准测试。在网络和并行计算中。Springer，144-156.“}，{”key“：”e_1_3_2_1_29_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/GREENCOMP.2010.5598315”}，“key”：“e_1_ 3_2_1_30_1”，“doi-assert-by”：“publisher”，”doi“：”10.1145\/2830772.2830826“}”，{。CUDA C编程指南。[在线]http://\/docs.nvidia.com//cuda\/cuda-c-programming-guide//index.html。英伟达。2018年CUDA C编程指南。[在线]http://\/docs.nvidia.com//cuda\/cuda-c-programming-guide//index.html。“}，{”key“：”e_1_3_2_1_32_1“，”unstructured“：”NVIDIA.2018。GPU计算SDK。[在线]https:\/\/developer.nvidia.com//gpu-computing-sdk。英伟达。2018.GPU计算SDK。[在线]https:\/\/developer.nvidia.com//gpu-computing-sdk。“}，{”key“：”e_1_3_2_1_33_1“，”unstructured“：”NVIDIA.2018。NVIDIA管理库。[在线]https:\/\/developer.nvidia.com/nvidia-management-library-nvml。英伟达。NVIDIA管理图书馆。[在线]https:\/\/developer.nvidia.com/nvidia-management-library-nvml。“}，{”key“：”e_1_3_2_1_34_1“，”unstructured“：”NVIDIA.2018。NVIDIA档案器。[在线]http://\/docs.nvidia.com//cuda\/profiler-users-guide。英伟达。2018年，NVIDIA Profiler。[在线]http://\/docs.nvidia.com//cuda\/profiler-users-guide。“}，{”key“：”e_1_3_2_1_35_1“，”unstructured“：”S.Shi Q.Wang和X.Chu.2018。GPU上分布式深度学习框架的性能建模与评估。2018年IEEE DataCom。949--957. S.Shi Q.Wang和X.Chu。2018.GPU上分布式深度学习框架的性能建模和评估。2018年IEEE DataCom。949--957.“}，{”volume-title“：“标杆先进的深度学习软件工具。2016年第七届国际云计算与大数据会议（CCBD）。99-104”，“作者”：“石S.”，“密钥”：“e_1_3_2_1_36_1”，”非结构化“：”石S.，王Q.，徐P.，X。楚。2016 . 标杆管理先进的深度学习软件工具。2016年第七届云计算与大数据国际会议（CCBD）。99--104 . 石松生、王琦、徐鹏和朱棣文。2016年，对标最先进的深度学习软件工具。2016年第七届云计算与大数据国际会议（CCBD）。99-104.“}，{”key“：”e_1_3_2_1_37_1“，”doi-asserted-by“：”crossref“，“unstructured”：“宋淳义苏巴里·朗特里（Shuaiwen Song Chunyi Su Barry Rountree）和柯克·卡梅隆（Kirk W Cameron），2013。一个简化且准确的应急gpu架构功率性能效率模型。2013年IEEE IPDPS。673--686. 宋春怡（Shuaiwen Song Chunyi Su Barry Rountree）和柯克·卡梅隆（Kirk W Cameron）。2013年。一个简化且准确的应急gpu架构功率性能效率模型。2013年IEEE IPDPS。673--686.“，“DOI”：“10.1109\/IPDPS.2013.73”}，{“key”：“e_1_3_2_1_38_1”，“unstructured”：“埃里希·斯特罗梅尔·杰克·东加拉·霍斯特·西蒙·马丁·缪尔和汉斯·缪尔，2018。TOP500。[在线]https:\/\/www.TOP500.org\/lists\/2019\/11\/。埃里希·斯特罗迈尔·杰克·多格拉·霍斯特·西蒙·马丁·缪尔和汉斯·缪尔。2018年，TOP500。[在线]https:\/\/www.top500.org\/lists\/2019\/11\/。“}，{”volume-title“：”ACM e-Energy’19.“，”author“：”唐振恒“，”key“：”e_1_3_2_1_39_1“，“unstructured”：“唐振恒，王玉新，王强，朱晓文。2019。GPU DVFS对深度学习能量和绩效的影响：一项实证研究。在ACM e-Energy’19中。美国亚利桑那州凤凰城，315-325。唐振恒、王玉欣、王强和朱晓文。2019.GPU DVFS对深度学习能量和绩效的影响：一项实证研究。在ACM e-Energy’19中。美国亚利桑那州凤凰城，315--325。“}，{”key“：”e_1_3_2_1_40_1“，”doi-asserted-by“：”crossref“，“unstructured”：“王强和朱晓文，2018。基于内核和内存频率缩放的GPGPU性能评估。2018年IEEE ICPADS。王强和朱晓文。2018.GPGPU性能评估（带核心和内存频率缩放）。2018年IEEE ICPADS。“，”DOI“：”10.1109\/PADSW.2018.8645000“}，{”key“：”e_1_3_2_1_41_1“，”DOI-asserted-by“：”crossref“，“unstructured”：“X.Wang K.Huang A.Knoll和X.Qian.2019。通过源级分析和基于跟踪的仿真快速准确地估计GPU性能的混合框架。2019年IEEE HPCA。506--518. X.Wang K.Huang A.Knoll和X.Qian。2019.通过源级分析和基于跟踪的仿真快速准确地估计GPU性能的混合框架。2019年IEEE HPCA。506--518.“，“DOI”：“10.1109\/HPCA.2019.0062”}，{“key”：“e_1_3_2_1_42_1”，“unstructured”：“Yuxin Wang Qiang Wang Shaohui Shi Xin He Zhenheng Tang Kaiyong Zhao and Xiaowen Chu.2019。为AI训练对AI加速器的性能和功率进行基准测试。arX输入：cs。DC\/1909.06842 Yuxin Wang Qiang Wang Shaohuai Shi Xin He Zhenheng Tang Kaiyong Zhao和Xiaowen Chu。2019.对人工智能训练用人工智能加速器的性能和功率进行基准测试。arX输入：cs。DC\/1909.06842“｝，｛“key”：“e_1_3_2_1_43_1”，“doi由”断言：“publisher”，“doi”：“10.1109\/IISPASS.2010.5452013”｝，｛“volume title”：“使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA”，“author”：“Wu Gene”，“key”：“e_1_3_2_1_44_1”，“nonstructured”：“Gene Wu、Joseph L Greathouse、Alexander Lyashevsky、Nuwan Jayasena和Derek Chiou。2015.使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA。IEEE，564--576。Gene Wu、Joseph L Greathouse、Alexander Lyashevsky、Nuwan Jayasena和Derek Chiou。2015.使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA。IEEE，564--576.“}，{”key“：”e_1_3_2_1_45_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1093\/生物信息学\/btu047”}]，“event”：{”name“：”PPoPP'20:第25届ACM SIGPLAN并行编程原理与实践研讨会“，”赞助商“：[”SIGPLAN ACM编程语言特别兴趣小组“，”SIGHPC ACM高性能计算特别兴趣小组，高性能计算特殊兴趣小组“]，“location”：“San Diego California”，“缩写词”：“PPoPP'20”}，“container-title”：[“使用图形处理单元的通用处理第十三届年会会议记录”]，“original-title“：[]，“link”：[{“URL”：“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3366428.3380767“，”content-type“：”unspecified“，”content-version“：”vor“，”intended-application“：”similarity-checking“}]，”deposed“：{”date-parts“：[[2023,10]]，”date-time“：“2023-01-10T09:03:59Z”，”timestamp“：1673341439000}，”score“：1，”resource“：”{“primary”：{“URL”：“https:\/\/dl.acm.org\/doi\/10.1145\/3366428.3380767“}}，”副标题“：[]，”短标题“：[]，”已发布“：{”日期部分“：[[2020,2,23]]}，“引用计数”：45，“alternative-id”：[“10.1145\/33666428.3380767”，“10.1145\/3366428”]，“URL”：“http://\/dx.doi.org\/10.1145\/366428.3380767”，“”关系“：{}，”主题“：[]，”发布“：{”日期部分“：[[2020,2,23]]}，“断言”：[{”value“：”2020-02-23“，”order“：2，”name“：”published“，”label“：”published“，”group“：{”name“:”publication_history“，”标签“：”publication history“}}]}}