{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,9,8]],“日期-时间”:“2024-09-08T03:30:19Z”,“时间戳”:1725766219778},“出版商位置”:“美国纽约州纽约市”,“参考-计数”:45,“出版者”:“ACM”,“资助者”:[{“名称”:“香港RGC”,“奖项”:[“HKBU”12200418“]}],”内容域“:{”域“用法:[“dl.acm.org”],“crossmark-restriction”:true},“short-container-title”:[],“published-print”:{“date-parts”:[[2020,2,23]]},”DOI“:”10.1145\/3366428.3380767“,”type“:”procesedings-article“,”created“:{”date-part“:[2020,2,19]],”date-time“:”2020-02-19T22:50:35Z“,”timestamp“:1582152635000}”,“page”:“31-40“,”更新政策“:“http://\/dx.doi.org\/10.1145\/crossmark-policy”,“source”:“Crossref”,“is-referenced-by-count”:2,“title”:[“GPGPU使用交叉基准进行频率缩放的性能估计”],“prefix”:“10.1145”,《volume》:“29”,“author”:[{“give”:“Qiang”,“family”:“Wang”,“sequence”:“first”,“affiliation”:[}“name”:“Hong Kong Baptist University”}]},{“given”:“Chengjian”,“family”:“Liu”,“sequence”:“additional”,“affiliation”:[{“name”:“Shenzhen Technology University”}]},{“given”:“Xiaowen”,“家族”:“Chu”,”sequence“:”additional“,“afliation”:[{”name“:”Hong Kong Baptist University“}]],“member”:“320”,“published on”:{“date-parts”:[[2020,2,23]]}、“reference”:[}”key“e_1_3_2_1_1_1_1”,“doi-asserted-by”:“publisher”,“DOI”:“10.1109\/IPDPS.2014.23”},{“key”:“e_1_3_2_1_2”,“DOI-asserted-by”:“publicher”,“DI:”10.1109\/LCA.2019.2904497“}”,{”key“:”e_1_ 3_2_1_3_1“,”DOI-assert-by“:”publisher le-title“:“G-CRS:GPU加速Cauchy-Reed-Solomon编码”,“卷”:“29”,“作者”:“Liu X.Chu C.”,“年份”:“2018年”,“非结构化”:“X.Chu.C.Liu,Q.Wang和Y.W.Leung.2018.G-CRS:GPU加速Cauchy Reed-Solomon编码。IEEE TPDS 29,7(2018),1484--1498.X.Chua C.Liu、Q.Wang和Y.W.Leung。2018。G-CRS:GPU加速Cauchy Reed-Solomon编码。IEEE TPDS 29,7(2018),1484--1498.“,“新闻标题”:“IEEE TPDS.”},{“键”:“e_1_3_2_1_5_1”,“doi-asserted-by”:“交叉引用”,“非结构化”:“文森特·周小文·楚海柳和Yiu-Wing Leung.2017。基于DVFS的CPU-GPU异构系统节能作业调度。ACM e-Energy’17。文森特·周晓文(Vincent Chau Xiaowen Chu Hai Liu)和刘耀荣(Yiu-Wing Leung)。2017.CPU-GPU异构系统使用DVFS的能效作业调度。在ACM e-Energy’17.”中,“DOI”:“10.1145\/3077839.3077855”},{“volume-title”:“IEEE国际研讨会,44-54”,“年份”:“2009”,“作者”:“车帅”,“密钥”:“e_1_3_2_1_6_1”,“非结构化”:“Shuai Che、Michael Boyer、Meng Jiayuan、David Tarjan、Jeremy W Sheaffer、Sang Ha Lee和Kevin Skadron。2009 . Rodinia:异构计算的基准套件。2009年工作负荷特性(IISWC)。IEEE国际研讨会,IEEE,44-54。Shuai Che、Michael Boyer、Jiayuan Meng、David Tarjan、Jeremy W Sheaffer、Sang-Ha Lee和Kevin Skadron。2009年,Rodinia:异构计算的基准套件。2009年工作负荷特性(IISWC)。IEEE国际研讨会,44-54.“},{”key“:”e_1_3_2_1_7_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/29339672.2939785”},“key”:“e_1_ 3_2_1 _8_1”,“unstructured”:“Chu Kaiyong Zhao and Mea Wang.2009。GPU上的实用随机线性网络编码。2009年,IFIP联网。朱凯勇赵晓文和王美美。2009。GPU上的实用随机线性网络编码。2009年,IFIP联网。},{“volume-title”:“第三十届机器学习国际会议论文集.1337--1345”,“年份”:“2013年”,“作者”:“Coates Adam”,“key”:“e_1_3_2_1_9_1”,“非结构化”:“Adam Coates、Brody Huval、Tao Wang、David Wu、Bryan Catanzaro和Ng Andrew。2013 . 深入学习COTS HPC系统。第30届机器学习国际会议论文集。1337--1345 . Adam Coates、Brody Huval、Tao Wang、David Wu、Bryan Catanzaro和Ng Andrew。2013年,深入学习COTS HPC系统。第30届机器学习国际会议论文集。1337--1345.“},{”key“:”e_1_3_2_1_10_1“,”first page“:“1800”,”article-title“:”带缓存GPU的性能模型“,”volume“:‘26’,”author“:”Dao Thanh Tuan“,”year“:”2015“,”unstructured“:”Thanh Tuan Dao,Jungwon Kim,Sangmin Seo,Bernhard Egger,and Jaejin Lee.2015.带缓存GPUs的性能模型。IEEE TPDS 26,7(2015), 1800 -- 1813 . Thanh Tuan Dao、Jungwon Kim、Sangmin Seo、Bernhard Egger和Jaejin Lee。2015.带缓存的GPU性能模型。IEEE TPDS 26,7(2015),1800--1813.“,”journal-title“:”IEEE TPDS},{“volume-title”:“Ng”,“year”:“2012”,“author”:“Dean Jeffrey”,“key”:“e_1_3_2_11_1”,“unstructured”:“Jeffrey Dean、Greg Corrado、Rajat Monga、Kai Chen、Matthieu Devin、Mark Mao、Andrew Senior、Paul Tucker、Ke Yang、Quoc V Le和Andrew Y。Ng.(女)。2012 . 大规模分布式深网络。神经信息处理系统进展。1223--1231. Jeffrey Dean、Greg Corrado、Rajat Monga、Kai Chen、Matthieu Devin、Mark Mao、Andrew Senior、Paul Tucker、Ke Yang、Quoc V Le和Andrew Y.Ng,2012年。大规模分布式深网络。神经信息处理系统进展。1223--1231.“},{”key“:”e_1_3_2_12_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1145 \/3337821.3337833“}”,{“key”:“e_1_ 3_2_13_1”,“doi-assert-by”:“crossref”,”unstructured“:”J.Guerreiro A.Ilic N.Roma和P.Tomas.2018。用于多域电压频率缩放的GPGPU功率建模。2018年IEEE HPCA。789--800. J.Guerreiro A.Ilic N.Roma和P.Tomas。2018.用于多域电压频率缩放的GPGPU功率建模。2018年IEEE HPCA。789--800.“,”DOI“:”10.1109\/HPCA.2018.0072“},{”key“:”e_1_3_2_14_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1016\/j.parco.2018.2.001”},“key”:“e_1_ 3_2_1_15_1”,“DOI-assert-by”:“publisher”,”DOI:“10.1145\/1555754.1555775”}、{”key“:“e_ 1_3_2 _16_1”、“DOI-aserted-by”serted-by“:”crossref“,”unstructured“:”Y.Huang B.Guo和Y.Shen.2019。基于全局神经网络方法的GPU能耗优化。IEEE Access 7(2019)。Y.Huang B.Guo和Y.Shen。2019.使用基于全局的神经网络方法优化GPU能耗。IEEE Access 7(2019)。“,”DOI“:”10.1109\/ACCESS.20192915380“},{”volume title“:”通过微基准剖析NVIDIA Volta GPU架构。arXiv预印本arXiv:1804.06826“,”year“:”2018“,”author“:”Jia Zhe“,”key“:”e_1_3_2_1_17_1“,”nonstructured“:”Zhe Jia,Marco Maggioni,Benjamin Staiger,and Daniele P Scarpazza。2018。通过微基准测试剖析NVIDIA Volta GPU架构。arXiv预印arXiv:1804.06826(2018)。哲佳、马可·马吉奥尼、本杰明·斯泰格和丹尼尔·斯卡帕扎。2018年,通过微基准测试剖析NVIDIA Volta GPU架构。arXiv预印arXiv:1804.06826(2018)。“},{”key“:”e_1_3_2_18_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/CGO.2015.7054182”},“key”:“e_1_ 3_2_19_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/CPSNA.2015.23作者“:”Lee Jungseob“,”key“:”e_1_3_2_1_20_1“,“unstructured”:“Lee Jung seob,Vijay Sathisha,Michael Schulte,Katherine Compton,and Nam Sung Kim.2011。使用动态电压/频率和核心缩放提高功率受限GPU的吞吐量。2011年PACT国际会议。111--120 . Jungseob Lee、Vijay Sathisha、Michael Schulte、Katherine Compton和Nam Sung Kim.2011。使用动态电压/频率和核心缩放提高功率受限GPU的吞吐量。2011年PACT国际会议。111-120.“},{”key“:”e_1_3_2_1_21_1“,”doi-asserted-by“:”crossref“,”unstructured“:”You Li Kaiyong Zhao Xiaown Chu and Jiming Liu.2010。GPU加速k-means算法。2010年IEEE CIT.115-122。You Li Kaiyong Zhao Xiaowen Chu和Jiming Liu。2010年,GPU加速k-means算法。2010年IEEE CIT.115-122.“,”DOI“:”10.1109\/CIT.2010.60“},”{“key”:”e_1_3_2_1_22_1“,”DOI-asserted-by“:”publisher“,”DOI“:“10.1093\/生物信息学\/bts061”},“{”key“:”e_ 1_3_2 _1_23_1“,“unstructured”:”Xiaohan Ma Mian Dong Lin Zhong and Zhigang Deng.2009。基于GPU的计算的统计功耗分析和建模。2009年ACM Hot-Power。小汉马棉董林忠和邓志刚。2009年。基于GPU的计算的统计功耗分析和建模。在ACM Hot-Power'09.“}中,{“key”:“e_1_3_2_1_24_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/HOTCHIPS.2015.747461“},{”key“:”e_1_a_2_1_25_1“,”first page“:“1”,”article-title“:”Dissecting GPU Memory Hierarchy Through Microbenchmarking“,”volume“28”,“author”:“Mei Xinxin”,“year”:“2017”,“unstructured”:“梅欣欣和朱晓文。2017 . 通过微基准测试剖析GPU内存层次结构。IEEE TPDS 28,1(2017年1月),72--86。梅欣欣和朱晓文。2017.通过微基准测试剖析GPU内存层次。IEEE TPDS 28,1(2017年1月),72-86.“,”journal-title“:”IEEE TPDS}“,{”key“:”e_1_3_2_1_26_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/INFOCOM.2017.8057205”},{“key”:“e_1_a_2_1_27_1”,“doi-assert-by”:“publisher”,”doi“:”10.1016\/j.dcan.2016.1001“},”{“volume-title”:“网络与并行计算”,“作者”:“梅心欣”,“key”:“e_1_3_2_1_28_1”,“非结构化”:“梅欣欣、赵开勇、刘成建和朱晓文。2014.对现代GPU的内存层次进行基准测试。网络与并行计算。斯普林格,144-156。梅欣欣、赵开勇、刘成建和朱晓文。2014.对现代GPU的内存层次进行基准测试。在网络和并行计算中。Springer,144-156.“},{”key“:”e_1_3_2_1_29_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/GREENCOMP.2010.5598315”},“key”:“e_1_ 3_2_1_30_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145\/2830772.2830826“}”,{。CUDA C编程指南。[在线]http://\/docs.nvidia.com//cuda\/cuda-c-programming-guide//index.html。英伟达。2018年CUDA C编程指南。[在线]http://\/docs.nvidia.com//cuda\/cuda-c-programming-guide//index.html。“},{”key“:”e_1_3_2_1_32_1“,”unstructured“:”NVIDIA.2018。GPU计算SDK。[在线]https:\/\/developer.nvidia.com//gpu-computing-sdk。英伟达。2018.GPU计算SDK。[在线]https:\/\/developer.nvidia.com//gpu-computing-sdk。“},{”key“:”e_1_3_2_1_33_1“,”unstructured“:”NVIDIA.2018。NVIDIA管理库。[在线]https:\/\/developer.nvidia.com/nvidia-management-library-nvml。英伟达。NVIDIA管理图书馆。[在线]https:\/\/developer.nvidia.com/nvidia-management-library-nvml。“},{”key“:”e_1_3_2_1_34_1“,”unstructured“:”NVIDIA.2018。NVIDIA档案器。[在线]http://\/docs.nvidia.com//cuda\/profiler-users-guide。英伟达。2018年,NVIDIA Profiler。[在线]http://\/docs.nvidia.com//cuda\/profiler-users-guide。“},{”key“:”e_1_3_2_1_35_1“,”unstructured“:”S.Shi Q.Wang和X.Chu.2018。GPU上分布式深度学习框架的性能建模与评估。2018年IEEE DataCom。949--957. S.Shi Q.Wang和X.Chu。2018.GPU上分布式深度学习框架的性能建模和评估。2018年IEEE DataCom。949--957.“},{”volume-title“:“标杆先进的深度学习软件工具。2016年第七届国际云计算与大数据会议(CCBD)。99-104”,“作者”:“石S.”,“密钥”:“e_1_3_2_1_36_1”,”非结构化“:”石S.,王Q.,徐P.,X。楚。2016 . 标杆管理先进的深度学习软件工具。2016年第七届云计算与大数据国际会议(CCBD)。99--104 . 石松生、王琦、徐鹏和朱棣文。2016年,对标最先进的深度学习软件工具。2016年第七届云计算与大数据国际会议(CCBD)。99-104.“},{”key“:”e_1_3_2_1_37_1“,”doi-asserted-by“:”crossref“,“unstructured”:“宋淳义苏巴里·朗特里(Shuaiwen Song Chunyi Su Barry Rountree)和柯克·卡梅隆(Kirk W Cameron),2013。一个简化且准确的应急gpu架构功率性能效率模型。2013年IEEE IPDPS。673--686. 宋春怡(Shuaiwen Song Chunyi Su Barry Rountree)和柯克·卡梅隆(Kirk W Cameron)。2013年。一个简化且准确的应急gpu架构功率性能效率模型。2013年IEEE IPDPS。673--686.“,“DOI”:“10.1109\/IPDPS.2013.73”},{“key”:“e_1_3_2_1_38_1”,“unstructured”:“埃里希·斯特罗梅尔·杰克·东加拉·霍斯特·西蒙·马丁·缪尔和汉斯·缪尔,2018。TOP500。[在线]https:\/\/www.TOP500.org\/lists\/2019\/11\/。埃里希·斯特罗迈尔·杰克·多格拉·霍斯特·西蒙·马丁·缪尔和汉斯·缪尔。2018年,TOP500。[在线]https:\/\/www.top500.org\/lists\/2019\/11\/。“},{”volume-title“:”ACM e-Energy’19.“,”author“:”唐振恒“,”key“:”e_1_3_2_1_39_1“,“unstructured”:“唐振恒,王玉新,王强,朱晓文。2019。GPU DVFS对深度学习能量和绩效的影响:一项实证研究。在ACM e-Energy’19中。美国亚利桑那州凤凰城,315-325。唐振恒、王玉欣、王强和朱晓文。2019.GPU DVFS对深度学习能量和绩效的影响:一项实证研究。在ACM e-Energy’19中。美国亚利桑那州凤凰城,315--325。“},{”key“:”e_1_3_2_1_40_1“,”doi-asserted-by“:”crossref“,“unstructured”:“王强和朱晓文,2018。基于内核和内存频率缩放的GPGPU性能评估。2018年IEEE ICPADS。王强和朱晓文。2018.GPGPU性能评估(带核心和内存频率缩放)。2018年IEEE ICPADS。“,”DOI“:”10.1109\/PADSW.2018.8645000“},{”key“:”e_1_3_2_1_41_1“,”DOI-asserted-by“:”crossref“,“unstructured”:“X.Wang K.Huang A.Knoll和X.Qian.2019。通过源级分析和基于跟踪的仿真快速准确地估计GPU性能的混合框架。2019年IEEE HPCA。506--518. X.Wang K.Huang A.Knoll和X.Qian。2019.通过源级分析和基于跟踪的仿真快速准确地估计GPU性能的混合框架。2019年IEEE HPCA。506--518.“,“DOI”:“10.1109\/HPCA.2019.0062”},{“key”:“e_1_3_2_1_42_1”,“unstructured”:“Yuxin Wang Qiang Wang Shaohui Shi Xin He Zhenheng Tang Kaiyong Zhao and Xiaowen Chu.2019。为AI训练对AI加速器的性能和功率进行基准测试。arX输入:cs。DC\/1909.06842 Yuxin Wang Qiang Wang Shaohuai Shi Xin He Zhenheng Tang Kaiyong Zhao和Xiaowen Chu。2019.对人工智能训练用人工智能加速器的性能和功率进行基准测试。arX输入:cs。DC\/1909.06842“},{“key”:“e_1_3_2_1_43_1”,“doi由”断言:“publisher”,“doi”:“10.1109\/IISPASS.2010.5452013”},{“volume title”:“使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA”,“author”:“Wu Gene”,“key”:“e_1_3_2_1_44_1”,“nonstructured”:“Gene Wu、Joseph L Greathouse、Alexander Lyashevsky、Nuwan Jayasena和Derek Chiou。2015.使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA。IEEE,564--576。Gene Wu、Joseph L Greathouse、Alexander Lyashevsky、Nuwan Jayasena和Derek Chiou。2015.使用机器学习的GPGPU性能和功率估计。2015年IEEE HPCA。IEEE,564--576.“},{”key“:”e_1_3_2_1_45_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1093\/生物信息学\/btu047”}],“event”:{”name“:”PPoPP'20:第25届ACM SIGPLAN并行编程原理与实践研讨会“,”赞助商“:[”SIGPLAN ACM编程语言特别兴趣小组“,”SIGHPC ACM高性能计算特别兴趣小组,高性能计算特殊兴趣小组“],“location”:“San Diego California”,“缩写词”:“PPoPP'20”},“container-title”:[“使用图形处理单元的通用处理第十三届年会会议记录”],“original-title“:[],“link”:[{“URL”:“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3366428.3380767“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2023,10]],”date-time“:“2023-01-10T09:03:59Z”,”timestamp“:1673341439000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3366428.3380767“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2020,2,23]]},“引用计数”:45,“alternative-id”:[“10.1145\/33666428.3380767”,“10.1145\/3366428”],“URL”:“http://\/dx.doi.org\/10.1145\/366428.3380767”,“”关系“:{},”主题“:[],”发布“:{”日期部分“:[[2020,2,23]]},“断言”:[{”value“:”2020-02-23“,”order“:2,”name“:”published“,”label“:”published“,”group“:{”name“:”publication_history“,”标签“:”publication history“}}]}}