{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“讯息”:{“索引”:{“日期-部件”:[[2024,6,1]],“日期-时间”:“2024-06-01T05:08:34Z”,“时间戳”:1717218514268},“参考-计数”:27,“出版商”:“计算机协会(ACM)”,“问题”:“2”,“许可证”:[{“开始”:{-“日期-零件”:[2017,10,11]],我“:“2017-10-11T00:00:00Z”,“timestamp”:1507680000000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“content-domain”:{“domain”:[“dl.acm.org”],“crossmark-restriction”:true},”short-container-title“:[”SIGMETRICS Perform.Eval.Rev.“],”published-print“:{”date-parts“:[2017,1,1 0,11]]},“抽象”:“随着超级计算机和数据中心越来越多地安装图形处理单元(GPU),其巨大的电力成本带来了新的环境和经济问题。虽然动态电压和频率缩放(DVFS)技术已成功应用于传统CPU以储备能量,但GPU DVFS对应用程序性能和功耗的影响尚未完全了解,主要是由于复杂的GPU内存系统。提出了一种基于支持向量回归(SVR)的快速预测模型,该模型可以在不同GPU内核和内存频率下,使用一组配置参数估计给定GPU内核的平均运行时功率。我们的实验数据集包括从19个运行在实际GPU平台上的GPU内核中获得的931个样本,内核和内存频率在400MHz和1000MHz之间。我们通过十倍交叉验证来评估基于SVR的预测模型的准确性。我们获得了比先前模型更高的精度,平均均方误差(MSE)为0.797瓦,平均绝对百分比误差(MAPE)为3.08%。结合现有的性能预测模型,我们可以找到最佳的GPU频率设置,与应用默认设置相比,这些GPU内核平均可以节省13.2%的能量,性能损失不超过10%<\/jats:p>“,”DOI“:”10.1145\/3152042.3152066“,”type“:”期刊文章“,”created“:{”日期部分“:[[2017,10,12]],”日期时间“:”2017-10-12T12:52:50Z“,”时间戳“:1507812770000},”page“:”73-78“,”update policy“:”http:\/\/dx.DOI.org/10.1145\/crosmark policy“,”source“:”Crossref“,”由count引用“:12,”title“:[”具有核心和记忆频率标度的GPGPU功率估计“],”前缀“:”10.1145“,”卷“:”45“,”作者“:[{”给定“:”强“,”家庭“:”王“,”序列“:”第一“,”从属“:[}”名称“:”香港浸会大学“}]},{”给出“:”小文“,”家人“:”楚“,”顺序“:”附加“,”附属“:[[{“名称”:“香港浸会学院”}]}],“成员”:“320”,“published-online“:{“date-parts”:[[2017,10,11]]},“reference”:[{“key”:“e_1_1_1”,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/IPDPS.2014.23”},{“密钥”:“e_1_2_1_2_”,“首页”:“203”,《文章-标题》:“支持向量回归”,“卷”:“11”,“作者”:“Basak Debassish”,“年份”:“2007”,“非结构化”:“Debassish Basak、Srimanta Pal和Dipak Chandra Patranabis。2007 . 支持向量回归。神经信息处理——信件和评论11,10(2007),203-224。Debasish Basak、Srimanta Pal和Dipak Chandra Patranabis,2007年。支持向量回归。Neural Information Processing-Letters and Reviews 11,10(2007),203--224.“,”journal-title“:”Neural信息处理-Letters-and Revieves“},{“key”:“e_1_2_1_3_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/1961189.1961199“}”,{”key“:”e_2_4_1“,”doi-assert-by“:”publisher“,“doi”:“10.1145\/3077839.307855”},“doi-asserted-by“:”publisher“,”doi“:”10.1109\/IISWC.2009.5306797“},{“key”:“e_1_2_1_6_1”,“doi-assert-by”:“publisher”、“doi”:“10.1145\/2593069.2593208”}、{“key”:“e_1_2_1_7_1”、”volume-title“:”2015 IEEE国际通信会议(ICC).436-441“,”author“:”Chu X.“,”“unstructured”:“X.Chu,C.Liu,K.Ouyang,L.S.Yung,H。Liu和Y.W.Leung。2015.PErasure:用于GPU的并行Cauchy Reed-Solomon编码库。2015年IEEE国际通信会议(ICC)。436--441 . X.Chu、C.Liu、K.Ouyang、L.S.Yung、H.Liu和Y.W.Leung。2015.PErasure:用于GPU的并行Cauchy Reed-Solomon编码库。2015年IEEE国际通信会议(ICC)。436--441.“},{“key”:“e_1_2_1_8_1”,“unstructured”:“吴春峰和汤姆·斯科格兰斯。2016。绿色500.{在线}https:\/\/www.top500.org\/GREEN500\/lists\/2016\/11\/。(2016). 吴春峰和汤姆·斯科格兰斯。2016年,绿色500。{在线}https:\/\/www.top500.org\/green500\/lists\/2016\/11\/。(2016).“},{”key“:”e_1_2_1_9_1“,”volume-title“:”2016 IEEE国际并行和分布式处理研讨会(IPDPSW)。1190--1199“,”author“:”Coplin J.“,“unstructured”:”J.Coplin和M.Burtscher.2016。GPGPU基准程序的能量、功率和性能表征。2016年IEEE国际并行和分布式处理研讨会(IPDPSW)。1190--1199 . J.Coplin和M.Burtscher。2016.GPGPU基准项目的能源、电力和性能特征。2016年IEEE国际并行和分布式处理研讨会(IPDPSW)。1190--1199.“},{”key“:”e_1_2_1_10_1“,”volume-title“:”第25届神经信息处理系统国际会议(NIPS'12)“,”author“:”Dean Jeffrey“,”unstructured“:”Jeffrey-Dean,Greg S.Corrado,Rajat Monga,Kai Chen,Matthieu Devin,Quoc V.Le,Mark Z。Mao、Marc’Aurelio Ranzato、Andrew Senior、Paul Tucker、Ke Yang和Andrew Y.Ng。2012.大规模分布式深层网络。《第25届神经信息处理系统国际会议论文集》(NIPS’12)。1223--1231. Jeffrey Dean、Greg S.Corrado、Rajat Monga、Kai Chen、Matthieu Devin、Quoc V.Le、Mark Z.Mao、Marc’Aurelio Ranzato、Andrew Senior、Paul Tucker、Ke Yang和Andrew Y.Ng.2012。大规模分布式深层网络。《第25届神经信息处理系统国际会议论文集》(NIPS’12)。1223--1231.“},{”key“:”e_1_1_11_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/1815961.1815998”},“key”:“e_1_i_12_12_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/CPSNA.2015.23“}”,{“key“:”e_2_1_13_1“。电源和阈值电压缩放技术。多电压CMOS电路设计(2006)45-84。V.Kursun和E.G.Friedman。2006.电源和阈值电压缩放技术。多电压CMOS电路设计(2006)45-84.“,”DOI“:”10.1002\/04700 33371.ch3“},{”key“:”e_1_2_1_14_1“,”DOI断言“:”publisher“,”DOI“:”10.1145\/2485922.48596964“},{”key“:”e_1_2_1_15_1“,”volume title“:”ACM SOSP功率感知计算与系统研讨会(HotPower)进展“,”作者“:”Ma Xiaohan“,”年份“:”2009“,”非结构化“:”马晓翰、棉东、林忠和邓志刚。2009 . 基于GPU的计算的统计功耗分析和建模。ACM SOSP功率感知计算和系统(HotPower)研讨会进行中。马晓翰、棉东、林忠和邓志刚。2009年。基于GPU的计算的统计功耗分析和建模。ACM SOSP功率感知计算和系统(HotPower)研讨会进行中。“},{”key“:”e_1_1_16_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/INFOCOM.2017.8057205”},“{”key“:“e_1_i_17_1”,“doi-assert-by”:“publisher”,”doi“:”10.1016\/j.dcan.2016.10.001“}”,{“key”:“e_ 2_1_18_1”8315“},{”key“:”e_1_2_1_19_1“,”非结构化“:”NVIDIA.2014。GeForce GTX 980白皮书。{在线}http://www.geforce.com/hardware\/notebook-gpus\/geforce-gtx-980\/specifications。(2014). 英伟达。2014.GeForce GTX 980白皮书。{在线}http://www.geforce.com/hardware\/notebook-gpus\/geforce-gtx-980\/specifications。(2014).“},{”key“:”e_1_2_1_20_1“,”unstructured“:”NVIDIA.2016。GPU计算SDK。{在线}https:\/\/developer.nvidia.com/gpucomputing-sdk。(2016). 英伟达。2016.GPU计算SDK。{在线}https:\/\/developer.nvidia.com/gpucomputing-sdk。(2016).“},{”key“:”e_1_2_1_21_1“,”unstructured“:”NVIDIA.2016。NVIDIA档案器。{在线}http://\/docs.nvidia.com/cuda\/profilerusers-guide。(2016). 英伟达。2016年,NVIDIA Profiler。{在线}http://\/docs.nvidia.com/cuda\/profilerusers-guide。(2016).“},{”key“:”e_1_2_1_22_1“,”unstructured“:”NVIDIA.2016。NVIDIA系统管理接口(NVIDIA-smi)。{在线}https:\/\/developer.nvidia.com/nvidia-system-management-interface。(2016). 英伟达。2016.NVIDIA系统管理界面(NVIDIA-smi)。{在线}https:\/\/developer.nvidia.com/nvidia-system-management-interface。(2016).“},{”key“:”e_1_1_23_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/IPDPS.2013.73”},“key”:“e_2_1_24_1”,“volume-title”:“GPGPU性能评估与核心和内存频率缩放。arXiv预印本arXiv:1701.05308”,“author”:“Wang Qiang”,“year”:“2017”,“unstructured”:“Qiang Wang and Xiaown Chu。2017”。基于内核和内存频率缩放的GPGPU性能评估。arXiv预印arXiv:1701.05308(2017)。王强和朱晓文。2017.GPGPU性能评估(带核心和内存频率缩放)。arXiv预印arXiv:1701.05308(2017)。“},{”key“:”e_1_1_25_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145 \/3077839.3077858”},“key”:“e_2_1_26_1”,“volume-title”:“2015 IEEE第21届高性能计算机体系结构国际研讨会(HPCA).564-576”,“author”:“Wu G”,“unstructured”:“G.Wu,J.L.Greathouse,A.Lyashevsky,N.Jayasena,and D.Chiou,2015。使用机器学习的GPGPU性能和功率估计。2015年IEEE第21届高性能计算机体系结构国际研讨会(HPCA)。564--576 . G.Wu、J.L.Greathouse、A.Lyashevsky、N.Jayasena和D.Chiou。2015.使用机器学习的GPGPU性能和功率估计。2015年IEEE第21届高性能计算机体系结构(HPCA)国际研讨会。564--576.“},{“key”:“e_1_2_1_27_1”,“doi断言者”:“publisher”,“doi”:“10.1093\/生物信息学\/btu047”}],“容器标题”:[“ACM SIGMETRICS性能评估评审”],“原始标题”:[],“语言”:“en”,“链接”:[{“URL”:“https:\/\/dl.ACM.org/doi\/pdf\/10.11145\/31520423152066”,“内容类型”:“未指定”,“内容版本”:“vor”,“intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,12,31]],”date-time“:”2022-12-31T21:51:38Z“,”timestamp“:1672523498000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3152042.3152066”}},“subtitle”:[],“shorttitle”:[],“issued”:{“date-part”:[[2017,10,11]]},“引用计数”:27,“期刊号:{“issue”:“2”,“published print”:{“date parts”:[[2017,10,11]]}},“alternative id”:[“10.1145\/31520423152066”],“URL”:“http:\/\/dx.doi.org/10.1145\/31520423152066”,“relationship”:{},“ISSN”:[“0163-5999”],“ISSN type”:[{“value”:“0163-5999”,“type”:“print”}],“subject”:[],“published”:{“date”parts“:[[2017,10,11]]},”断言“:[{”值“:”2017-10-11“,”order“:2,”name“:”published“,”label“:”published“,”group“:{“name”:”publication_history“,”标签“:”publication history“}}]}}