{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2023,9,3]],“日期-时间”:“2023-09-03T02:15:17Z”,“时间戳”:1693707317158},“出版商位置”:“美国纽约州纽约市”,“引用-计数”:18,“出版者”:“ACM出版社”,“许可证”:[{“开始”:}“日期-零件”:[[2014,5,12]],“日期时间“:”2014-05-12T00:00:00Z“,“timestamp”:1399852800000},“content-version”:“vor”,“delay-in-days”:131,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“content-domain”:{“domain”:[],“crossmark-restriction”:false},”short-container-title“:[],”published-print“:{”date-parts“:[2014]}”,“DOI”:“10.1145\/266.2664674”,“type”:“进程-文章”,“created”:{“date-parts”:[[2015,2,23]],“date-time”:“2015-02-23T11:02:15Z”,“timestamp”:1424689335000},“source”:“Crossref”,“is-referenced-by-count”:5,“title”:[“OpenCL中线性代数内核的性能可移植性研究”],“prefix”:“10.1145”,”author“:[{”given“:”Karl“,”family“:”Rupp“,“sequence”:“first”,“affiliation”:[]},{“given”:”Philip体育”,“family”:“Tillet”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Florian”,“failment”:“Rudolf”,“序列”:“附加”,“从属关系”:[]},}“giving”:“Josef”,“家族”:“Weinbub”,“顺序”:“额外”,“附属关系”:[]}“,”family“:”J\u00fcngel“,”sequence“:“additional”,“affiliation”:[]}],“member”:“320”,“reference”:[{“key”:“key-10.1145\/2664666.2664674-1”,“unstructured”:“M.M.Baskaran和R.Bordawekar.优化GPUs.IBM RC247042008上的稀疏矩阵向量乘法”。加兰。在面向吞吐量的处理器上实现稀疏矩阵向量乘法。《高性能计算网络、存储和分析会议论文集》,SC'09,18:1--18:11页,美国纽约州纽约市,2009年。ACM公司。“,”DOI“:”10.1145\\1654059.1654078“},{”key“:”key-10.1145\\2664666.2664674-3“,”非结构化“:”P.Du,R.Weber,P.Luszczek,S.Tomov,G.Peterson和J.Dongarra。从CUDA到OpenCL:走向多平台GPU编程的性能可移植解决方案。并行计算,38(8):391-4072012.“},{”key“:”key-10.1145\\2664666.2664674-4“,”doi-asserted-by“:”crossref“,”unstructured“:”K.Goto和R.A.van de Geijn。高性能矩阵乘法剖析。《ACM数学软件汇刊》,34(3):1--25,2008年。“,”DOI“:”10.1145\/1356052.1356053“},{”key“:”key-10.1145\/2664666.2664674-5“,”DOI-asserted-by“:”crossref“,”unstructured“:”J.Kurzak、S.Tomov和J.Dongarra。Fermi GPU.IEEE并行和分布式系统汇刊的GEMM内核自动调整,23(11):2045--20572012。“,“DOI”:“10.1109\/TPDS.2011.311“},{“key”:“key-10.1145\/2664666.2664674-6”,“unstructured”:“ATLAS Library.http:\/\/math-ATLAS.sourceforge.net\/.”},}“key:”key-10.1145 \/26666.266.4674-7“,”doi-asserted-by“:”crossref“,”unstructure“:”K.Matsumoto,N.Nakasato,and S.G。塞杜金。在GPU上实现OpenCL中快速矩阵乘法的代码生成器。第六届IEEE嵌入式多核SoC国际研讨会(MCSoC-12),2012年,第198-204页,2012年。伊巴拉。在多核处理器上进行硅虚拟药物筛选的高性能。《国际高性能计算应用杂志》,2014年。新闻界。“,”DOI“:”10.1177\/1094342042528252“},{”key“:”key-10.1145\/2664666.2664674-9“,”DOI-asserted-by“:”crossref“,“unstructured”:“R.Nath,S.Tomov,and J.Dongarra。改进的费米图形处理单元MAGMA GEMM。国际高性能计算应用杂志,24(4):511-5152010。”,“DOI”:“10.1177\/1094342010385729”},},“key”:“”key-10.1145 \/2664666.2664674-10“,”非结构化“:”OpenCL。http://www.khronos.org\/opencl\/。“},{”key“:”key-10.1145\/266466.2664674-11“,”doi asserted by“:”crossref“,”非结构化“:”S.J.Pennycook,S.D.Hammond,S.A.Wright,J.A.Herdman,I.Miller,and S.A.Jarvis.对OpenCL性能可移植性的调查.并行与分布式计算杂志,73(11):1439-145012013。“,”doi“:”10.1016\/J.jpdc.2012.007.005“},{“key”:“key-10.1145\/2664666.2664674-12”,“unstructured”:“S.Rul、H.Vandierendonck、J.D'Haene和K.De Bosschere。OpenCL内核性能可移植性的实验研究。高性能计算中的InApplication加速器,2010年第3页。”},{《key》:“key-10.1145\/266466.266.4674-13”,“非结构化”:“K.Rupp、F.Rudolf和J。温布。ViennaCL-用于GPU和多核CPU的高级线性代数库。《GPU和科学应用国际研讨会论文集》(GPUScA 2010),第51-56页,2010年。“},{“key”:“key-10.1145”,“doi-asserted-by”:“crossref”,“unstructured”:“P.Thoman,K.Kofler,H.Studt,J.Thomson,and T。法林格。自动OpenCL设备特征描述:指导优化内核设计。在Emmanuel Jeannot、Raymond Namyst和Jean Roman编辑的《2011年Euro-Par并行处理》中,《计算机科学讲义》第6853卷,第438-452页。Springer Berlin Heidelberg,2011.“,“DOI”:“10.1007\/978-3642-23397-5_43”},{“key”:“key-10.1145\/2664666.2664674-15”,“unstructured”:“Ph.Tillet,K.Rupp,S.Selberherr,and C.-T.Lin.Towards Performance-Portable,Scalable,and便捷线性代数。第五届USENIX研讨会,关于并行主义的热门话题(HotPar’13),2013年。”}、{“密钥”:“key-10.1145 \/2664666.2664674-16“,“非结构化”:“维也纳计算图书馆(维也纳CL)。http:\/\/viennacl.sourceforge.net\/。},{“key”:“key-10.1145\/2664666.2664674-17”,“doi-asserted-by”:“crossref”,“unstructured”:“R.C.Whaley,A.Petitet,and J.Dongarra。软件和ATLAS项目的自动经验优化。并行计算,27(1-2):3--352001。高性能计算的新趋势。“,”DOI“:”10.1016\/S0167-8191(00)00087-9“},{”key“:”key-10.1145\/2664666.2664674-18“,”DOI-asserted-by“:”crossref“,“unstructured”:“Y.Zhang,M.Sinclair,and A.Chien.改善OpenCL程序的性能可移植性。J.M.Kunkel,T.Ludwig,and H.-W。缪尔,《超级计算》编辑,《计算机科学讲义》第7905卷,第136-150页。Springer Berlin Heidelberg,2013.“,”DOI“:”10.1007\/978-3642-38750-0_11“}],”event“:{“name”:“the International Workshop”,“location”:“Bristol,United Kingdom”,“缩写词”:“IWOCL‘14”,“number”:“2014”,“赞助商”:[“ARM”,“Intel”,“StreamComputing,StreamCompeting BV”,“Altera Corp.,Altera Corporation”,“AMD”,“Codeplay,Codeplay Software Ltd.”,“SAMSUNG”,“Imagination,Imagination Technologies Limited”,“QI,Qualcomm Inc.”],“start”:{“date-parts”:[[2014,5,12]]},“end”:{“date-parts”:[[2014,5,13]]}},”container-title“:[“OpenCL 2013&2014国际研讨会论文集-IWOCL‘14”],”original-title”:[],“link”:[{“URL”:“http://dl.acm.org\/ft_gateway.cfm?id=2664674&ftid=1545583&dw n=1“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2019,8,21]],”date-time“:“2019-08-21T00:53:42Z”,”timestamp“:1566348822000},”score“:1,”resource“:{primary”:{“URL”:“http://\\dl.acm.org\/citation.cfm?doid=266466.2664674”}},“副标题“:[],”短标题“:[[],”已发布“:{”date-parts“:[[2014]]},”references-count“:18,”URL“:”http://\/dx.doi.org\/10.1145\/2664666.2664674“,”relation“:{},“subject”:[],”published“:{”date-part“:[2014]]}}}