{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期-部件”：[[2023,9,3]]，“日期-时间”：“2023-09-03T02:15:17Z”，“时间戳”：1693707317158}，“出版商位置”：“美国纽约州纽约市”，“引用-计数”：18，“出版者”：“ACM出版社”，“许可证”：[{“开始”：}“日期-零件”：[[2014,5,12]]，“日期时间“：”2014-05-12T00:00:00Z“，“timestamp”：1399852800000}，“content-version”：“vor”，“delay-in-days”：131，“URL”：“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}]，“content-domain”：{“domain”:[]，“crossmark-restriction”：false}，”short-container-title“：[]，”published-print“：{”date-parts“：[2014]}”，“DOI”：“10.1145\/266.2664674”，“type”：“进程-文章”，“created”：{“date-parts”：[[2015,2,23]]，“date-time”：“2015-02-23T11:02:15Z”，“timestamp”：1424689335000}，“source”：“Crossref”，“is-referenced-by-count”：5，“title”：[“OpenCL中线性代数内核的性能可移植性研究”]，“prefix”：“10.1145”，”author“：[{”given“：”Karl“，”family“：”Rupp“，“sequence”：“first”，“affiliation”：[]}，{“given”：”Philip体育”，“family”：“Tillet”，“sequence”：“additional”，“affiliation”：[]}，{“given”：“Florian”，“failment”：“Rudolf”，“序列”：“附加”，“从属关系”：[]}，}“giving”：“Josef”，“家族”：“Weinbub”，“顺序”：“额外”，“附属关系”：[]}“，”family“：”J\u00fcngel“，”sequence“：“additional”，“affiliation”：[]}]，“member”：“320”，“reference”：[{“key”：“key-10.1145\/2664666.2664674-1”，“unstructured”：“M.M.Baskaran和R.Bordawekar.优化GPUs.IBM RC247042008上的稀疏矩阵向量乘法”。加兰。在面向吞吐量的处理器上实现稀疏矩阵向量乘法。《高性能计算网络、存储和分析会议论文集》，SC'09，18:1--18:11页，美国纽约州纽约市，2009年。ACM公司。“，”DOI“：”10.1145\\1654059.1654078“｝，｛”key“：”key-10.1145\\2664666.2664674-3“，”非结构化“：”P.Du，R.Weber，P.Luszczek，S.Tomov，G.Peterson和J.Dongarra。从CUDA到OpenCL:走向多平台GPU编程的性能可移植解决方案。并行计算，38（8）:391-4072012.“｝，｛”key“：”key-10.1145\\2664666.2664674-4“，”doi-asserted-by“：”crossref“，”unstructured“：”K.Goto和R.A.van de Geijn。高性能矩阵乘法剖析。《ACM数学软件汇刊》，34（3）：1--25，2008年。“，”DOI“：”10.1145\/1356052.1356053“}，{”key“：”key-10.1145\/2664666.2664674-5“，”DOI-asserted-by“：”crossref“，”unstructured“：”J.Kurzak、S.Tomov和J.Dongarra。Fermi GPU.IEEE并行和分布式系统汇刊的GEMM内核自动调整，23（11）：2045--20572012。“，“DOI”：“10.1109\/TPDS.2011.311“}，{“key”：“key-10.1145\/2664666.2664674-6”，“unstructured”：“ATLAS Library.http:\/\/math-ATLAS.sourceforge.net\/.”}，}“key:”key-10.1145 \/26666.266.4674-7“，”doi-asserted-by“：”crossref“，”unstructure“：”K.Matsumoto，N.Nakasato，and S.G。塞杜金。在GPU上实现OpenCL中快速矩阵乘法的代码生成器。第六届IEEE嵌入式多核SoC国际研讨会（MCSoC-12），2012年，第198-204页，2012年。伊巴拉。在多核处理器上进行硅虚拟药物筛选的高性能。《国际高性能计算应用杂志》，2014年。新闻界。“，”DOI“：”10.1177\/1094342042528252“}，{”key“：”key-10.1145\/2664666.2664674-9“，”DOI-asserted-by“：”crossref“，“unstructured”：“R.Nath，S.Tomov，and J.Dongarra。改进的费米图形处理单元MAGMA GEMM。国际高性能计算应用杂志，24（4）：511-5152010。”，“DOI”：“10.1177\/1094342010385729”}，}，“key”：“”key-10.1145 \/2664666.2664674-10“，”非结构化“：”OpenCL。http://www.khronos.org\/opencl\/。“｝，｛”key“：”key-10.1145\/266466.2664674-11“，”doi asserted by“：”crossref“，”非结构化“：”S.J.Pennycook，S.D.Hammond，S.A.Wright，J.A.Herdman，I.Miller，and S.A.Jarvis.对OpenCL性能可移植性的调查.并行与分布式计算杂志，73（11）：1439-145012013。“，”doi“：”10.1016\/J.jpdc.2012.007.005“｝，{“key”：“key-10.1145\/2664666.2664674-12”，“unstructured”：“S.Rul、H.Vandierendonck、J.D'Haene和K.De Bosschere。OpenCL内核性能可移植性的实验研究。高性能计算中的InApplication加速器，2010年第3页。”}，{《key》：“key-10.1145\/266466.266.4674-13”，“非结构化”：“K.Rupp、F.Rudolf和J。温布。ViennaCL-用于GPU和多核CPU的高级线性代数库。《GPU和科学应用国际研讨会论文集》（GPUScA 2010），第51-56页，2010年。“}，{“key”：“key-10.1145”，“doi-asserted-by”：“crossref”，“unstructured”：“P.Thoman，K.Kofler，H.Studt，J.Thomson，and T。法林格。自动OpenCL设备特征描述：指导优化内核设计。在Emmanuel Jeannot、Raymond Namyst和Jean Roman编辑的《2011年Euro-Par并行处理》中，《计算机科学讲义》第6853卷，第438-452页。Springer Berlin Heidelberg，2011.“，“DOI”：“10.1007\/978-3642-23397-5_43”}，{“key”：“key-10.1145\/2664666.2664674-15”，“unstructured”：“Ph.Tillet，K.Rupp，S.Selberherr，and C.-T.Lin.Towards Performance-Portable，Scalable，and便捷线性代数。第五届USENIX研讨会，关于并行主义的热门话题（HotPar’13），2013年。”}、{“密钥”：“key-10.1145 \/2664666.2664674-16“，“非结构化”：“维也纳计算图书馆（维也纳CL）。http:\/\/viennacl.sourceforge.net\/。}，{“key”：“key-10.1145\/2664666.2664674-17”，“doi-asserted-by”：“crossref”，“unstructured”：“R.C.Whaley，A.Petitet，and J.Dongarra。软件和ATLAS项目的自动经验优化。并行计算，27（1-2）：3--352001。高性能计算的新趋势。“，”DOI“：”10.1016\/S0167-8191（00）00087-9“}，{”key“：”key-10.1145\/2664666.2664674-18“，”DOI-asserted-by“：”crossref“，“unstructured”：“Y.Zhang，M.Sinclair，and A.Chien.改善OpenCL程序的性能可移植性。J.M.Kunkel，T.Ludwig，and H.-W。缪尔，《超级计算》编辑，《计算机科学讲义》第7905卷，第136-150页。Springer Berlin Heidelberg，2013.“，”DOI“：”10.1007\/978-3642-38750-0_11“}]，”event“：{“name”：“the International Workshop”，“location”：“Bristol，United Kingdom”，“缩写词”：“IWOCL‘14”，“number”：“2014”，“赞助商”：[“ARM”，“Intel”，“StreamComputing，StreamCompeting BV”，“Altera Corp.，Altera Corporation”，“AMD”，“Codeplay，Codeplay Software Ltd.”，“SAMSUNG”，“Imagination，Imagination Technologies Limited”，“QI，Qualcomm Inc.”]，“start”：{“date-parts”：[[2014,5,12]]}，“end”：{“date-parts”：[[2014,5,13]]}}，”container-title“：[“OpenCL 2013&2014国际研讨会论文集-IWOCL‘14”]，”original-title”：[]，“link”：[{“URL”：“http://dl.acm.org\/ft_gateway.cfm？id=2664674&ftid=1545583&dw n=1“，”content-type“：”unspecified“，”content-version“：”vor“，”intended-application“：”similarity-checking“}]，”deposed“：{”date-parts“：[[2019,8,21]]，”date-time“：“2019-08-21T00:53:42Z”，”timestamp“：1566348822000}，”score“：1，”resource“：{primary”：{“URL”：“http://\\dl.acm.org\/citation.cfm？doid=266466.2664674”}}，“副标题“：[]，”短标题“：[[]，”已发布“：{”date-parts“：[[2014]]}，”references-count“：18，”URL“：”http://\/dx.doi.org\/10.1145\/2664666.2664674“，”relation“：{}，“subject”：[]，”published“：{”date-part“：[2014]]}}}