{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2022,4,5]],“日期-时间”:“2022-04-05T07:20:49Z”,“时间戳”:1649143249839},“参考-计数”:23,“出版商”:“Springer Science and Business Media LLC”,“问题”:“4”,“许可证”:[{“开始”:{'日期-部件“:[2020,5,22]],”日期-时间“:“2020-05-22T00:00:00Z”,“timestamp”:1590105600000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/creativecommons.org\/licenses\/by\/4.0”},{“start”:{“date-parts”:[[2020,5,22]],“date-time”:“2020-05-22T00:00:00Z”,“timetamp”:15.9015600000}commons.org\/licenses\/by\/4.0“}],”content-domain“:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},“short-container-title”:[”Int J Parallel Prog“],”published-print“:{”date-parts“:[[2020,8]]},”abstract“:”摘要<\/jats:title>在早期的工作中,我们定义了一种特定于域的语言(DSL),旨在为多核和多GPU集群编程提供一种易于使用的方法。DSL融合了利用算法框架的思想,算法框架是并行编程的众所周知的模式,例如map和reduce。基于选定的框架,用户定义的函数可以并行应用于数据结构,其主要优点是用户不必担心实现细节。到目前为止,我们只实现了一个多核集群生成器,在本文中,我们提出并评估了两个基于OpenACC和CUDA的多GPU集群生成器原型。我们已经用四个基准应用程序对该方法进行了评估。结果表明,生成方法会导致执行时间,这与其他库实现相当<\/jats:p>“,”DOI“:”10.1007\/s10766-020-00659-x“,”type“:”journal-article“,”created“:{”date-parts“:[[2020,5,22]],”date-time“:”2020-05-22T17:02:40Z“,”timestamp“:159016696000},”page“:referenced-by-count“:0,”title“:[”基于特定领域语言的多GPU集群高性能代码生成算法框架“],”前缀“:”10.1007“,”卷“:”48“,”作者“:[{”给定“:”Fabian“,”家族“:”Wrede“,”sequence“:”first“,”affiliation“:[]},{”given“:”Herbert“,”family“:”Kuchen“,”序列“:”additional“,”从属“:[]}],”成员“:”297“,”published-online“:{”date-parts“:[[2020,5,22]]},”reference“:[{”key“:”659_CR1“,”doi-asserted-by“:”crossref“,“unstructured”:“Bell,N.,Hoberock,J.:推力:CUDA面向生产力的库。收录:GPU Computing Gems Jade版,第359\u2013371页。Elsevier,Amsterdam(2012)“,”DOI“:”10.1016\/B978-0-12-385963-100026-5“},{”key“:”659_CR2“,”unstructured“:”OpenACC Organization.OpenACC(2019)“}”,{“key”:“659_CR3”,“volume-title”:“算法框架:并行计算的结构化管理”,“author”:“M Cole”,“year”:“1991”,“unstructure”:“Cole,M.:算法框架:并行计算的结构化管理。麻省理工学院出版社,剑桥(1991)“},{“key”:“659_CR4”,“doi-asserted-by”:“crossref”,“unstructured”:“Kuchen,H.:骨架库。In:B.\u00a0Monien and R.\u00a 0Feldmann,(eds.)《第八届国际并行处理欧洲-巴黎会议论文集》,《计算机科学讲义》第2400卷,柏林,海德堡,pp.620\u2013629(2002)”,“DOI“:”10.1007\/3-540-45706-2_86“},{“issue”:“2”,“key”:“659_CR5”,“DOI-asserted-by”:“publisher”,“first page”:”129“,“DOI”:“10.1504\/IJHPCN.2012.046370”,“volume”::“7”,“author”:“S Ernsting”,“year”:“2012”,“unstructured”:“Ernsting,S.,Kuchen,H.:多核、多GPU系统和集群的算法框架。国际期刊高执行计算净值7(2),129\u2013138(2012)“,”日记标题“:”国际期刊高性能计算。Netw公司。“},{”issue“:”4“,”key“:”659_CR6“,”doi-asserted-by“:”publisher“,”first-page“:”316“,“doi”:“10.1145\/1118890.1118892”,“volume”:“37”,“author”:“M Mernik”,“year”:“2005”,“unstructured”:“Mernik,M.,Heering,J.,Sloane,A.M.:何时以及如何开发特定于域的语言。ACM Compute.Surv.37(4),316\u2013344(2005)”,“journal-title”:“ACM计算生存”},{“key”:“659_CR7”,“volume-title”:“Model-Driven Software Development”,“author”:“T Stahl”,“year”:“2006”,“unstructured”:“Stahl,T.,V\u00f6lter,M.:模型驱动软件开发。Wiley,Chichester:“The Eclipse Foundation.Xtend documentation(2019)”},{“issue”:“2”,“key”:“659_CR10”,“doi-asserted-by”:“publisher”,“first page”:”40“,“doi”:“10.1145\/1365490.1365500”,“volume”::“6”,“author”:“J Nickolls”,“year”:“2008”,“unstructured”:“Nickols,J.,Buck,I.,Garland,M.,Skadron,K.:使用CUDA进行可扩展并行编程。队列6(2),40\u201353(2008)“,”journal-title“:”Queue“},{”key“:”659_CR11“,”doi-asserted-by“:”publisher“,”doi“:”10.1007\/s11227-019-02825-6“,”author“:”F Wrede“,”year“:”2019“,”unstructured“:”Wrede,F.,Rieger,C.,Kuchen,H.:基于特定于域的语言为算法骨架生成高性能代码。J.Supercomput(2019)https:\/\/doi.org\/10.1007\/s11227-019-02825-6“,”journal-title“:”J.Supercomput。“},{”key“:”659_CR12“,”doi asserted by“:”crossref“,”nonstructured“:”Rieger,C.,Wrede,F.,Kuchen,H.:Musket:一种用于具有算法骨架的高级并行编程的特定领域语言。在:第34届ACM\\SIGAPP应用计算研讨会论文集,SAC\u201919,纽约。ACM,pp.1534\u20131543(2019)“,”doi“:”10.1145\/327280.3297434“},{“key”:“659_CR13”,“系列标题”:“计算机科学讲义”,“doi断言者”:“出版商”,“首页”:“254”,“doi”:“10.1007\/978-3-540-25935-0_15”,“卷标题”:“特定领域程序生成”,“作者”:“H Kuchen”,“年份”:“2004”,“非结构化”:“Kuchen,H.:优化骨架调用序列。收录:Lengauer,C.、Batory,D.、Consel,C.、Odersky,M.(编辑)《特定领域程序生成》。计算机科学课堂讲稿,第3016卷,第254\u2013274页。Springer,Berlin(2004)“},{”issue“:”2“,”key“:”659_CR14“,”doi-asserted-by“:”publisher“,”first page“:“283”,“doi”:“10.1007\/s10766-016-0416-7”,“volume”:“45”,“author”:“S Ernsting”,“year”:“2017”,“unstructured”:“Ernsting,S.,Kuchen,H.:支持加速器的数据并行算法框架。国际期刊并行程序。45(2),283\u2013299(2017))“,”journal-title“:”国际期刊并行程序。“},{”key“:”659_CR15“,”unstructured“:”Bettini,L.:用Xtext和Xtend实现领域特定语言。提炼社区经验。英国伯明翰Packt Pub(2013)“}Aldinucci,M.、Danalotto,M.,Kilpatrick,P.、Torquati,M.:快速流:多核上的高水平高效流。收录:Pllana,S.、Xhafa,F.(编辑)《编程多核和多核计算系统》。并行和分布式计算威利系列。Wiley,Hoboken,pp.261\u2013280(2017)“,“DOI”:“10.1002\/9781119332015.ch13”},{“key”:“659_CR17”,“unstructured”:“Aldinucci,M.、Campa,S.、Danalpto,M.,Kilpatrick,P.、Torquati,M.:以FastFlow中的分布式系统为目标。在:Caragiannis,I.,Alexander,M.,Badia,R.M.,Cannataro,M.,Costan,A.,Daneluto,M.,Desprez,F.,Krammer,B.,Sahuquillo,J.,Scott,S.L.,Weidendorfer,J.(编辑)2012年欧洲标准:并行处理研讨会,柏林,海德堡,pp.47\u201356(2013)“},{”键“:”659_CR18“,”doi断言“:”交叉引用“,”非结构化“:”Buono,D.,Danalpto,M.,Lametti,S.,Torquati,M.:通用多核并行模式。摘自:2013年第21届欧洲微型计算机并行、分布式和基于网络的处理国际会议,第131\u2013139页(2013)“,“DOI”:“10.1109\/PPD.2013.27”},{“key”:“659_CR19”,“DOI-asserted-by”:“publisher”,“first-pages”:“72”,“DOI:“10.1007\/978-3642-16478-15”,“volume-title”:“函数语言的实现和应用”,“author”:“K Matsuzaki”,“年份”:“2010年”,“非结构化”:“Matsuzavi,K.,Emoto,K.:通过表达式模板实现支持融合的平行骨架。收录于:Moraz\u00e1n,M.T.,Scholz,S.(编辑)《函数语言的实现和应用》,第72\u201389页。Springer,Berlin(2010)“},{”key“:”659_CR20“,”doi-asserted-by“:”crossref“,”unstructured“:”Ernstsson,A.,Li,L.,Kessler,C.:SkePU 2:异构并行系统的灵活和类型安全骨架编程。In:International Journal of parallel programming(2017)“,”doi“:”10.1007\/s10766-017-0490-5“}”,{“key”:“659_CR2”,“unstructure”:“”ISO标准:编程语言\u2014并行C++扩展技术规范。In:标准ISO\/IEC TS 19570:2015,国际标准化组织,瑞士日内瓦(2015)“},{”issue“:”01“,”key“:”659_CR22“,”doi-asserted-by“:”publisher“,”first page“:“1740005”,“doi”:“10.1142\/S0129626417400059”,“volume”:“27”,“author”:“D Griebler”,“year”:“2017”,“unstructured”:“Griebler,D.、Danalotto,M.、Torquati,M.和Fernandes,L.G.:SPar:用于高级和生产流并行的DSL。并行过程。莱特。27(01),1740005(2017)“,“日记标题”:“平行程序。莱特。“},{”key“:”659_CR23“,”doi-asserted-by“:”crossref“,”unstructured“:”Steuwer,M.,Fensch,C.,Lindley,S.,Dubach,C.:使用重写规则生成性能可移植代码:从高级函数表达式到高性能OpenCL代码。摘自:第20届ACM SIGPLAN函数编程国际会议论文集,ICFP\u201915。ACM,纽约,第205\u2013217页(2015)“,”DOI“:”10.1145\/2784731.2784754“}],”container-title“:[”国际并行编程杂志“],”原文标题“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/link.springer.com\/content\/pdf\/10007\/s10766-020-00659-x.pdf“,”内容类型“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”text-mining“},{“URL”:“https:\/\/link.springer.com/article\/10.1007\/s10766-020-00659-x\/fulltext.html”,“content-type”:“text\/html”,“content-version”:“vor”,“intended-application”:“text-mining”},}“URL“https:\\/link.stringer.com/content\/pdf\/10.10007\/s10766-020-00659-x.pdf”,“内容类型”:“application”/pdf“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2021,5,21]],”date-time“:”2021-05-21T23:18:25Z“,”timestamp“:1621639105000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/link.springer.com\/10007\/s10766-020-00659-x”},“副标题”:[],“短标题”:[],“已发布”“:{”日期部分“:[[2020,5,22]]},”references-count“:23,”journal-issue“:{”issue“:“4”,“published-print”:{“date-parts”:[[2020,8]]}},“alternative-id”:[“659”],“URL”:“http://\/dx.doi.org\/10.1007\/s10766-020-00659-x”,“relationship”:{},”ISSN“:[”0885-7458“,”1573-7640“],”ISSN-type“:[{”value“0885-745”,“type”:“打印”},{“值”:“1573-7640”,“类型”:“电子”}],“主题”:[],“发布”:{”date-parts“:[[2020,5,22]]},”assertion“:[{”value“:”2019年10月15日“,”order“:1,”name“:”received“,”label“:”received“,“group”:{“name”:“Article History”,“label”:“文章历史”}}},{“value”:“2020年4月30日”,“order”:2,“name”:“accepted”,“table”:“accepted“,”group“:2020年5月”,“订单”:3,“名称”:first_online“,”label“:”first online“,“group”:{“name”:“Article History”,“label”:“文章历史”}}]}}