{“状态”:“正常”,“消息类型”:“工作”,“消息版本”:“1.0.0”,“消息”:{“索引”:{“日期部分”:[[2024,4,1]],“日期时间”:“2024-04-01T16:36:13Z”,“时间戳”:1711989373028},“引用计数”:37,“出版商”:“SAGE出版物”,“发行”:“1”,“许可证”:[{“开始”:{“日期部分”:[[2015,6,29],“日期时间”:“2015-06-29T00:00:00Z”,“时间戳”:1435536000000}中,“内容版本”:“tdm”,“延迟天数”:0,“URL”:“http:\/\/journals.sagepub.com\/page\/policies\/text and data mining license”}],“内容域”:{“域”:[“journals.sagepub.com”],“交叉标记限制”:true},“短容器标题”:[“国际高性能计算应用杂志”],“已发布的印刷品”:{“日期部分”:[[2016,2]]},“抽象”:“本文介绍了针对多核Intel的高性能共轭梯度基准测试(HPCG)中的优化\u00ae<\/jats:sup>至强\u00ae处理器和多核Xeon Phi\u2122协处理器。如果没有仔细优化,HPCG基准测试会利用现代处理器中可用的计算资源,因为它的运算强度低,并且在并行化Gauss\u2013Seidel平滑器(GS)方面存在挑战。我们的优化实现将GS与稀疏矩阵向量乘法(SpMV)相结合,以解决算法强度低的问题,克服了性能受内存带宽限制的问题。这种融合优化在新一代Xeon处理器中越来越有效,证明了它们更大的缓存对稀疏矩阵操作的有用性:Sandy Bridge、Ivy Bridge和Haswell处理器分别达到93%、99%和103%,在矩阵从内存流式传输的约束下实现理想性能。我们的实现还使用细粒度级别调度来并行化GS,这种方法被认为不适用于多核。我们的GS实现可在Xeon Phi协处理器中扩展到60个内核,以实现最高级别的多网格预处理。在较粗略的级别上,我们使用块多色重新排序来解决有限的并行性问题,使用一个Xeon Phi协处理器实现21个GFLOPS。这些优化将我们的HPCG实现与从主内存流式传输大多数数据并依赖多色重新排序实现并行性的其他实现区分开来。我们的优化实现在具有各种配置的集群中进行了评估,我们发现,像Dragonfly这样的低直径高基数网络拓扑由于快速的全减集合实现了高并行效率。此外,我们证明了我们的优化不仅有利于基于结构化三维网格的HPCG数据集,而且还有利于广泛的非结构化矩阵<\/jats:p>“,”DOI“:”10.1177\/1094342015593157“,”type“:”journal-article“,”created“:{”date-parts“:[[2015,7,1]],”date-time“:”2015-07-01T01:05:31Z“,”timestamp“:1435712731000},”page“:d-by-count“:11,”title“:[”基于IA的多核和多核处理器的高性能共轭梯度基准优化“],”前缀“:”10.1177“,”卷“:”30“,”作者“:[{”给定“:”Jongsoo“,”家族“:”Park“,”sequence“:”first“,”affiliation“:[}”name“:”美国英特尔公司并行计算实验室“}]},{”given“:”Mikhail“,“family”:“Smelyanskiy”,“sequence”:“”additional“,”affiliation“:[{“name”:“美国英特尔公司并行计算实验室”}]},{“given”:“Karthikeyan”,“family”:“Vaidyanathan”,“sequence”:“additional”,“affiliation:[{”name“:“印度英特尔公司并行计算机实验室”}]},}“giving”:“Alexander”,”family“:”Heinecke“,”sequence“:”additional美国英特尔公司并行计算实验室“}]},{“given”:“Dhiraj D”,“family”:“Kalamkar”,“sequence”:“additional”,“affiliation”:[{“name”:“印度英特尔公司并行计算实验室”}]},{”given“:”Md Mosotofa Ali“,”family“:”Patwarve“,”sequence“:”additional“,“affaliation”:[{”name“:”美国英特尔公司并行计算实验室“}]},{“given”:“Vadim”,“family”:“Pirogov”,“sequence”:“additional”,“affiliation”:[{“name”:“Software and Service Group,Intel Corporation,Russia”{]}given“:”Xing“,”family“:”Liu“,”sequence“:”additional“,”affiliation“:[{”name“:”T.J.Watson Research Center,IBM Research,USA“}]},{”given”:“Carlos”,“family”:“Rosales”,”se序列“:”additional“、”affidiation“:”[{“name”:“Texas Advanced Computing Center,University of Texas at Austin,USA”}]},{“given:”Cyril“,”家族“:”Mazauric“,”序列“:affiliation“:[{”name“:”法国布尔应用与性能团队“}]},{”given“:”Christopher“,”family“:”Daley“,”sequence“:”additional“,”affiliance“:[}”name”:“美国劳伦斯伯克利国家实验室国家能源研究科学计算中心”}]}],“member”:“179”,“published-on-line”:{“date-parts”:[[2015,6,29]]}bibr1-109432015593157“,“doi-asserted-by”:“publisher”,“doi”:“10.1145\/582034.582038”},{“key”:“bibr2-1094320155.93157”,“doo-asserted-by”:”publisher“,“doi:”10.1142\/S0129053389000056“},“key“:”bibr3-1094342015593157“,”volume-title“极端规模解算器研讨会报告:向未来架构的过渡”,“author”:“Ang J”,“year”:“2012”},{“key”:“bibr4-1094342015593157”,“doi-asserted-by”:“publisher”,”doi“:”10.1137\/100798806“},{”key“:”bibr5-109432015593157“,”doi-assert-by“:”publisher“,”doi:“10.1109\/SBAC-PAD.2014.10,{“key”:“bibr7-1094342015593157”,“doi-asserted-by”:“crossref”,“非结构化”:“Dongarra J,Heroux MA(2013)《迈向高性能计算系统排名的新标准》,技术报告第4744号。桑迪亚国家实验室。“,”DOI“:”10.2172\/1089988“},{”key“:”bibr8-1094342015593157“,”DOI-asserted-by“:”publisher“,by“:”publisher“,”DOI“:”10.1145\/2513109.2513110“},{”key“:”bibr11-1094342015593157“,“doi-asserted-by”:“publisher”,“doi”:“10.1016\/j.parco.2013.06.001”},{“key”:“bibr12-1094342015.593157”,“doo-asserted-by”:”publisher“,”doi“:”10.1016\/S0168-9274(01)00115-5“},”{“key”:”bibr13-109434205593157“,”doi-assert-by“:”publiver“,”doi“:“10.1109\/IPDPS.2012.51“},{”key“:”bibr14-1094342015593157“,”doi-asserted-by“:”publisher“,”DOI“:”10.1023\/A:1021738303840“},{“key”:“bibr15-109432015593157”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1109\/ISCA.2008.19”},“key“:”bibr16-109434205593157“,”DOI-assert-by“:”publisher y“:”publisher“,”DOI“:”10.1109\/DCABES.2014.6“},{”key“:”bibr18-1094342015593157“,”doi-asserted-by“:”publisher“,”doi“:”10.1145\/2464996.2465013“},{“key”:“bibr19-109434205593157”,“doi-assert-by”:“publisher”,“doi”:“10.1109\/PADSW.2014.7097852”},“key“:”bibr20-1094342015593157“,“volume-title”:“”第五届高性能计算机系统性能建模、基准测试和仿真国际研讨会(PMBS14)”,“作者”:“Marjanovi\u0107 V”,“年份”:“2014”},{“关键”:“bibr21-1094342015593157”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/s00607-009-0066-3”}、{“键”:“bibr22-109434205593157“,”doi-assert-by“发布者”,“doi”:10.1007\/978-3-642-11515-8_10“},{“key”:“bibr23-1094342015593157”,“unstructured”:“Naumov M(2011)GPU上预处理迭代方法中稀疏三角线性系统的并行解。技术报告001。NVIDIA公司。“},{”key“:”bibr24-1094342015593157“,”volume-title“:”SIAM exascale应用数学挑战与机遇研讨会“,”author“:”Naumov M“,”year“:”2014“}、{”key“:“bibr25-1094342015 593157”,”doi-asserted-by“:”publisher“,”doi“:”10.1007\/978-3-1907518-1_8“}“:”10.1109\/SC.2014.82“},{“key”:“bibr28-109434205593157”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/978-3642-23397-5_24”},}“key”:”bibr29-1094342015593157“,“volume-title”:“第五届高性能计算机系统性能建模、基准测试和仿真国际研讨会(PMBS14)”,“author”:“Phillips E”,“year”:“2014”}、{“key”:“bibr30-1094342015593157“,”doi-asserted-by“:”publisher“,“doi”:“10.1137\/0724090”},{“key”:“bibr31-1094342015593157”,“doi-assert-by”:“publisher”,”doi“:”10.1016\/0167-8191(92)90041-5“},“key“:”bibr32-109434205593157“,”doi-asserted-by““:”bibr33-1094342015593157“,”doi-asserted-by“:”publisher“,”doi“:”10.1137\/0911008“},{“key”:“bibr34-1094342015593157”,“doi-asserted-by”:“publisher”,“doi”:“10.1177\/109442004195”},}“key:”bibr35-109434205593157“,”doi-assert-by“:”publisher“,”doi“:”10.1145\/1183401.1183423“}10.1145\/331532.331563“},{“密钥”:“bibr37-1094342015593157”,“doi由“:”publisher断言,“doi”:“10.1109\/SC.2012.85”},{“key”:“bibr38-1094342015593157”,“doi由”断言:“publisher”,“doi”:“10.1007\/978-3-642-19328-6_6”}],“container title”:[“The International Journal of High Performance Computing Applications”],“original title”:[],“language”:“en”,“link”:[{“URL”:“http:\/\/journals.sagepub.com\/doi\/pdf\/10.1177\/10944342015593157”,“内容类型”:“应用程序\/pdf”,“内容版本”:“vor”,“预期应用程序”:“文本挖掘”},{“URL”:“http:\/\/journals.sagepub.com\/doi\/full-xml\/10.1177\/10944342015593157”,“内容类型”:“应用程序\/xml”,“内容版本”:“vor”,“预期应用程序”:“文本挖掘”},{“URL”:“http:\/\/journals.sagepub.com/doi\/pdf\/10.1177\/1094342015593157“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2021,5,9]],”date-time“:“2021-05-09T02:03:40Z”,”timestamp“:162052582000},”score“:1,”resource“:”{“primary”:{“URL”:“http:\/\/journals.sagepub.com/doi\/10.1177\/1094342015593157“}},”副标题“:[],”短标题“:[],”已发布“:{”日期-部件“:[[2015,6,29]]},“参考计数”:37,“日志发布”:{“问题”:“1”,“发布-版本”:{“日期-部件”:[[2016,2]},‘替代id’:[“10.1177\/109434015593157”],“URL”:“http://\/dx.doi.org\/10.1177\/1094342015593157”,“关系”:{},“ISSN“:[”1094-3420“,”1741-2846“],”ISSN-type“:[{”value“:”1094-34.20“,“type”:“print”},{”value“:”1741-2346“,”type“:”electronic“}],“subject”:[],“published”:{“date-parts”:[[2015,6,29]]}}}}