第条免费访问 在上共享 Cyclops Tensor框架:减少通信并消除大规模并行收缩中的负载不平衡 作者: 埃德加·索洛莫尼克 查看配置文件 , 大卫·马修斯 查看配置文件 , 杰夫哈蒙德 查看配置文件 , 詹姆斯·德梅尔 查看配置文件 作者信息和声明 IPDPS’13:2013年IEEE第27届并行和分布式处理国际研讨会论文集2013年5月第813–824页https://doi.org/10.109/IPDPS.2013.112出版:2013年5月20日出版历史 IPDPS’13:2013 IEEE第27届并行和分布式处理国际研讨会会议记录Cyclops Tensor框架:减少通信并消除大规模并行收缩中的负载不平衡第813–824页 上一个第章下一步第章 摘要 Cyclops(cyclic-operations)张量框架(CTF)是张量收缩的分布式库。CTF的目标是将高维张量收缩(如耦合簇(CC)电子结构方法中所需的张量收缩)扩展到大规模并行超级计算机。该框架通过循环细分张量来保持张量结构,从而产生规则的并行分解。内部虚拟化层提供完全通用的映射支持,同时保持理想的负载平衡。映射框架通过显式计算内存使用量和通信量,确定运行时每个张量收缩的最佳映射。CTF使用了一个通用的重新分配内核,它在任意分布式布局之间转换任意维的张量,但只接触每一块数据一次。通过张量索引转置和部分解包,序列对称压缩被简化为矩阵乘法调用。用户级界面以领域特定语言的形式优雅地表达了任意维广义张量收缩。我们在Blue Gene/Q的8192个节点上演示了单激励和双激励CC的性能,并表明在基准系统的Cray XE6超级计算机上,CTF的性能优于NWChem。 引用人查看全部 建议 用于耦合簇计算的大规模并行张量收缩框架 用耦合簇等方法精确计算分子电子波函数需要计算张量压缩,其代价是对系统和基集大小进行多项式计算缩放。每个。。。阅读更多信息基于稀疏和稠密并行张量压缩的分布式内存DMRGSC’20:高性能计算、网络、存储和分析国际会议记录 密度矩阵重整化群(DMRG)算法是求解量子系统特征值问题的有力工具。DMRG依靠张量收缩和稠密线性代数来计算凝聚态物理系统的性质。。。阅读更多信息一种高性能类GEMM张量-张量乘法的设计 我们提出了“类GEMM张量-张量乘法”(GETT),这是一种用于密集张量压缩的新方法,反映了高性能通用矩阵-矩阵乘法(GEMM)的设计。GETT背后的关键洞察力是识别。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此出版物 问询处贡献者发布于 IPDPS’13:2013 IEEE第27届并行和分布式处理国际研讨会会议记录2013年5月1255页国际标准图书编号:9780769549712 赞助商合作中出版商IEEE计算机学会美国 出版历史 出版:2013年5月20日 作者标记耦合集群独眼巨人通信避免算法张量收缩限定符第条会议 资金来源 其他指标查看文章指标文献计量学引文20文章指标20引文总数查看引文0总下载次数下载次数(过去12个月)0下载次数(最近6周)0其他指标查看作者指标引用人查看全部数字版以数字版本查看这篇文章。查看数字版数字其他共享此出版物链接https://dl.acm.org/doi/10.109/IPDPS.2013.112复制链接在社交媒体上分享 在上共享 0工具书类