Intel、AMD和Fujitsu处理器上成批、小型和矩形矩阵乘法的缓存优化和性能建模
摘要
工具书类
建议
基于Fermi GPU的缓存阻塞法优化稀疏矩阵向量乘法 SNPD’12:2012年第13届ACIS软件工程、人工智能、网络和并行/分布式计算国际会议论文集 稀疏矩阵向量乘法(SpMV)的性能调整是一项重要任务,但由于其不规则性,这也是一项困难的任务。 在本文中,我们提出了一种缓存阻塞方法来提高SpMV在新兴网络上的性能。。。 在SW26010多核处理器上实现高效的批量矩阵乘法 我们提出了一种在Sunway TaihuLight超级计算机的SW26010多核处理器上优化批量矩阵乘法的系统方法。 提出了五种代理算法和一种基于机器学习的算法选择器,以充分。。。
评论
信息和贡献者
问询处
发布于
出版商
出版历史
检查更新
作者标记
限定符
研究文章
资金来源
JSPS KAKENHI公司 日本跨学科大规模信息基础设施联合使用/研究中心