PHiPAC公司 swMATH ID: 4898 软件作者: Jeff A Bilmes;克尔斯特·阿萨诺维奇;Rich Vuduc;Sriram Iyer;吉姆·德梅尔(Jim Demmel);CheeWhye Chin;多米尼克·林 描述: BLAS3兼容快速矩阵乘法的PHiPAC(便携式高性能ANSI C)页面。BLAS3矩阵-矩阵运算通常具有很大的渐进优化潜力。不幸的是,它们通常需要为特定的机器和/或编译器手工编码,才能达到接近峰值的性能。我们开发了一种方法,可以自动实现此类例程的近峰值性能。首先,我们不是手工编写代码,而是生成参数化代码生成器,其参数与最终的机器性能密切相关。其次,生成的代码遵循PHiPAC(Portable High Performance Ansi C)编码建议,包括手动循环展开、显式删除代码块中不必要的依赖项(如果不删除,C语义将禁止许多优化)以及使用机器同情C构造。第三,我们开发了搜索脚本,用于为给定的代码生成器找到给定体系结构/编译器的最佳参数集。我们开发了一个与BLAS-GEMM兼容的多级缓存块矩阵乘法代码生成器,其性能已达到90左右 主页: http://www.icsi.berkeley.edu/~比尔/菲帕克/ 相关软件: 阿特拉斯;爆破;LAPACK公司;FFTW公司;mctoolbox软件;线性代数库;GEMM公司;螺旋形的;火焰;数学库;MKL公司;BLIS公司;开放式BLAS;PLAPACK系列;算法679;GEMMW公司;OSKI公司;精密路径指示器;SUMMA(总结);EISPACK公司 引用于: 48文件 全部的 前5名120位作者引用 7 詹姆斯·韦尔登·德梅尔 三 弗雷德·古斯塔夫森。 三 格雷格·亨利。 三 马库斯·科瓦希克 三 托马斯·沃尔特·劳贝尔 三 罗伯特·亚历山大 三 理查德·沃杜克(Richard W.Vuduc)。 三 魏ß,Christian H。 2 安徒生、比亚恩·斯蒂格 2 迈克尔·本德(Michael A.Bender)。 2 吉安弗兰科·比拉尔迪 2 D’Alberto,保罗 2 杰克·多加拉(Jack J.Dongarra)。 2 约翰·吉尔伯特。 2 约翰·甘纳尔斯(John A.Gunnels)。 2 讽刺,德罗 2 马蒂亚斯·科赫 2 吉里达尔·彭马萨尼 2 安东尼·佩蒂特 2 恩里克·金塔纳·奥尔蒂。 2 乌尔里奇·吕德 2 Jeremy G.西耶克。 2 史蒂文·索尔·斯基纳 2 帕维尔·苏马津 2 西万·托莱多 2 耶日·瓦希涅夫斯基 2 R.Clint Whaley 1 道格拉斯·阿伯丁 1 克利夫·阿什克拉夫特 1 查尔斯·奥德特 1 大卫·哈罗德·贝利 1 杰拉尔德·鲍姆加特纳 1 乔纳森·巴克斯特 1 奥拉夫·贝克曼 1 杰弗里·贝尔特 1 大卫·E·伯恩霍尔德(David E.Bernholdt)。 1 杰夫·比尔姆斯(Jeff A.Bilmes)。 1 L.S.布莱克福德。 1 拉里·卡特 1 Choi,Jaeyong先生 1 Yoojin钟 1 安德鲁·克利里。 1 丹尼尔·科奇奥娃 1 丹建聪 1 爱德华多·达泽维多。 1 阿曼多·德·朱斯蒂 1 克雷格·C·道格拉斯。 1 哈拉尔德·霍尔德。 1 斯坦利·艾森斯塔特(Stanley C.Eisenstat)。 1 埃里克·埃尔姆鲁特 1 马丁·法拉奇·科尔顿 1 珍妮·费兰特 1 Wilfried N.甘斯特。 1 科斯塔斯·古提斯(Costas E.Goutis)。 1 罗杰·格里姆斯。 1 塞缪尔·盖耶。 1 斯文·哈姆马林。 1 罗伯特·哈里森。 1 Yozo Hida 1 巴威·希琴科 1 胡乔纳森·约瑟夫 1 黄洪仁 1 Hunold、Sascha 1 弗朗西斯科·伊古尔。 1 Imamura、Toshiyuki 1 吉米·伊斯坎达尔 1 伊丽莎白·R·杰赛普。 1 杰里米·约翰逊。 1 伊萨克·琼森 1 科格斯特罗姆,波 1 威廉·莫顿·卡汉 1 纳塔利娅·卡林尼克 1 靖国神社卡纳达 1 Kang,Suh Y。 1 阿尼尔·卡普尔 1 沃尔夫冈·卡尔 1 Katagiri、Takahiro 1 凯莱福拉斯,瓦西利奥斯一世。 1 保罗·H·J·凯利。 1 铃木,托鲁 1 Peter M.W.Knijnenburg。 1 Kritikakou,Angeliki S。 1 黑田东彦 1 Dieter F.Kvasnicka。 1 约翰·格雷格·刘易斯 1 林·卡尔文 1 彼得·利尼克尔 1 Joseph W.H.Liu。 1 低,慈萌 1 安德鲁·卢姆斯代恩 1 埃米利奥卢克 1 迈克尔·马丁。 1 肯,直野 1 托马斯·R·纳尔逊。 1 亚历克斯·尼古拉 1 亚历山德鲁·尼古拉 1 拉杰什·尼什塔拉 1 马塞尔·努伊扬 1 博亚娜·诺里斯 1 迈克尔·波义耳。 …还有20多位作者 全部的 前5名17篇连载文章中引用 7 ACM数学软件汇刊 三 SIAM矩阵分析与应用期刊 2 并行与分布式计算杂志 2 并行与计算:实践与经验 1 计算 1 计算与应用数学杂志 1 理论计算机科学 1 算法杂志 1 并行计算 1 FGCS。未来一代计算机系统 1 超级计算杂志 1 SIAM审查 1 工程、通信和计算中的应用代数 1 ETNA公司。数值分析电子交易 1 计算机语言、系统和结构 1 软件-环境-工具 1 数学规划计算 全部的 前5名在9个字段中引用 30 数值分析(65-XX) 28 计算机科学(68至XX) 5 线性代数和多线性代数;矩阵理论(15-XX) 2 组合数学(05-XX) 2 常微分方程(34-XX) 2 运筹学、数学规划(90-XX) 1 阶、格、有序代数结构(06-XX) 1 偏微分方程(35-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文