阿尔胡塞因·法齐;马特伊·巴洛格;黄,Aja;托马斯·休伯特;贝纳迪诺·罗梅拉·佩雷斯;穆罕默德·巴雷卡坦;亚历山大·诺维科夫;Francisco J.R.鲁伊斯。;朱利安·施里特维瑟;Grzegorz Swirszcz公司;西尔弗,大卫;黛米斯·哈萨比斯;科利,普希米特 通过强化学习发现更快的矩阵乘法算法。 (英语) Zbl 1496.65060号 自然,伦敦 610,编号7930,47-53(2022). 摘要:提高基本计算算法的效率会产生广泛的影响,因为它会影响大量计算的整体速度。矩阵乘法就是这样一个原始任务,它发生在许多系统中,从神经网络到科学计算例程。使用机器学习自动发现算法提供了超越人类直觉的前景,并优于目前人类设计的最佳算法。然而,自动化算法发现过程是复杂的,因为可能的算法空间巨大。这里我们报告了一种基于AlphaZero的深度强化学习方法,用于发现任意矩阵乘法的有效且可证明正确的算法。我们的代理AlphaTensor经过训练,可以玩单人游戏,目标是在有限因子空间内找到张量分解。AlphaTensor发现的算法在许多矩阵大小上都优于最先进的复杂性。特别相关的是有限域中的矩阵(4乘4)的情况,据我们所知,AlphaTensor算法自50年前被发现以来首次改进了Strassen的两级算法。我们通过不同的用途进一步展示了AlphaTensor的灵活性:结构化矩阵乘法算法具有最先进的复杂性,并通过优化特定硬件上运行时的矩阵乘法提高了实际效率。我们的结果突出了AlphaTensor能够加快一系列问题的算法发现过程,并针对不同标准进行优化。 引用于7文件 MSC公司: 65层99 数值线性代数 65-04 与数值分析有关的问题的软件、源代码等 65年20月 数值算法的复杂性和性能 68T07型 人工神经网络与深度学习 软件:HOList公司;TensorFlow公司;阿尔法零;亚当;坦索拉布;日本宇宙航空公司;ATP增压;阿尔法张量 PDF格式BibTeX公司 XML格式引用 \textit{A.Fawzi}等人,《自然》,伦敦610,编号7930,47-53(2022;Zbl 1496.65060) 全文: 内政部 OA许可证