×

混合精度低阶近似及其在块低阶LU分解中的应用。 (英语) Zbl 1525.65038号

小结:我们介绍了一种新的方法来开发低阶近似的混合精度算法。我们的方法基于这样的观察,即与小奇异值相关的奇异向量可以以较低的精度存储,同时总体上保持高精度。我们提供了一个明确的标准来确定每个奇异向量所需的精度水平。我们将此方法应用于块低秩(BLR)矩阵,其中大多数非对角块具有低秩。我们提出了一种新的BLR LU分解算法,该算法利用了块的混合精度表示。我们对该算法进行了舍入误差分析,并证明了混合精度算法的使用不会影响BLR-LU分解的数值稳定性。此外,我们的分析确定了每个浮点运算(flop)所需的精度级别,因此指导我们实现既健壮又高效的实现。我们评估了这种新算法在一系列矩阵上的潜力,这些矩阵来自工业和学术应用中的实际问题。我们表明,使用fp64、fp32和bfloat16算法,LU因子和flop中用于执行BLR LU因子分解的大部分条目可以安全地切换到较低精度,从而显著减少存储和预期时间成本,最多可减少三倍。

MSC公司:

65层55 低阶矩阵逼近的数值方法;矩阵压缩
2015财年65 矩阵特征值和特征向量的数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔