×

系统上Lanczos方法的稠密矩阵和块运算的GPU加速。 (英文) Zbl 1434.94077号

摘要:密集矩阵和块的代数运算限制了块Lanczos-Montgomery方法的可扩展性,该方法用于RSA分解问题中的线性部分。本文探讨了在域(mathbb)上实现以下代数运算的可能性{F} _2\)关于GPU:(1)两个(64k乘64k)矩阵的乘法;(2) 两个(N乘以64k)块的乘法。对于矩阵乘法,我们考虑两种算法:(a)“朴素”算法;(b) 4名俄罗斯人的“快速”算法。对于块乘法,我们只考虑“朴素”算法。似乎到目前为止,这是BLAS加速度超过\(\mathbb的唯一工作{F} _2\)在GPU上加速相对成功。

MSC公司:

94A60型 密码学
11T71型 代数编码理论;密码学(数论方面)
2016年11月 数字理论算法;复杂性
68瓦10 计算机科学中的并行算法

软件:

M4RI系列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] D.Coppersmith,“通过块Wiedemann算法求解GF(2)上的齐次线性方程”,数学。计算。62 (205) (1994). ·Zbl 0805.65046号
[2] E.Thome,“矩阵序列线性生成器的快速计算及其在块Wiedemann算法中的应用”,《符号和代数计算国际会议论文集》,2001年,第323-331页·Zbl 1356.68296号
[3] Kleinung,T.公司。;等。,768位RSA模的因式分解,Lect。注释计算。科学。,6233, 333-350 (2010) ·Zbl 1196.11167号 ·doi:10.1007/978-3-642-14623-7_18
[4] 托姆,E。;等。,使用CADO-NFS对RSA-704进行因子分解(2012年)
[5] Thome,E.,向量较少的改进块Lanczos算法(2016)
[6] 北卡罗来纳州扎马拉什金。;Zheltkov,D.,减少数据交换的Block Lanczos-Montgomery方法,俄罗斯超级计算日,Commun。计算。通知。科学。,687, 15-26 (2016)
[7] 北卡罗来纳州扎马拉什金。;Zheltkov,D.,大素数有限域上系统Lanczos方法的稠密矩阵和块运算的GPU加速,俄罗斯超级计算日,Commun。计算。通知。科学。,793, 14-26 (2017)
[8] Zamarashkin,N.L。;Zheltkov,D.A.,基于GPU的并行块Lancoz解算器加速,Lobachevskii J.Math。,39, 596-602 (2018) ·Zbl 1483.65057号 ·doi:10.1134/S1995080218040169
[9] Montgomery,P.,用于查找GF(2)上依赖关系的块Lanczos算法(1995)·Zbl 0973.11520号
[10] Zheltkov,D.A.,有限域上大型稀疏线性系统解的有效基本线性代数运算,774-788(2016)
[11] N.L.Zamarashkin,《GF(2)上线性方程组的算法》,《教科书》(莫斯科高斯大学,2013年)[俄语]。
[12] M4RI库。https://bitbucket.org/malb/m4ri。2019年访问。
[13] M.Albrecht、B.Gregory和W.Hart,“算法898:GF(2)上稠密矩阵的高效乘法”,ACM Trans。数学。软件37(1)(2010)·Zbl 1364.65092号
[14] Tharaud,J。;Laurent,R.,《使用GPU的双元素域上的线性代数》(2010年)
[15] Demirel,D.,Effizientes Losen linearer Gleichungssysteme uber GF(2)mit GPU(2010年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。