北卡罗来纳州扎马拉什金。;Zheltkov博士。 系统上Lanczos方法的稠密矩阵和块运算的GPU加速。 (英文) Zbl 1434.94077号 Lobachevskii J.数学。 40,第11期,1881-1891(2019). 摘要:密集矩阵和块的代数运算限制了块Lanczos-Montgomery方法的可扩展性,该方法用于RSA分解问题中的线性部分。本文探讨了在域(mathbb)上实现以下代数运算的可能性{F} _2\)关于GPU:(1)两个(64k乘64k)矩阵的乘法;(2) 两个(N乘以64k)块的乘法。对于矩阵乘法,我们考虑两种算法:(a)“朴素”算法;(b) 4名俄罗斯人的“快速”算法。对于块乘法,我们只考虑“朴素”算法。似乎到目前为止,这是BLAS加速度超过\(\mathbb的唯一工作{F} _2\)在GPU上加速相对成功。 MSC公司: 94A60型 密码学 11T71型 代数编码理论;密码学(数论方面) 2016年11月 数字理论算法;复杂性 68瓦10 计算机科学中的并行算法 关键词:可扩展性;块Lanczos-Montgomery方法 软件:M4RI系列 PDF格式BibTeX公司 XML格式引用 \textit{N.L.Zamarashkin}和\textit{D.A.Zheltkov},Lobachevskii J.数学。40,第11号,1881-1891(2019;Zbl 1434.94077) 全文: 内政部 参考文献: [1] D.Coppersmith,“通过块Wiedemann算法求解GF(2)上的齐次线性方程”,数学。计算。62 (205) (1994). ·Zbl 0805.65046号 [2] E.Thome,“矩阵序列线性生成器的快速计算及其在块Wiedemann算法中的应用”,《符号和代数计算国际会议论文集》,2001年,第323-331页·Zbl 1356.68296号 [3] Kleinung,T.公司。;等。,768位RSA模的因式分解,Lect。注释计算。科学。,6233, 333-350 (2010) ·Zbl 1196.11167号 ·doi:10.1007/978-3-642-14623-7_18 [4] 托姆,E。;等。,使用CADO-NFS对RSA-704进行因子分解(2012年) [5] Thome,E.,向量较少的改进块Lanczos算法(2016) [6] 北卡罗来纳州扎马拉什金。;Zheltkov,D.,减少数据交换的Block Lanczos-Montgomery方法,俄罗斯超级计算日,Commun。计算。通知。科学。,687, 15-26 (2016) [7] 北卡罗来纳州扎马拉什金。;Zheltkov,D.,大素数有限域上系统Lanczos方法的稠密矩阵和块运算的GPU加速,俄罗斯超级计算日,Commun。计算。通知。科学。,793, 14-26 (2017) [8] Zamarashkin,N.L。;Zheltkov,D.A.,基于GPU的并行块Lancoz解算器加速,Lobachevskii J.Math。,39, 596-602 (2018) ·Zbl 1483.65057号 ·doi:10.1134/S1995080218040169 [9] Montgomery,P.,用于查找GF(2)上依赖关系的块Lanczos算法(1995)·Zbl 0973.11520号 [10] Zheltkov,D.A.,有限域上大型稀疏线性系统解的有效基本线性代数运算,774-788(2016) [11] N.L.Zamarashkin,《GF(2)上线性方程组的算法》,《教科书》(莫斯科高斯大学,2013年)[俄语]。 [12] M4RI库。https://bitbucket.org/malb/m4ri。2019年访问。 [13] M.Albrecht、B.Gregory和W.Hart,“算法898:GF(2)上稠密矩阵的高效乘法”,ACM Trans。数学。软件37(1)(2010)·Zbl 1364.65092号 [14] Tharaud,J。;Laurent,R.,《使用GPU的双元素域上的线性代数》(2010年) [15] Demirel,D.,Effizientes Losen linearer Gleichungssysteme uber GF(2)mit GPU(2010年) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。