跳到主要内容
研究论文

塔斯帕克:绘制、列子集选择、回归和利用分数的并行算法和数据结构

出版:2022年12月19日 出版历史
  • 获取引文提醒
  • 摘要

    我们为数值线性代数中的三种基本运算提供了并行算法和数据结构:(i)高斯和CountSketch随机投影及其组合,(ii)Gram矩阵的计算,以及(iii)两个矩阵乘积的平方行范数的计算,特别关注“身高与瘦”矩阵,在许多应用中都会出现。我们详细分析了普遍存在的CountSketch变换及其与高斯随机投影的结合,考虑到内存需求、计算复杂性和工作负载平衡。我们还演示了如何将这些结果应用于列子集选择、最小二乘回归和杠杆得分计算。这些工具已在塔斯帕克是一个公开可用的Python包,其核心是用C++编写的,并与OpenMP并行,与SciPy和NumPy的标准矩阵数据结构兼容。大量的数值实验表明,对于高瘦矩阵,所提出的算法具有良好的伸缩性,显著优于现有的库。

    工具书类

    [1]
    迪米特里斯·阿奇利奥普塔斯。2001.数据库友好型随机预测。第20届ACM数据库系统原理研讨会论文集. 274–281.
    [2]
    尼尔·艾隆和伯纳德·夏泽尔。2006年,近似近邻和快速johnson-lindenstrauss变换。第38届ACM计算理论研讨会论文集. 557–563.
    [3]
    尼尔·艾隆和爱多·利伯蒂。2009.使用双BCH码上的雷达码系列快速降维。离散。计算。地理。42, 4 (2009), 615.
    [4]
    艾哈迈德·阿洛伊和迈克尔·马奥尼。2015.具有统计保证的快速随机核岭回归。神经信息处理系统研究进展C.Cortes、N.Lawrence、D.Lee、M.Sugiyama和R.Garnett(编辑),第28卷。Curran Associates公司。
    [5]
    乔什·阿尔曼(Josh Alman)和弗吉尼亚·瓦西列夫斯卡·威廉姆斯(Virginia Vassilevska Williams)。2021.改进的激光方法和更快的矩阵乘法。ACM-SIAM离散算法研讨会论文集.暹罗,522-539。
    [6]
    Hartwig Anzt、Terry Cojean、Yen Chen Chen、Goran Flegar、Fritz Göbel、Thomas Grützmacher、Pratik Nayak、Tobias Ribizel和Yu Hsiang Tsai。2020年。银杏:高性能数值线性代数库。J.开源软件。5, 52 (2020), 2260.
    [7]
    维维亚娜·阿里戈尼、菲利波·马吉奥利、安娜丽莎·马西尼和伊曼纽尔·罗德拉。2021.矩阵与其转置的基于strassen的高效并行乘法。第50届并行处理国际会议记录计算机械协会,纽约州纽约市,12。内政部:
    [8]
    哈伊姆·艾夫伦(Haim Avron)。2010.使用随机矩阵迹估计计算大型图中的三角形。大规模数据挖掘研讨会:理论与应用,第10卷。10–9.
    [9]
    Haim Avron和Christos Boutsidis。2013.更快地选择矩阵和应用程序的子集。SIAM J.矩阵分析。申请。34, 4 (2013), 1464–1499.
    [10]
    Haim Avron、Kenneth L.Clarkson和David P.Woodruff。2017.使用草图和预处理加快核岭回归。SIAM J.矩阵分析。申请。38, 4 (2017), 1116–1138.
    [11]
    Haim Avron和Lior Horesh。2015.使用时间相关的个性化pagerank进行社区检测。第32届机器学习国际会议论文集PMLR,1795-1803年。
    [12]
    H.Avron、P.Maymounkov和S.Toledo。2010.Blendenpik:增压LAPACK的最小二乘解算器。SIAM J.科学。计算。32, 3 (2010), 1217–1236.
    [13]
    Haim Avron和Vikas Sindhwani。2016.具有隐式分布式优化和随机化的高性能内核机器。技术计量学58, 3 (2016), 341–349.
    [14]
    阿里夫·阿扎德(Ariful Azad)、格雷·巴拉德(Grey Ballard)、艾丁·布鲁克(Aydin Buluc)、詹姆斯·德梅尔(James Demmel)、劳拉·格里戈里(Laura Grigori)、奥德·施瓦茨(Oded Schwartz)、西万·托莱多(。2016.在稀疏矩阵-矩阵乘法中利用多级并行性。SIAM J.科学。计算。38、6(2016),C624–C651。
    [15]
    米塔利·巴夫纳和尼基尔·维亚斯。2021.线性方程近似的最佳细粒度硬度。第48届国际自动化、语言和编程学术讨论会会议记录Dagstuhl-Leibniz-Zentrum für Informatik宫。
    [16]
    Afonso S.Bandeira、Amit Singer和Thomas Strohmer。2020数据科学数学。检索自https://people.math.ethz.ch/abandeira/BandeiraSingerStrohmer-MDS-draft.pdf.
    [17]
    Christos Boutsidis、Michael W.Mahoney和Petros Drineas。2009.列子集选择问题的改进近似算法。第20届ACM-SIAM离散算法研讨会论文集. 968–977.
    [18]
    艾丁·布卢克和约翰·R·吉尔伯特。关于超解析矩阵的表示和乘法。IEEE国际并行与分布式处理研讨会(IPDPS’08)会议记录IEEE,1-11。
    [19]
    艾德·恩·布鲁索和约翰·吉尔伯特。2011.组合BLAS:设计、实施和应用。国际期刊高性能计算。申请。25, 4 (2011), 496–509.
    [20]
    Coralia Cartis、Jan Fiala和Zhen Shao。2021.最佳维的散列嵌入,应用于线性最小二乘。arXiv:2105.11815。检索自https://arxiv.org/abs/2105.11815.
    [21]
    Moses Charikar、Kevin Chen和Martin Farach-Colton。2002.在数据流中查找经常出现的项目。第29届自动化、语言和程序设计国际学术讨论会会议记录施普林格,693–703。
    [22]
    纳迪亚·切普尔科(Nadiia Chepurko)、肯尼斯·克拉克森(Kenneth L Clarkson)、普拉尼斯·卡查姆(Praneeth Kacham)和大卫·P·伍德拉夫(David P Woodruff)。2022.当前矩阵乘法时间内线性代数的近优算法。2022年ACM-SIAM离散算法研讨会论文集.暹罗,3043–3068。
    [23]
    何义祥、周国忠和刘立芝。2013.快速矩阵排序算法和应用。美国临床医学杂志60, 5 (2013), 1–25.
    [24]
    Ali Civril,2014年。列子集选择问题是UG-hard。J.计算。系统。科学。80, 4 (2014), 849–859.
    [25]
    肯尼思·克拉克森(Kenneth L.Clarkson)和大卫·伍德拉夫(David P.Woodruff)。2017年,输入稀疏时间的低秩近似和回归。美国临床医学杂志第63、6条,第54条(2017年1月),54:1–54:45页。
    [26]
    迈克尔·科恩。2016.通过迹不等式进行几乎紧密的不经意子空间嵌入。第27届ACM-SIAM离散算法研讨会论文集. 278–287.
    [27]
    迈克尔·科恩(Michael B.Cohen)、山姆·埃尔德(Sam Elder)、卡梅隆·马斯科(Cameron Musco)、克里斯托弗·马斯科和马达琳娜·佩尔苏(Madalina Persu)。2015。k均值聚类和低秩近似的降维。第47届ACM计算理论研讨会论文集. 163–172.
    [28]
    迈克尔·科恩(Michael B.Cohen)、李彦达(Yin Tat Lee)、卡梅隆·马斯科(Cameron Musco)、克里斯托弗·马斯科、理查德·彭(Richard Peng)和亚伦·西德福德(Aaron Sidford)。2015。矩阵近似的均匀采样。2015年理论计算机科学创新会议录ACM出版社,纽约,181-190。
    [29]
    迈克尔·科恩、卡梅隆·马斯科和克里斯托弗·马斯科。2017.通过岭杠杆得分抽样输入稀疏时间低阶近似。第28届ACM-SIAM离散算法研讨会论文集. 1758–1777.
    [30]
    莱昂纳多·达贡和拉梅什·梅农。1998年。OpenMP:用于共享内存编程的行业标准API。IEEE计算。科学。工程师。5, 1 (1998), 46–55.
    [31]
    Yogesh Dahiya、Dimitris Konomis和David P.Woodruff。2018.数字线性代数素描的实证评估。第24届ACM SIGKDD知识发现和数据挖掘会议记录. 1292–1300.
    [32]
    蒂莫西·戴维斯(Timothy A.Davis)。2006稀疏线性系统的直接方法.暹罗。内政部:
    [33]
    米查尔·德里金斯基(Michal Derezinski)、乔纳森·拉科特(Jonathan Lacotte)、默特·皮兰奇(Mert Pilanci)和迈克尔·马奥尼(Michael W.Mahoney)。2021.无牛顿:无需权衡草图牛顿更新的稀疏化。神经信息处理系统研究进展第34卷(2021年)。
    [34]
    米查尔·德里金斯基(Michal Derezinski)、廖振宇(Zhenyu Liao)、埃德加·多布里班(Edgar Dobriban)和迈克尔·马奥尼(Michael Mahoney)。2021.稀疏草图,反转偏差较小。学习理论会议记录PMLR,1467-1510年。
    [35]
    彼得·德里尼亚斯(Petros Drineas)、马利克·马格登·伊斯梅尔(Malik Magdon-Ismail)、迈克尔·马奥尼(Michael W.Mahoney)和大卫·伍德拉夫(David P.Woodruff)。2012.矩阵一致性和统计杠杆的快速近似。J.马赫。学习。物件。13, 1 (2012), 3475–3506.
    [36]
    P.Drineas、M.W.Mahoney、S.Muthukrishnan和T.SarlóS。2010.更快的最小二乘近似。数字。数学。117,2(2010年10月),219-249。内政部:
    [37]
    伊恩·达夫(Iain S.Duff)、迈克尔·赫罗克斯(Michael A.Heroux)和罗尔丹·波佐(Roldan Pozo)。2002.稀疏基本线性代数子程序概述:BLAS技术论坛的新标准。ACM事务处理。数学。柔和。28, 2 (2002), 239–267.
    [38]
    Jean-Guillaume Dumas、Clement Pernet和Alexandre Sedoglavic。2020.关于矩阵与其转置的快速乘法。第45届符号与代数计算国际研讨会(ISSAC’20)会议记录. 162–169.
    [39]
    扁钢研究所。sparse_dot_mkl。检索自https://github.com/flatironinstitute/sparse_dot.
    [40]
    弗朗索瓦·勒加尔和弗洛伦特·乌鲁蒂亚。2018.coppersmith-winograd张量的幂改进了矩形矩阵乘法。第29届ACM-SIAM离散算法研讨会论文集SIAM,1029–1046年。
    [41]
    Alex Gittens和Michael W.Mahoney。2013年,重新审视Nyström方法,以改进大规模机器学习。第30届国际会议记录。机器学习会议第28卷,567–575。
    [42]
    盖尔·根尼鲍德(Gaöl Guennebaud)、贝诺·雅各布(Benoêt Jacob)等人。2010年,Eigen v3。检索自网址:http://eigen.tuxfamily.org.
    [43]
    弗雷德·古斯塔夫森。1978.稀疏矩阵的两种快速算法:乘法和置换置换。ACM事务处理。数学。柔和。4, 3 (1978), 250–269.
    [44]
    IBM公司。IBM工程与科学子程序库。检索自https://www.ibm.com/docs/en/essl.
    [45]
    彼得罗·因迪克(Piotr Indyk)和拉杰夫·莫特瓦尼(Rajeev Motwani)。1998年,《近似近邻:消除维度诅咒》。第30届ACM计算理论研讨会论文集. 604–613.
    [46]
    英特尔公司。英特尔oneAPI数学内核库。检索自https://www.intel.com/content/www/us/en/developer/tools/oneapi/onemkl.html.
    [47]
    威廉·约翰逊和乔兰·林登斯特劳斯。1984.lipschitz映射到hilbert空间的扩展。康斯坦普。数学。26, 1 (1984), 189–206.
    [48]
    丹尼尔·凯恩(Daniel M.Kane)和杰拉尼·尼尔森(Jelani Nelson)。2014年,Sparser johnson-lindenstrauss转型。J.ACM公司61, 1 (2014), 1–23.
    [49]
    迈克尔·卡普拉洛夫(Michael Kapralov)、瓦姆西·波特鲁鲁(Vamsi Potluru)和大卫·伍德拉夫(David Woodruff)。2016。如何伪乘高斯矩阵。在第33届机器学习国际会议论文集. 2101–2110.
    [50]
    杰里米·凯普纳和约翰·吉尔伯特。2011线性代数语言中的图算法.暹罗。
    [51]
    G.Kollias、H.Avron、Y.Ineichen、C.Bekas、A.Curioni、V.Sindhwani和K.Clarkson。2015.libSkylark:统计计算的高性能矩阵绘制框架。高性能计算、网络、存储和分析国际会议记录.
    [52]
    尤金尼亚·玛丽亚·科托普卢奥(Eugenia-Maria Kontopoulou)、格雷戈里·保罗·德克斯特(Gregory-Paul Dexter。2020年。估计密度矩阵冯·诺依曼熵的随机线性代数方法。IEEE传输。Inf.理论66, 8 (2020), 5003–5021.
    [53]
    Kornilios Kourtis、Georgios Goumas和Nectarios Koziris,2008年。使用索引和值压缩优化稀疏矩阵-向量乘法。第五届计算机前沿会议记录. 87–96.
    [54]
    Kornilios Kourtis、Vasileios Karakasis、Georgios Goumas和Nectarios Koziris,2011年。CSX:共享内存系统上spmv的扩展压缩格式。ACM SIGPLAN非。46, 8 (2011), 247–256.
    [55]
    格里戈兹·克瓦希涅夫斯基(Grzegorz Kwasniewski)、塔尔·本·农(Tal Ben-Nun)、亚历山德罗斯·尼古拉·齐奥加斯(Alexandros Nikolaos Ziogas)、蒂莫·施奈德(Timo Schneider)、梅西耶·贝斯塔(Maciej Besta。线性代数核的并行I/O优化:近最优LU分解。第26届ACM SIGPLAN并行编程原理与实践研讨会论文集(PPoPP'21). 463–464.
    [56]
    格列戈兹·克瓦希涅夫斯基(Grzegorz Kwasniewski)、马尔科·卡比奇(Marko Kabić)、马西耶·贝斯塔(Maciej Besta)、乔斯特·范德冯德勒(Joost VandeVondele)、拉斐尔·索尔卡(Raffaele Solcá)和托。2019.重温红蓝卵石:接近最优的并行矩阵-矩阵乘法。高性能计算、网络、存储和分析国际会议记录. 1–22.
    [57]
    Rasmus Kyng、Di Wang和Peng Zhang。2020年。假设线性方程很难求解,包装LP很难精确求解。第31届ACM-SIAM离散算法研讨会论文集.暹罗,279-296。
    [58]
    穆力、加里·米勒和理查德·彭。2013.迭代行采样。第54届IEEE计算机科学基础年会论文集. 127–136.
    [59]
    李平(Ping Li)、特雷弗(Trevor J.Hastie)和肯尼思(Kenneth W.Church)。2006.非常稀疏的随机预测。第十二届ACM SIGKDD知识发现和数据挖掘会议记录. 287–296.
    [60]
    George Marsaglia、Wai Wan Tsang等人。生成随机变量的ziggurat方法。J.统计软件。5, 8 (2000), 1–7.
    [61]
    Per-Gunnar Martinsson和Joel A.Tropp。2020.随机数值线性代数:基础和算法。Acta Numer公司。29 (2020), 403–572.
    [62]
    梅克·迈尔和中村由纪夫。2021.快速随机数字秩估计。arXiv:2105.07388。检索自https://arxiv.org/abs/2105.07388.
    [63]
    孟祥瑞和迈克尔·马奥尼。2013.输入-稀疏时间中的低密度子空间嵌入和稳健线性回归的应用。第45届ACM计算理论研讨会论文集. 91–100.
    [64]
    孟祥瑞、迈克尔·桑德斯和迈克尔·马奥尼。2014.LSRN:强过定或欠定系统的并行迭代求解器。SIAM J.科学。计算。36,2(2014),C95–C118。
    [65]
    拉斐尔·梅耶、卡梅隆·马斯科、克里斯托弗·马斯科和大卫·伍德拉夫。2021.Hutch++:最优随机轨迹估计。算法简单性研讨会论文集(SOSA’21).暹罗,142–155。
    [66]
    卡梅隆·马斯科(Cameron Musco)、普拉尼斯·内特拉帕利(Praneeth Netrapalli)、亚伦·西德福德(Aaron Sidford)、沙珊卡·乌巴鲁(Shashanka Ubaru)和大卫·伍德拉夫。2018.超越快速矩阵乘法的频谱近似:算法和硬度。2018年第九届理论计算机科学创新会议录)莱布尼茨大教堂。
    [67]
    Jelani Nelson和Huy L.Nguyñn。2013.OSNAP:通过稀疏子空间嵌入实现更快的数值线性代数算法。IEEE计算机科学基础年度研讨会论文集. 117–126.
    [68]
    Jelani Nelson和Huy L.Nguyñn。2013.降维地图的稀疏性下限。第45届ACM计算理论研讨会论文集. 101–110.
    [69]
    F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay。2011.Scikit-learn:python中的机器学习。J.马赫。学习。物件。12 (2011), 2825–2830.
    [70]
    默特·皮兰奇(Mert Pilanci)和马丁·温赖特(Martin J.Wainwright)。2016年,迭代hessian草图:约束最小二乘的快速精确解近似。J.马赫。学习。物件。17, 1 (2016), 1842–1879.
    [71]
    默特·皮兰奇(Mert Pilanci)和马丁·温赖特(Martin J.Wainwright)。2017.牛顿草图:一种具有线性-二次收敛性的近似线性时间优化算法。SIAM J.Optim公司。27, 1 (2017), 205–245.
    [72]
    V.Rokhlin和M.Tygert。超定线性最小二乘回归的快速随机算法。程序。国家。阿卡德。科学。美国。105, 36 (2008), 13212–13217.
    [73]
    Youcef Saad。1990年。SPARSKIT:稀疏矩阵计算的基本工具包。检索自https://www-users.cse.umn.edu/saad/software/SPARSKIT/.
    [74]
    John K.Salmon、Mark A.Moraes、Ron O.Dror和David E.Shaw。2011.平行随机数:简单到1、2、3。2011年高性能计算、网络、存储和分析国际会议记录. 1–12.
    [75]
    塔马斯·萨洛斯。2006.通过随机投影改进大型矩阵的近似算法。第47届IEEE计算机科学基础年会论文集IEEE,143–152。
    [76]
    B.桑德斯、阿恩·斯托约翰恩和吉勒斯·维拉德。2004年矩阵等级认证。选举人。J.林·阿尔盖布。11 (2004), 16–23.
    [77]
    雅罗斯拉夫·希托夫。2021.列子集选择为NP-complete。Lin.代数。申请。610 (2021), 52–58.
    [78]
    Aleksandros Sobczyk和Efstratios Gallopoulos。2021.通过排名揭示方法和随机化估计杠杆得分。SIAM J.矩阵分析。申请。42,3(2021年1月),1199-1228。内政部:
    [79]
    Daniel A.Spielman和Nikhil Srivastava。2008。通过有效阻力进行图形稀疏。第40届ACM计算理论研讨会论文集(2008), 563.
    [80]
    安东尼奥·托拉尔巴(Antonio Torralba)、罗伯·弗格斯(Rob Fergus)和威廉·弗里曼(William T Freeman)。2008年,8000万张微小图像:用于非参数对象和场景识别的大型数据集。IEEE传输。模式分析。机器。智力。30, 11 (2008), 1958–1970.
    [81]
    乔尔·特罗普(Joel A.Tropp)。2011.改进了对子采样随机哈达玛变换的分析。高级自适应。数据分析。2012年1月3日(2011年),第115–126页。
    [82]
    罗曼·弗什宁。2018高维概率:数据科学导论及其应用第47卷。剑桥大学出版社。
    [83]
    保利·维塔宁(Pauli Virtanen)、拉尔夫·戈莫斯(Ralf Gommers)、特拉维斯·奥列芬特(Travis E.Oliphant)、马特·哈伯兰(Matt Haberland)、泰勒·雷迪(Tyler Reddy)、大卫·库纳波(David Cournapau)、叶夫根尼·布洛夫斯基(Evgeni Burovski)。2020年,SciPy 1.0:python中科学计算的基本算法。自然方法17, 3 (2020), 261–272.
    [84]
    Wei Wang、Minos Garofalakis和Kannan Ramchandran。2007.可再加细近似的分布式稀疏随机投影。第六届传感器网络信息处理国际会议论文集(IPSN'07). 331–339.
    [85]
    大卫·P·伍德拉夫。2014.草图作为数字线性代数的工具。已找到。趋势理论。计算。科学。10, 1–2 (2014), 1–157.
    [86]
    杨继燕、孟祥瑞和迈克尔·马奥尼。2015.在并行和分布式环境中实施随机矩阵算法。程序。电气与电子工程师协会104, 1 (2015), 58–92.
    [87]
    拉斐尔·尤斯特和乌里·兹威克。2005.快速稀疏矩阵乘法。ACM事务处理。阿尔戈。1, 1 (2005), 2–13.
    [88]
    钱左和华翔。2021.用于近似统计杠杆得分的量化算法。arXiv公司:2111.08915。检索自https://arxiv.org/abs/2111.08915.

    建议

    评论

    信息和贡献者

    问询处

    发布于

    数学软件上的封面图像ACM事务
    ACM数学软件汇刊 第48卷第4期
    2022年12月
    339页
    国际标准编号:0098-3500
    EISSN公司:1557-7295
    内政部:10.1145/3572845
    期刊目录

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2022年12月19日
    在线AM:2022年8月8日
    认可的:2022年7月21日
    修订过的:2022年2月28日
    收到:2021年7月5日
    发表于TOMS体积48,问题4

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 并行算法
    2. 稀疏数据结构
    3. 绘制草图
    4. 列子集选择
    5. 回归,回归
    6. 预处理
    7. 统计杠杆得分

    限定符

    • 研究文章
    • 推荐

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 0
      引文总数
    • 274
      总下载次数
    • 下载次数(过去12个月)138
    • 下载次数(最近6周)6

    其他指标

    引文

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    全文

    以全文形式查看本文。

    全文

    HTML格式格式

    在中查看本文HTML格式格式。

    HTML格式

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享