×

使用GPU计算对协方差矩阵进行高性能处理。 (英语) Zbl 1431.65032号

摘要:许多统计算法的实际适用性受到相应协方差矩阵的大尺寸的限制。由于有效地使用协方差矩阵的结构、自相关函数的特性以及现代GPU体系结构的优势,这些局限性可以大大减弱。本文介绍了协方差矩阵反演算法的GPU实现,以及系数矩阵为协方差矩阵的线性方程组的求解。工作中还考虑了近似稀疏协方差阵的反演。对于所有考虑的情况,与Octave数学软件和ViennaCL计算库相比,获得了显著的加速度。例如,线性系统求解的实现算法比在CPU上实现Octave快6倍,比在通用矩阵GPU上实现ViennaCL快3倍。协方差矩阵的反演性能比CPU上的Octave反演算法快14倍,比GPU上的ViennaCL反演算法快6倍。

MSC公司:

65层10 线性系统的迭代数值方法
15个B05 Toeplitz、Cauchy和相关矩阵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.W.Robbins和T.J.Fisher,“两个多元时间序列之间独立性和因果关系测试的交叉相关矩阵”,《商业经济学杂志》。统计师。33, 459-473 (2015). ·doi:10.1080/07350015.2014.962699
[2] S.Efromovich和E.Smirnova,“功能磁共振成像产生的大互协方差和互相关矩阵的统计分析”,J.Biometr。生物学家。5 (2), 1 (2014).
[3] M.Jun,“全球多变量过程的非静态交叉协方差模型”,Scand。J.统计。38, 726-747 (2011). ·Zbl 1246.91113号 ·doi:10.1111/j.1467-9469.2011.00751.x
[4] D.E.Demidov、E.V.Mokshin和E.V.Birialtsev,“基于最大似然法在高度相关噪声条件下确定矩张量和微震事件位置”,地球物理学。前景。33, 437-449 (2017).
[5] N.Levinson,“滤波器设计和预测中的维纳RMS误差准则”,J.Math。物理学。25, 261-278 (1947). ·doi:10.1002/sapm1946251261
[6] E.H.Bareiss,“用Toeplitz矩阵和向量Toeplitz-矩阵数值求解线性方程组”,Numer。数学。13, 404-424 (1969). ·Zbl 0174.20401号 ·doi:10.1007/BF02163269
[7] H.Krishna和Y.Wang,“分裂莱文森算法是弱稳定的”,SIAM J.Numer。分析。30, 1498-1508 (1993). ·Zbl 0791.65014号 ·数字对象标识代码:10.1137/0730078
[8] A.W.Bojanczyk、R.P.Brent、F.R.de Hoog和D.R.Sweet,“关于Bareiss和相关Toeplitz因式分解算法的稳定性”,SIAM J.矩阵分析。申请。16, 40-57 (1995). ·Zbl 0819.65016号 ·doi:10.1137/S0895479891221563
[9] S.Chandrasekeran、M.Gu、X.Sun、J.Xia和J.Zhu,“Toeplitz线性方程组的超快速算法”,SIAM J.Matrix Anal。申请。29, 1247-1266 (2007). ·Zbl 1221.65084号 ·doi:10.1137/040617200
[10] G.Heinig和K.Rost,“Toeplitz和Hankel矩阵的快速算法”,线性代数应用。435,1-59(2011年)·Zbl 1211.65035号 ·doi:10.1016/j.laa.2010.12.001
[11] W.F.Trench,“有限Toeplitz矩阵反演的算法”,SIAM J.Appl。数学。12, 525-522 (1964). ·Zbl 0131.36002号 ·doi:10.1137/0112045
[12] G.S.Ammar,“求解正定Toeplitz方程算法的经典基础”,Calcolo 3399-113(1996)·Zbl 0904.65032号 ·doi:10.1007/BF02575711
[13] S.Zohar,“Toeplitz矩阵反演:W.F.Trench的算法”,J.ACM 16,592-601(1969)·Zbl 0194.18102号 ·数字对象标识代码:10.1145/321541.321549
[14] 潘振英、陈振清、郑安,“矩阵特征问题的复杂性”,载于1999年第31届ACM计算理论研讨会论文集,第507-516页·Zbl 1346.68103号
[15] D.Demidov、K.Ahnert、K.Rupp和P.Gottschling,“CUDA和OpenCL编程:使用现代C++库的案例研究”,SIAM J.Sci。计算。35, 453-472 (2013). ·Zbl 1311.65179号 ·doi:10.1137/120903683
[16] Demidov,D。;Ahnert,K。;Mulansky,M.,在GPU上求解常微分方程(2010),Cham
[17] K.Rupp、Ph.Tillet、F.Rudolf、J.Weinbub、A.Morhammer、T.Grasser、A.Jangel和S.Selberherr,“多核和多核架构的维也纳CL-线性代数库”,SIAM J.Sci。计算。38, 412-439 (2016). ·Zbl 1349.65740号 ·doi:10.1137/15M1026419
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。