×

正态变量中大二次型分布近似方法的数值评估。 (英语) Zbl 1507.62029号

摘要:高斯变量的二次型在统计学中有广泛的应用。它们可以表示为X平方的线性组合。线性组合中的系数是(Sigma A\)的特征值(lambda_1,dots,lambda_n\),其中(A\)是表示二次型的矩阵,(Sigma\)是高斯的协方差矩阵。以前的文献主要讨论小二次型(n<10)和中等值(p>10^{-2})的近似。受遗传应用的启发,研究了中到大的二次型(300<n<12000)和小到非常小的值(p<10^{-4})。在这些设置下,对现有方法进行了比较,结果表明,仅取最大特征值的前导特征值近似具有计算优势,且没有任何重要的精度损失。对于时间复杂性,前导特征值近似将提取特征值的计算复杂性从(O(n^3)降低到(O(n ^2 k),并避免了计算(n)项之和的速度问题。为了提高精度,现有方法在计算大二次型下的小(p)值时存在一定的局限性。对于非常小的p值,矩方法是不准确的,如果最小特征值比其他方法小得多,则Farebrother方法是不可用的。戴维斯的方法可用于计算从p到机器ε的值。证明了鞍点近似对于极右尾中的任何(A)和(Sigma)都具有有界的相对误差,因此它可以用于任意小的(p)值。

MSC公司:

62-08 统计问题的计算方法
62E17型 统计分布的近似值(非共鸣)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bausch,J.,《关于有效计算齐方随机变量的线性组合及其在弦真空计数中的应用》,J.Phys。A、 第46、50条,第505202页(2013年)·Zbl 1281.62049号
[2] Berman,S.M.,《密度卷积的尾部及其在HIV潜伏期模型中的应用》,《应用年鉴》。概率。,481-502 (1992) ·Zbl 0752.62014号
[3] Chen,G.K。;马约拉姆,P。;Wall,J.D.,DNA序列数据的快速灵活模拟,《基因组研究》,19,1,136-142(2009)
[4] Davies,R.B.,《算法AS 155:随机变量线性组合的分布》,J.R.Stat.Soc.Ser。C.申请。《统计》,29,3,323-333(1980)·Zbl 0473.62025号
[5] Decker,D.L.,《互补误差函数的计算机评估》,Amer。《物理学杂志》。,43, 833-834 (1975)
[6] P·公爵夫人。;De Micheaux,P.L.,计算二次型的分布:刘唐张近似和精确方法之间的进一步比较,Comput。统计师。数据分析。,54, 4, 858-862 (2010) ·Zbl 1465.62010号
[7] Farebrother,R.,《算法204:随机变量的正线性组合的分布》,J.R.Stat.Soc.Ser。C.申请。《法律总汇》,33,332-339(1984)
[8] Golub,G.H。;Van Loan,C.F.,《矩阵计算》(2012),JHU出版社
[9] Halko,N。;Martinsson,P.-G。;Tropp,J.A.,《寻找随机性结构:构建近似矩阵分解的概率算法》,SIAM Rev.,53,2,217-288(2011)·Zbl 1269.65043号
[10] Kuonen,D.,杂项。正态变量二次型分布的鞍点近似,Biometrika,86,4,929-935(1999)·Zbl 0942.62021号
[11] Lee,S。;由拉里萨·米罗波尔斯基出资;Wu,M.,SKAT:SNP-Set(序列)核关联测试(2017),https://CRAN.R-project.org/package=SKAT
[12] 刘,H。;唐,Y。;Zhang,H.H.,非中心正态变量中非负定二次型分布的一种新的X平方近似,计算。统计师。数据分析。,53, 4, 853-856 (2009) ·Zbl 1364.62041号
[13] Lumley,T.,《复杂调查:使用R的分析指南》(2011),John Wiley&Sons
[14] Lumley,T.,bigQF:大矩阵中的二次型(2019),https://github.com/tslumley/bigQF
[15] Lumley,T。;布罗迪,J.A。;佩洛佐,G.M。;莫里森,A.C。;Rice,K.M.,FastSKAT:超大标记集的序列核关联测试。,遗传学。流行病。(2018)
[16] R核心团队,R:统计计算语言与环境(2017),R统计计算基金会:R统计计算基础,奥地利维也纳,https://www.R-project.org/
[17] Rao,J.N。;Scott,A.J.,《复杂样本调查的分类数据分析:双向表中拟合优度和独立性的二次方检验》,J.Amer。统计师。协会,76,374,221-230(1981)·Zbl 0473.62010号
[18] 罗宾斯,H。;Pitman,E.,混合方法在正态变量二次型中的应用,《数学年鉴》。统计,552-560(1949)·Zbl 0036.20801号
[19] 吴先生。;Lee,S。;蔡,T。;李毅。;Boehnke,M。;Lin,X.,利用序列核关联测试对测序数据进行Rare-variant关联测试,美国遗传学杂志。,89, 1, 82-93 (2011)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。