×

基于高斯中心L矩的可变筛选。 (英语) Zbl 07708448号

总结:大数据的一个重要挑战是识别重要变量。为此,提出了用非标准单变量边际分布发现变量的方法。传统的基于矩的汇总统计可以被很好地采用,但它们对离群值的敏感性可能导致基于少数离群值而不是分布形状(如双峰)进行选择。为了解决这种类型的非稳健性,考虑了L矩。然而,在实际中使用这些参数有一个局限性,因为它们在高斯分布(边缘分布的形状最自然地与之进行比较)中不取零值。作为补救措施,提出了高斯中心L矩,它具有L矩的优点,但在高斯分布上为零。高斯中心L矩相对于其他传统矩的强度在理论和实践方面都有所体现,例如在筛选癌症遗传学数据中的重要基因方面的表现。

MSC公司:

62-08 统计问题的计算方法

软件:

LMOMENTS公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] An,H.,高斯中心L矩(2017),北卡罗来纳大学教堂山分校博士论文
[2] Bowley,A.L.,《统计元素》(1920),斯克里布纳出版社:斯克里布纳尔的纽约
[3] 盒子,G.E.P。;Cox,D.R.,《转换分析》,J.R.Stat.Soc.B,26,211-252(1964),(含讨论)·Zbl 0156.40104号
[4] 布朗,B.M。;Hettmansperger,T.P.,《正常得分、正常曲线图和正常性检验》,美国统计协会,91,1668-1675(1996)·Zbl 0881.62050号
[5] 布莱斯,G。;休伯特,M。;Struyf,A.,偏度的鲁棒度量,J.Comput。图表。统计,1996-1017年13月(2004年)
[6] 布莱斯,G。;休伯特,M。;Struyf,A.,尾部重量的稳健度量,计算。统计数据分析。,50, 733-759 (2006) ·Zbl 1431.62047号
[7] 大卫·F。;Johnson,N.,删失数据的统计处理,第一部分,基本公式,生物特征,41,228-240(1954)·兹比尔0055.13004
[8] 大卫·H·A。;Nagaraja,H.N.,《顺序统计》,《概率与统计中的威利系列》(2003),威利与国际科学John Wiley&Sons:威利与世界科学John Wiley&Sons Hoboken,NJ·Zbl 1053.62060号
[9] Decurninge,A.,《多元分位数和多元L矩》(2014),预印本
[10] Doksum,K.A.,《位置和不对称的测量》,Scand。J.Stat.,2,11-22(1975)·Zbl 0311.62002号
[11] Dutang,C.,使用组合恒等式和有限算子的理论L矩和TL-矩,Commun。统计,理论方法,46,3801-3828(2017)·Zbl 1381.60036号
[12] Elamir,E.A。;Seheult,A.H.,修剪L力矩,计算。统计数据分析。,43, 299-314 (2003) ·Zbl 1220.62019年
[13] Feller,W.,《概率论及其应用导论》,第一卷(1968年),John Wiley&Sons公司:John Willey&Sons,Inc.纽约-朗登-悉尼·Zbl 0155.23101号
[14] 冯(Q.Feng)。;汉尼格,J。;Marron,J.S.,《自动数据转换注释》,《统计》,5,82-87(2016)
[15] Gibbons,J.D。;Chakraborti,S.,非参数统计推断(2010),Chapman和Hall/CRC
[16] Groeneveld,R.A.,《描述分布偏度的影响函数方法》,《美国统计》,45,97-102(1991)
[17] Hall,P.,《反转埃奇沃思扩张》,《安娜·斯塔克》,第11卷,第569-576页(1983年)·Zbl 0525.62024号
[18] Hosking,J.R.M.,《L矩:使用顺序统计的线性组合分析和估计分布》,J.R Stat.Soc.B,52,105-124(1990)·Zbl 0703.62018号
[19] Hosking,J.R.M.,修剪L力矩的一些理论和实际应用,J.Stat.Plan。推断,1373024-3039(2007)·Zbl 1331.62255号
[20] 胡贝尔,P.J。;Ronchetti,E.M.,《稳健统计》,《概率统计中的威利级数》(2009),约翰·威利父子公司:约翰·威利家子公司,新泽西州霍博肯·Zbl 1276.62022号
[21] 贾克,C.M。;Bera,A.K.,回归残差的正态性、同方差性和序列独立性的有效检验,经济学。莱特。,6, 255-259 (1980)
[22] Kim,T.H。;White,H.,《关于偏度和峰度的更稳健估计》,《金融研究快报》。,1, 56-73 (2004)
[23] LaBrecque,J.,《基于概率图中非线性的fit测试质量》,《技术计量学》,第19卷,第293-306页(1977年)·兹伯利0364.62044
[24] Leslie,J.R.,正态统计量及其逆的协方差矩阵的渐近性质和新近似,(数学学会学术讨论会János Bolyai,数学学会学术研究会János Bolyai,Goodness of-Fit Debrecen,匈牙利(1984))
[25] Lloyd,E.,使用顺序统计对位置和尺度参数进行最小二乘估计,《生物特征》,39,88-95(1952)·Zbl 0046.36604
[26] Marron,J.S。;Dryden,I.L.,面向对象数据分析(2021),查普曼和霍尔/CRC·Zbl 1476.62008年
[27] 马丁内斯,J。;Iglewicz,B.,Tukey g和h分布族的一些性质,Commun。Stat.A,理论方法,13,353-369(1984)·Zbl 1247.62041号
[28] Necir,A。;Meraghni,D.,估计重尾分布和应用的L泛函,J.Probab。Stat.,2010,第707146条,pp.(2010),34·Zbl 1200.62050号
[29] Oja,H.,《关于单变量分布的位置、尺度、偏度和峰度》,Scand。J.Stat.,8,154-168(1981)·兹比尔0525.62020
[30] Pearson,K.,《进化论的数学贡献》。十九、。关于歪斜变化的回忆录的第二个补充,菲洛斯。事务处理。英国皇家学会。,序列号。A、 包含。巴普。数学。物理学。字符,216429-457(1916)
[31] Ruppert,D.,峰度是什么?影响函数法,《美国统计》,41,1-5(1987)·Zbl 0607.62009年
[32] 夏皮罗,S.S。;Wilk,M.B.,《正态性方差检验分析(完整样本)》,《生物统计学》,52,591-611(1965)·Zbl 0134.36501号
[33] Shorack,G.R.,《顺序统计函数》,《数学年鉴》。Stat.,43,412-427(1972)·兹比尔0239.62037
[34] Subramanian,A。;Tamayo,P。;Mootha,V.K。;穆克吉,S。;Ebert,B.L。;Gillette,医学硕士。;Paulovich,A。;波默罗伊,S.L。;Golub,T.R。;兰德,E.S。;Mesirov,J.P.,《基因集富集分析:解释全基因组表达谱的基于知识的方法》,Proc。国家。阿卡德。科学。美国,10215545-15550(2005)
[35] Szegö,G.,正交多项式,美国数学学会学术讨论会出版物,第23卷(1959年),美国数学协会:美国数学学会普罗维登斯,RI
[36] 韦恩斯坦,J.N。;Stuart,J.M.,《癌症基因组图谱泛癌分析项目》,《自然遗传学》。,45, 1113-1120 (2013)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。