×

高维回归的非对称影响度量。 (英语) Zbl 07565503号

摘要:在数据分析中,确定有影响的观测值至关重要,特别是对于高维数据集,其中预测因子的数量高于样本量。这些具有广泛细节的丰富数据集在多个科学领域得到了越来越多的开发和分析,例如基因组学、神经科学、金融等。不幸的是,经典的诊断统计工具并不是为识别高维设置中的有影响力的观测而量身定制的。在本文中,我们使用期望值的概念来开发高维回归中的影响度量。影响度量基于非对称边际相关,其导出的渐近分布用于根据统计原理定义阈值。我们的综合模拟结果表明,在各种场景下,该影响度量具有良好的质量。通过对神经成像数据集的分析,说明了所提出的测量方法的有效性。GitHub上公开了实现该过程的R包(https://github.com/AmBarry/hidetify).

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安布罗斯,C。;McLachlan,G.J.,基于微阵列基因表达数据的基因提取中的选择偏差,美国国家科学院学报,99,10,6562-66(2002)·Zbl 1034.92013年 ·doi:10.1073/pnas.102102699
[2] Bendre,S.M.,正常样本中多个异常值测试的掩蔽和淹没效应,《统计学中的通信——理论和方法》,18,2,697-710(1989)·Zbl 0696.62201号 ·doi:10.1080/03610928908829928
[3] Chatterjee,S。;Hadi,A.S.,线性回归中的影响性观察、高杠杆点和异常值,统计科学,1,3,379-93(1986)·Zbl 0633.62059号 ·doi:10.1214/ss/1177013622
[4] 柯林斯·D·L。;Neelin,P。;彼得斯,T.M。;Evans,A.C.,标准化talairach空间中MR体积数据的自动三维受试者间配准,计算机辅助断层扫描杂志,18,2,192-205(1994)
[5] 库克,R.D.,《线性回归中影响观察的检测》,《技术计量学》,第19、1、15-18页(1977年)·Zbl 0371.62096号
[6] 库克·R·D。;Weisberg,S.,《回归中的残差和影响》(1982),纽约:查普曼和霍尔出版社·兹伯利0564.62054
[7] Dale,A.M。;费希尔,B。;Sereno,M.I.,皮层表面分析。I.分割和表面重建,NeuroImage,9,2,179-94(1999)·文件编号:10.1006/nimg.1998.0395
[8] 德罗西,G。;Harvey,A.,分位数、期望值和样条曲线,《计量经济学杂志》,152,2,179-85(2009)·Zbl 1431.62153号 ·doi:10.1016/j.jeconom.2009.01.01
[9] Di Martino,A。;Yan,C.-G。;李强。;Denio,E。;卡斯特拉诺斯,F.X。;Alaerts,K。;安德森,J.S。;阿萨夫,M。;布克海默,S.Y。;Dapretto,M.,《自闭症大脑成像数据交换:自闭症内在大脑结构的大规模评估》,《分子精神病学》,19,6,659-67(2014)·doi:10.1038/mp.2013.78
[10] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,《皇家统计学会杂志:B辑(统计方法)》,70,5,849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[11] 法鲁克,M。;Steinwart,I.,《预期回归的类svm方法》,计算统计与数据分析,109159-81(2017)·Zbl 1466.62064号 ·doi:10.1016/j.csda.2016.11.010
[12] Filzmoser,P。;Maronna,R.(马龙娜,R.)。;Werner,M.,《高维异常识别》,计算统计与数据分析,52,3,1694-711(2008)·Zbl 1452.62370号 ·doi:10.1016/j.csda.2007.05.018
[13] Fischl,B.,FreeSurfer,NeuroImage,62,2774-81(2012)·doi:10.1016/j.neuroimage.2012.01.021
[14] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,统计软件杂志,33,1,1-22(2010)
[15] 弗里奇,V。;瓦罗佐,G。;蒂罗,B。;波利恩,J.-B。;Thirion,B.,用稳健协方差估计检测高维神经成像数据集中的异常值,医学图像分析,16,7,1359-70(2012)·doi:10.1016/j.media.2012.05.002
[16] Jeong,J。;Kim,C.,异常值对正则回归变量选择的影响,统计应用与方法通讯,25,2,235-43(2018)·doi:10.29220/CSAM.2018年2月25日235
[17] 江,C。;江,M。;徐,Q。;黄,X.,期望回归神经网络模型及其应用,神经计算,24773-86(2017)·doi:10.1016/j.neucom.2017.03.040
[18] Khundrakpam,B.S。;托卡,J。;埃文斯,A.C。;大脑发育合作小组,基于不同空间分辨率下皮层厚度的大脑成熟度预测,NeuroImage,111,350-59(2015)·doi:10.1016/j.neuroimage.2015.02.046
[19] Kim,M。;Lee,S.,非线性预期回归及其在风险价值和预期缺口估计中的应用,计算统计学和数据分析,94,1-19(2016)·Zbl 1468.62101号 ·doi:10.1016/j.csda.2015.07.011
[20] Majumdar,A。;Paul,D.,零期望过程和贝叶斯空间回归,《计算与图形统计杂志》,25,3,727-47(2016)·doi:10.1080/10618600.2015.062024
[21] O.默斯曼(2018)
[22] 纽伊,W.K。;鲍威尔,J.L.,《非对称最小二乘估计和检验》,《计量经济学》,55,4,819-47(1987)·Zbl 0625.62047号
[23] Nurunabi,A.A.M。;哈迪,A.S。;Imon,A.H.M.R.,《线性回归中多重影响观测值的识别程序》,《应用统计杂志》,41,6,1315-31(2014)·Zbl 1352.62111号 ·doi:10.1080/02664763.2013.868418
[24] R核心团队,R:统计计算的语言和环境(2018),奥地利维也纳:R统计计算基金会,奥地利维也纳
[25] 里吉,M.B。;Yang,Y。;Ceretta,P.S.,《条件自回归预期缺口估计的非参数预期回归》,《经济和金融分析的当代研究》,96,83-95(2014)·doi:10.108/S1569-375920140000096003
[26] Ro,K。;邹,C。;王,Z。;Yin,G.,高维数据的离群检测,Biometrika,102,3,589-99(2015)·Zbl 1452.62378号 ·doi:10.1093/biomet/asv021
[27] 罗伯茨,S。;Martin,医学硕士。;Zheng,L.,用于检测回归影响的自适应自动多重删除技术,Technometrics,57,3,408-17(2015)·doi:10.1080/00401706.2014.946152
[28] 施纳贝尔,S.K。;Eilers,P.H.C.,最优预期平滑,计算统计与数据分析,53,12,4168-77(2009)·Zbl 1453.62192号 ·doi:10.1016/j.csda.2009.05.002
[29] 舒尔兹·沃尔特鲁普,L。;Kauermann,G.,《使用惩罚样条曲线的面板数据平滑期望值》,《统计与计算》,27,1,271-82(2017)·Zbl 1505.62362号 ·doi:10.1007/s11222-015-9621-2
[30] 她,Y。;A.B.欧文(2010)
[31] 谢里夫,T。;Rioux,P。;M.-E.卢梭。;北卡罗来纳州卡斯斯。;贝克,N。;阿达拉特,R。;达斯,S。;Glatar,T。;Evans,A.C.,CBRAIN:一个基于网络的分布式计算平台,用于协作神经成像研究,神经信息学前沿,8,54(2014)·doi:10.3389/fninf.2014.00054
[32] Sobotka,F。;Kneib,T.,地质添加剂预期回归,计算统计和数据分析,56,4,755-67(2012)·Zbl 1241.62058号 ·doi:10.1016/j.csda.2010.11.015
[33] Sobotka,F。;考尔曼,G。;舒尔兹·沃尔特鲁普,L。;Kneib,T.,《关于半参数预期回归的置信区间》,《统计与计算》,23,2,135-48(2013)·Zbl 1322.62136号 ·doi:10.1007/s11222-011-9297-1
[34] Sobotka,F.、Schnabel,S.、Schulze Waltrup,L.、Eilers,P.、Kneib,T.和Kauermann,G.,2014年。Expectreg:期望和分位数回归。R包版本0.39。
[35] 谢凯利,G.J。;Rizzo,M.L。;Bakirov,N.K.,《通过距离相关性测量和测试相关性》,《统计年鉴》,35,6,2769-94(2007)·Zbl 1129.62059号 ·doi:10.1214/0090536007000000505
[36] Waldmann,E。;Sobotka,F。;Kneib,T.,地质加性预期回归中的贝叶斯正则化,统计与计算,27,6,1539-53(2017)·Zbl 1384.62140号 ·doi:10.1007/s11222-016-9703-9
[37] 沃尔特鲁普,L.S。;Sobotka,F。;Kneib,T。;Kauermann,G.,期望和分位数回归——David和Goliath?,《统计建模:国际期刊》,15,5,433-56(2015)·Zbl 07258997号 ·doi:10.1177/1471082X14561155
[38] Wang,T。;Li,Z.,高维回归模型中的离群点检测,《统计学中的通信——理论和方法》,46,14,6947-58(2017)·Zbl 1369.62130号 ·doi:10.1080/03610926.2016.1140783
[39] Wang,T。;李强。;陈,B。;Li,Z.,稀疏高维回归中的多个离群值检测,统计计算与模拟杂志,88,1,89-107(2018)·Zbl 07192543号 ·doi:10.1080/0949655.2017.1379521
[40] Wang,T。;李强。;臧(音)。;Li,Z.,用于检测高维回归中影响点的多重删除方法,《统计中的通信——模拟和计算》,48,7,2065-82(2019)·Zbl 07551938号 ·doi:10.1080/03610918.2018.1433840
[41] Xing,J.-J。;钱晓云,非对称正态分布的贝叶斯期望回归,《统计学中的传播——理论与方法》,46,9,4545-55(2017)·Zbl 1422.62112号 ·doi:10.1080/03610926.2015.1088030
[42] 徐,Q。;刘,X。;江,C。;Yu,K.,通过神经网络的非参数条件自回归预期模型及其在估计金融风险中的应用,《商业和工业中的应用随机模型》,32,6,882-908(2016)·Zbl 1420.91531号 ·doi:10.1002/asmb.2212
[43] Yang,Y。;Zou,H.,通过er-boost的非参数多元预期回归,《统计计算与模拟杂志》,85,7,1442-58(2015)·Zbl 1457.62124号 ·网址:10.1080/00949655.2013.876024
[44] 赵,J。;冷,C。;李,L。;Wang,H.,《高维影响测度》,《统计年鉴》,41,5,2639-67(2013)·Zbl 1360.62411号 ·doi:10.1214/13-AOS1165
[45] 赵,J。;刘,C。;牛,L。;Leng,C.,高维回归空间中的多影响点检测,皇家统计学会杂志:B辑(统计方法),81,2,385-408(2019)·Zbl 1420.62301号 ·doi:10.1111/rssb.12311
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。