×

一种新的基于再生核的生存数据非线性降维方法。 (英语) Zbl 07748389号

摘要:基于切片逆回归(SIR)和再生核希尔伯特空间(RKHS)理论,提出了一种新的生存数据非线性降维方法RDSIR。基于RKHS性质构造了一个等距同构,然后RKHSs中的非线性函数可以用同构特征空间中两个元素的内积来表示。由于生存数据的审查,使用双重切片估计权重函数以调整审查偏差。利用广义特征分解问题估计非线性充分降维子空间。基于微扰理论建立了估计量的渐近性质。最后,通过仿真和实际数据验证了RDSIR的性能。数值结果表明,RDSIR与线性SDR方法具有可比性。最重要的是,RDSIR还可以有效地从生存数据中提取非线性。
{©2023斯堪的纳维亚统计杂志基金会董事会。}

MSC公司:

62至XX 统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alfons,A.、Croux,C.和Filzmoser,P.(2016)。数据集之间强大的最大关联:r包ccapp。奥地利统计杂志,45,71-79。
[2] Alfons,A.、Croux,C.和Filzmoser,P.(2017)。鲁棒最大关联估计。美国统计协会杂志,112436-445。
[3] Aronszajn,N.(1950)。再生核理论。美国数学学会学报,68,337-404·Zbl 0037.20701号
[4] Baker,C.R.和McKeague,I.W.(1981年)。紧凑协方差运算符。美国数学学会学报,83,590-593·Zbl 0483.60005号
[5] Berlinet,A.和Thomas‐Agnan,C.(2011年)。在概率统计中再现核希尔伯特空间。施普林格科技与商业媒体。
[6] Candes,E.和Tao,T.(2007年)。dantzig选择器:当p远大于n时的统计估计。《统计年鉴》,352313-2351·Zbl 1139.62019号
[7] 陈,L.‐P。(2022). 具有协变量测量误差的删失数据的超高维充分降维。应用统计学杂志,49,1154-1178·兹伯利07522678
[8] 库克·R·D(2009)。回归图形:通过图形研究回归的想法(第482卷)。约翰·威利父子公司·Zbl 0903.62001
[9] Cook,R.D.和Weisberg,S.(1991年)。降维的切片逆回归:注释。美国统计协会杂志,86,328-332·Zbl 1353.62037号
[10] De Boor,C.、De Bool,C.、Mathématicien,E.-U.、。,De Boor,C.和De Boo,C.(1978年)。花键实用指南(第27卷)。Springer‐Verlag纽约·兹比尔0406.41003
[11] 丁S.、钱W.、王L.等(2020)。双重切片有助于高维删失数据的充分降维。《统计年鉴》,48,2132-2154·Zbl 1455.62192号
[12] Dong,Y.(2021)。简要回顾了通过优化实现线性充分降维。《统计规划与推断杂志》,211,154-161·Zbl 1455.62032号
[13] Dong,Y.,&Yang,C.(2016)。基于聚类的最小绝对偏差回归用于降维。统计理论与实践杂志,10121-132·Zbl 1426.62198号
[14] Duan,K.、Keerthi,S.S.和Poo,A.N.(2003)。用于调整支持向量机超参数的简单性能度量的评估。神经计算,51,41-59。
[15] Fan,J.,&Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志,96,1348-1360·Zbl 1073.62547号
[16] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。英国皇家统计学会杂志,B辑:统计方法,70849-911·Zbl 1411.62187号
[17] Fan,J.和Song,R.(2010年)。具有np维的广义线性模型中的确定独立筛选。《统计年鉴》,38,3567-3604·兹比尔1206.68157
[18] Fukumizu,K.,Bach,F.R.,Jordan,M.I.等人(2009年)。回归中的核降维。《统计年鉴》,371871-1905年·Zbl 1168.62049号
[19] Gönen,M.和Alpaydin,E.(2011)。多内核学习算法。机器学习研究杂志,12211-2268·Zbl 1280.68167号
[20] Johnson,R.A.、Wichern,D.W.等人(2002年)。应用多元统计分析(第5卷)。普伦蒂斯·霍尔。
[21] Jones,M.和Foster,P.(1993年)。广义重叠和高阶核。非参数统计学杂志,3,81-94·Zbl 1383.62098号
[22] Kato,T.(2013)。线性算子的微扰理论(第132卷)。施普林格科技与商业媒体。
[23] Keerthi,S.S.和Lin,C.‐J。(2003). 高斯核支持向量机的渐近行为。神经计算,1567-1689·Zbl 1086.68569号
[24] Kim,H.和Shin,S.J.(2021年)。一种分位数切片方法,用于对截尾响应进行充分降维。《生物医学杂志》,63201-212·Zbl 1523.62140号
[25] Lee,K.-Y。,Li,B.、Chiaromonte,F.等人(2013年)。非线性充分降维的一般理论:公式和估计。《统计年鉴》,41,221-249·Zbl 1347.62018年
[26] Li,B.、Artemiou,A.和Li,L.(2011)。线性和非线性充分降维的主支持向量机。《统计年鉴》,39,3182-3210·Zbl 1246.62153号
[27] Li,B.和Song,J.(2017)。函数数据的非线性充分降维。统计年鉴,451059-1095·Zbl 1371.62003年
[28] Li,B.和Wang,S.(2007年)。关于降维的方向回归。《美国统计协会杂志》,102997-1008·Zbl 1469.62300号
[29] 李,K.‐C。(1991). 用于降维的分段反向回归。《美国统计协会期刊》,86316-327·Zbl 0742.62044号
[30] Li,K.‐C.和Duan,N.(1989)。链接冲突下的回归分析。统计年鉴,17009-1052·Zbl 0753.62041号
[31] Li,K.‐C。,Wang,J.‐L。,Chen,C.-H。,等人(1999年)。删失回归数据的降维。统计年鉴,27,1-23·Zbl 0932.62050号
[32] Li,L.和Li,H.(2004)。微阵列的降维方法及其在截尾生存数据中的应用。生物信息学,203406-3412。
[33] Li,L.,&Yin,X.(2008)。带正则化的分段逆回归。生物统计学,64,124-131·Zbl 1139.62055号
[34] Loprinzi,C.L.,Laurie,J.A.,Wieand,H.S.,Krook,J.E.,Novotny,P.J.,Kugler,J.W.,Bartel,J,Law,M.,Bateman,M.和Klatt,N.E.(1994年)。从患者完成的问卷中对预后变量进行前瞻性评估。中北部癌症治疗组。临床肿瘤学杂志,12,601-607。
[35] Lu,W.,&Li,L.(2011)。删失回归的充分降维。生物统计学,67,513-523·Zbl 1217.62053号
[36] Ma,Y.,&Zhu,L.(2012)。降维的半参数方法。美国统计协会杂志,107,168-179·兹比尔1261.62037
[37] Ma,Y.,&Zhu,L.(2013)。关于降维的综述。《国际统计评论》,81,134-150·Zbl 1416.62220号
[38] Ogden,T.(2012)。用于统计应用和数据分析的基本小波。施普林格科技与商业媒体。
[39] Schölkopf,B.和Smola,A.J.(2002)。使用内核学习:支持向量机、正则化、优化等。麻省理工学院出版社。
[40] Scott,D.W.(2015)。多元密度估计:理论、实践和可视化。约翰·威利父子公司·Zbl 1311.62004号
[41] Sheng,W.和Yin,X.(2016)。通过距离协方差进行足够的降维。计算与图形统计杂志,2591-104。
[42] Shevlyakova,M.和Morgenthaler,S.(2014)。生存数据的切片逆回归。统计论文,55209-220·Zbl 1416.62229号
[43] Soale,A.‐N.和Dong,Y.(2020)。通过主非对称最小二乘法进行充分降维。arXiv预打印arXiv:2002.05264。
[44] Sonnenburg,S.、Rätsch,G.、Schäfer,C.和Schölkopf,B.(2006年)。大规模多核学习。机器学习研究杂志,71531-1565·Zbl 1222.90072号
[45] Sun,Q.,Zhu,R.,Wang,T.,&Zeng,D.(2019年)。统计基于过程的删失结果降维方法。《生物统计学》,106181-196年·Zbl 1506.62386号
[46] Sun,T.和Zhang,C.‐H。(2012). 缩放稀疏线性回归。《生物特征》,99,879-898·Zbl 1452.62515号
[47] Taylor,J.和Einbeck,J.(2013)。挑战多元局部线性回归中的维数灾难。计算统计学,28955-976·Zbl 1305.65078号
[48] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会期刊:B辑:方法论,58267-288·Zbl 0850.62538号
[49] Vidakovic,B.(2009年)。小波统计建模(第503卷)。约翰·威利父子公司。
[50] Wahba,G.(1990年)。观测数据的样条模型(第59卷)。SIAM公司·Zbl 0813.62001号
[51] Wang,C.、Shin,S.J.、Wu,Y.等(2018)。具有异方差的充分降维的主分位数回归。《电子统计杂志》,12114-2140·Zbl 1393.60119号
[52] Wen,X.M.(2010)。具有协变量的比例审查模型的充分降维。计算统计与数据分析,54,1975-1982·Zbl 1284.62609号
[53] 吴先生。(2008). 核切片逆回归及其在分类中的应用。计算与图形统计杂志,17,590-610。
[54] Wu,Q.,Liang,F.和Mukherjee,S.(2013)。核切片逆回归:正则化与一致性抽象与应用分析(卷2013)。欣达维。
[55] Xia,Y.(2007)。一种估计降维方向的构造性方法。《统计年鉴》,35,2654-2690·Zbl 1360.62196号
[56] Xia,Y.、Tong,H.、Li,W.K.和Zhu,L.‐X。(2002年)。降维空间的自适应估计。英国皇家统计学会杂志:B辑(统计方法),64,363-410·Zbl 1091.62028号
[57] Xia,Y.,Zhang,D.,&Xu,J.(2010)。生存模型的降维和半参数估计。美国统计协会杂志,105,278-290·Zbl 1397.62377号
[58] Xue,Y.,Zhang,N.,Yin,X.,&Zheng,H.(2017)。利用hilbert-schmidt独立准则进行充分降维。计算统计与数据分析,115,67-78·Zbl 1466.62222号
[59] Yeh,Y.‐R.,是的。,黄,S.‐Y.,&李,Y.J。(2008). 核切片逆回归的非线性降维。IEEE知识与数据工程汇刊,211590-1603。
[60] Yin,X.和Cook,R.D.(2002)。回归中第k个条件矩的降维。英国皇家统计学会杂志,B辑:统计方法,64,159-175·Zbl 1067.62042号
[61] Yin,X.、Li,B.和Cook,R.D.(2008年)。在多指标回归中估计中心子空间的连续方向提取。多元分析杂志,991733-1757·Zbl 1144.62030号
[62] Yuan,M.,&Lin,Y.(2006)。分组变量回归中的模型选择和估计。英国皇家统计学会杂志,B辑:统计方法,68,49-67·Zbl 1141.62030号
[63] Zhang,J.和Chen,X.(2019)。通过球协方差进行稳健的充分降维。计算统计与数据分析,140,144-154·Zbl 1496.62110号
[64] Zhao,G.,Ma,Y.,&Lu,W.(2022)。截尾生存数据降维的有效估计。中国统计局,322359-2380·Zbl 07602345号
[65] Zhong,W.,Zeng,P.,Ma,P.、Liu,J.S.和Zhu,Y.(2005)。Rsir:用于模体发现的正则切片逆回归。生物信息学,214169-4175。
[66] Zhu,L.‐X。,Fang,K.‐T。,等(1996)。切片逆回归核估计的渐近性。《统计年鉴》,第24期,第1053-1068页·Zbl 0864.62027号
[67] 邹华(2006)。自适应套索及其oracle属性。美国统计协会杂志,1011418-1429·Zbl 1171.62326号
[68] Zou,H.和Hastie,T.(2005)。通过弹性网进行规则化和变量选择。英国皇家统计学会杂志,B辑:统计方法,67,301-320·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。