×

中心子空间综述:方法和应用。 (英语) Zbl 07585642号

摘要:中心子空间一直是充分降维的关键概念。中心子空间方法最初是为解决(p<n)环境中的问题而构建的,它已经取得了许多成功和发展。然而,在过去的几年里,随着技术的进步,许多统计问题现在处于高维环境中。在本文中,我们回顾了中心子空间的理论,并对(p\leqn)、(p>n)和大数据环境下的中心子空间方法进行了更新综述。我们还为这些技术开发了一个新的分类系统,并列出了一些可用于估计中心子空间的包。最后,我们为生物信息学应用开发了一个中心子空间框架,并使用两个不同的数据集展示了该框架如何在实践中应用。

理学硕士:

62页第10页 统计学在生物学和医学中的应用;元分析
92B15号机组 一般生物统计学
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] ADRAGNI,K.和RAIM,A.(2014年)。ldr:R软件包,用于基于似然的充分降维。统计软件杂志,文章61 1-21.
[2] ANAGNOSTOPOULOS,C.和HAND,D.J.(2012年)。hmeasure:H-measure和其他标量分类性能指标R包版本1.0。
[3] BASU,D.和PEREIRA,C.A.B.(1983年)。统计中的条件独立性。桑基?a45 324-337. ·Zbl 0573.62008号
[4] BERNARD-MICHEL,C.、GARDES,L.和GIRARD,S.(2008)。关于带正则化的分段逆回归的注记。生物计量学64 982-984. ·Zbl 1145.62351号
[5] BRHENY,P.和HUANG,J.(2013)。带分组预测因子的非凸惩罚线性和logistic回归模型的组下降算法。统计与计算25 173-187. ·Zbl 1331.62359号
[6] CANDES,E.和TAO,T.(2007年)。Dantzig选择器:当p远大于n时的统计估计。统计学年鉴35 2313-2351. ·Zbl 1139.62019号
[7] CHEN,C.H.和LI,K.C.(1998)。SIR能像多元线性回归那样流行吗?中国统计局8 289-316. ·Zbl 0897.62069号
[8] CHEN,X.和XIE,M.-G.(2014)。一种用于分析超大数据的分裂与合并方法。中国统计局24 1655-1684. ·Zbl 1480.62258号
[9] CHIANG,A.P.,BECK,J.S.,YEN,H.-J.,TAYEH,M.K.,SCHEETZ,T.E.,SWIDERSKI,R.E.,NISHIMURA,D.Y.,BRAUN,T.A.,KIM,K.-Y.A.,HUANG,J.等人(2006年)。利用SNP阵列进行纯合度映射,将E3泛素连接酶TRIM32确定为Bardet-Biedl综合征基因(BBS11)。美国国家科学院院刊103 6287-6922。
[10] CHIAROMONTE,F.和MARTINELLI,J.(2002)。用于分析具有响应的全局基因表达数据的降维策略。数学生物科学176 123-144. ·Zbl 0999.62090号
[11] 库克博士(1994a)。关于回归图的解释。美国统计协会杂志89 177-189. ·Zbl 0791.62066号
[12] 库克·R·D(1994b)。使用降维子空间识别物理系统模型中的重要输入。1994年物理与工程科学部会议录18-25. 美国统计协会。
[13] 库克·R·D(1998)。回归图形.概率统计中的威利级数:概率统计约翰·威利父子公司,纽约·Zbl 0903.62001
[14] 库克·R·D(2004)。测试预测器在充分降维中的贡献。统计学年鉴32 1062-1092·Zbl 1092.62046号
[15] 库克·R·D(2007)。费希尔讲座:回归中的降维。统计科学22 1-26. ·Zbl 1246.62148号
[16] 库克·R·D(2018)。主要部件、足够的尺寸缩减和包络。统计年鉴及其应用5 533-559.
[17] 库克·R.D.和福扎尼·L.(2008a)。协方差减少模型:协方差矩阵谱建模的替代方法。生物特征95 799-812. ·Zbl 1437.62428号
[18] 库克·R·D·和福扎尼·L·(2008b)。回归中降维的主要拟合分量。统计科学23 485-501. ·Zbl 1329.62274号
[19] 库克·R.D.和福扎尼·L.(2009)。基于似然的充分降维。美国统计协会杂志104 197-208. ·Zbl 1388.62041号
[20] 库克·R·D、福扎尼·L和托马斯·D(2011)。LDR:基于相似性的充分降维包。统计软件期刊39. ·Zbl 1227.62001
[21] 库克·R.D.、福扎尼·L.和罗特曼·A.J.(2012)。在丰富的高维回归中估计预测因子的充分减少。统计学年鉴40 353-384·Zbl 1246.62150号
[22] 库克·R·D、李·B和齐亚蒙特·F(2007)。无矩阵反演回归中的降维。生物特征94 569-584. ·Zbl 1135.62046号
[23] 库克·R.D.和纳奇什伊姆·C.J.(1994)。在回归中实现椭圆轮廓协变量的重加权。美国统计协会杂志89 592-599. ·Zbl 0799.62078号
[24] COOK,R.D.和NI,L.(2005)。通过反向回归进行充分降维。美国统计协会杂志100 410-428. ·Zbl 1117.62312号
[25] 库克·R·D·和韦斯伯格·S·(1991)。用于降维的分段反向回归:注释。美国统计协会杂志86 328-332. ·Zbl 1353.62037号
[26] 库克·R·D·和韦斯伯格·S·(1999)。统计分析中的图表:媒体是信息吗?美国统计学家53 29-37之间。
[27] 库克·R·D和尹·X(2001)。判别分析中的降维和可视化。澳大利亚和新西兰统计杂志43 147-199. ·Zbl 0992.62056号
[28] COUDRET,R.、LIQUET,B.和SARACCO,J.(2014)。未确定情况下切片逆回归方法的比较。法国社会统计杂志155 72-96. ·Zbl 1316.62068号
[29] COUDRET,R.、LIQUET,B.和SARACCO,J.(2017年)。edrGraphicalTools:提供降维方法R包版本2.2的工具·Zbl 1316.62068号
[30] DAWID,A.P.(1979)。统计理论中的条件独立性。英国皇家统计学会杂志。B.系列方法41 1-31. ·Zbl 0408.62004号
[31] DONG,Y.和LI,B.(2010)。非椭圆分布预报器的降维:二阶方法。生物特征97 279-294. ·兹比尔1233.62119
[32] 艾默生·J.W.和凯恩·M.J.(2012)。不要淹没在数据中。重要性9 38至39。
[33] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。统计软件杂志33 1-22.
[34] FUKUMIZU,K.、BACH,F.R.和JORDAN,M.I.(2004)。基于再生核Hilbert空间的监督学习降维。机器学习研究杂志5 73-99. ·Zbl 1222.62069号
[35] FUKUMIZU,K.、BACH,F.R.和JORDAN,M.I.(2009年)。回归中的核降维。统计学年鉴37 1871-1905. ·Zbl 1168.62049号
[36] FUKUMIZU,K.和LENG,C.(2014)。基于梯度的回归核降维。美国统计协会杂志109 359-370. ·Zbl 1367.62118号
[37] 冯伟凯、何旭、刘磊和石鹏(2002)。基于典型相关的降维。中国统计局12 1093-1113. ·Zbl 1004.62058号
[38] 吉拉德,S.,洛伦佐,H.和萨拉科,J.(2022)。切片反向回归中的高级主题。多元分析杂志188 104852. ·Zbl 1493.62306号
[39] GOLUB,T.R.、SLONIM,D.K.、TAMAYO,P.、HUARD,C.、GAASENBEEK,M.、MESIROV,J.P.、COLLER,H.、LOH,M.L.、DOWNING,J.R.,CALIGIURI,M.A.、BLOOMFIELD,C.D.和LANDER,E.S.(1999)。癌症的分子分类:通过基因表达监测进行分类发现和分类预测。科学类286 531-537.
[40] GUHA,S.、HAFEN,R.、ROUNDS,J.、XIA,J.,LI,J.和XI,B.(2012)。大型复杂数据:使用RHIPE进行拆分和重组(D&R)。斯达1 53-67.
[41] HALL,P.和LI,K.C.(1993)。关于高维数据的低维投影的几乎线性。统计学年鉴21 867-889. ·Zbl 0782.62065号
[42] 韩毅、黄磊和周峰(2021)。一个动态递归特征消除框架(dRFE),用于进一步完善一组OMIC生物标记。生物信息学37 2183-2189.
[43] HAND,D.J.(2009年)。衡量分级机性能:ROC曲线下面积的一致替代方案。机器学习77 103-123. ·Zbl 1470.62085号
[44] HANG,W.和XIA,Y.(2017)。MAVE:尺寸缩减方法R软件包版本1.2.9。
[45] HILAFU,H.和YIN,X.(2017)。具有高度相关预测器的大p-小n数据的充分降维和变量选择。计算与图形统计杂志26 26-34.
[46] KIM,M.和PAVLOVIC,V.(2011年)。使用协方差算子的中心子空间降维。IEEE模式分析和机器智能汇刊33 657-670.
[47] LEE,K.-Y.,LI,B.和CHIAROMONTE,F.(2013)。非线性充分降维的一般理论:公式和估计。统计学年鉴41 221-249. ·Zbl 1347.62018年
[48] 李克诚(1991)。用于降维的分段反向回归。美国统计协会杂志86 316-342. ·Zbl 0742.62044号
[49] 李克诚(1992)。关于数据可视化和降维的主要Hessian方向:Stein引理的另一个应用。美国统计协会杂志87 1025-1039. ·Zbl 0765.62003年
[50] LI,L.(2007年)。稀疏足够的尺寸缩减。生物特征94 603-613. ·Zbl 1135.62062号
[51] 李斌(2018)。充分降维:R的方法及应用.统计学和应用概率专著161纽约Taylor and Francis Group有限责任公司。
[52] LI,B.和DONG,Y.(2009)。非椭圆分布预报器的降维。统计学年鉴37 1272-1298. ·Zbl 1160.62050
[53] LI,L.和LI,H.(2004)。微阵列的降维方法及其在截尾生存数据中的应用。生物信息学20 3406-3412.
[54] LI,L.和NACHTSHEIM,C.J.(2006)。稀疏切片反向回归。技术指标48 503-510.
[55] LI,L.和YIN,X.(2008)。带正则化的分段逆回归。生物计量学64 124-131. ·Zbl 1139.62055号
[56] LI,B.,ZHA,H.和CHIAROMONTE,F.(2005)。轮廓回归:一种通用的降维方法。统计学年鉴33 1580-1616·兹比尔1078.62033
[57] LIN,N.和XI,R.(2011年)。聚合估计方程估计。统计及其界面4 73-83. ·Zbl 1245.62026号
[58] LIN,Q.,ZHAO,Z.和LIU,J.S.(2018)。关于高维切片逆回归的一致性和稀疏性。统计学年鉴46 580-610. ·Zbl 1395.62196号
[59] LIN,Q.,ZHAO,Z.和LIU,J.S.(2019)。通过拉索进行稀疏切片反向回归。美国统计协会杂志114 1726-1739. ·Zbl 1428.62320号
[60] LIQUET,B.和SARACCO,J.(2011年)。一种图形工具,用于在SIR和SAVE方法中选择切片数和模型尺寸。计算统计学27 103-125. ·兹比尔1304.65054
[61] LIQUET,B.和SARACCO,J.(2016)。BIG-SIR是一种针对海量数据的分段逆回归方法。统计及其界面9 509-520. ·Zbl 1405.62041号
[62] LVOVS,D.、FAVOROVA,O.O.和FAVOROV,A.V.(2012)。研究多基因疾病的多基因方法。《自然学报》4 59-71.
[63] MA,Y.和ZHU,L.(2012)。降维的半参数方法。美国统计协会杂志107 168-179. ·Zbl 1261.62037号
[64] MA,Y.和ZHU,L.(2013)。关于降维的综述。国际统计评论81 134-150·Zbl 1416.62220号 ·doi:10.1111/j.1751-5823.012.00182.x
[65] NGHIEM,L.H.、HUI,F.、MüLLER,S.和WELSH,A.(2023年)。基于Cholesky矩阵惩罚的稀疏切片逆回归。中国统计局. ·Zbl 07602348号 ·doi:10.5705/ss.202020.0406
[66] NILSSON,J.、SHA,F.和JORDAN,M.I.(2007年)。基于核降维的流形回归。ICML'07第24届机器学习国际会议记录697-704. 美国纽约州纽约市ACM。
[67] PRENDERGAST,洛杉矶(2005)。切片反向回归的影响函数。斯堪的纳维亚统计杂志32 385-404. ·Zbl 1088.62054号
[68] PRENDERGAST,L.A.(2007年)。影响函数分析对切片反向回归和切片平均方差估计的影响。生物特征94 585-601. ·Zbl 1135.62047号
[69] PRENDERGAST,L.A.和SMITH,J.A.(2010)。降维方法的影响函数:以粗麻布主方向分析的影响研究为例。斯堪的纳维亚统计杂志37 588-611. ·Zbl 1226.62064号
[70] QIAN,W.,DING,S.和COOK,R.D.(2019)。超高维同时变量选择的充分降维稀疏最小差方法。美国统计协会杂志114 1277-1290. ·Zbl 1428.62237号
[71] RAMSAY,K.、DUROCHER,S.和LEBLANC,A.(2021)。投影中值的稳健性和渐近性。多元分析杂志181 104678. ·Zbl 1461.62072号
[72] SCHEETZ,T.E.,KIM,K.-Y.A.,SWIDERSKI,R.E.,PHILP,A.R.,BRAUN,T.A.,KNUDTSON,K.L.,DORRANCE,A.M.,DIBONA,G.F.,HUANG,J.,CASAVANT,T.L.,SHEFFIELD,V.C.和STONE,E.M.(2006)。哺乳动物眼睛中基因表达的调节及其与眼病的相关性。美国国家科学院院刊103 14429-14434.
[73] SIMON,N.、FRIEDMAN,J.、HASTIE,T.和TIBSHIRANI,R.(2011)。基于坐标下降的Cox比例危险度模型的正则化路径。统计软件杂志39 1-13.
[74] STREET,W.N.、WOLBERG,W.H.和MANGASARIAN,O.L.(1993)。用于乳腺肿瘤诊断的核特征提取。IS&T/SPIE电子成像:科学与技术研讨会(R.S.ACHARYA和D.B.GOLDGOF编辑)861-870。SPIE公司。
[75] TAN,K.,SHI,L.和YU,Z.(2020年)。稀疏SIR:最佳速率和自适应估计。统计学年鉴48 64-85之间·Zbl 1451.62060号
[76] TIBSHIRANI,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志。B.系列方法58 267-288. ·Zbl 0850.62538号
[77] WANG,H.和XIA,Y.(2008)。用于降维的分段回归。美国统计协会杂志103 811-821. ·Zbl 1306.62168号
[78] 魏斯伯格,S.(2002)。R中的降维回归。统计软件杂志,文章7 1-22.
[79] WOLBERG,W.H.,STREET,W.N.和MANGASARIAN,O.L.(1994)。机器学习技术从细针抽吸物的图像处理核特征诊断乳腺癌。癌症信件77 163-171.
[80] WU,H.-M.(2008)。核切片逆回归及其在分类中的应用。计算与图形统计杂志17 590-610.
[81] 夏扬(2007)。一种估计尺寸缩减方向的建设性方法。统计学年鉴35 2654-2690. ·Zbl 1360.62196号
[82] 夏寅、童宏、李维凯和朱丽霞(2002)。降维空间的自适应估计。英国皇家统计学会杂志。B.系列统计方法64 363-410. ·Zbl 1091.62028号
[83] YIN,X.和HILAFU,H.(2015)。大p、小n问题的序贯充分降维。英国皇家统计学会杂志:B辑(统计方法)77 879-892. ·Zbl 1414.62194号
[84] ZENG,P.和ZHU,Y.(2010)。估计中心均值和中心子空间的积分变换方法。多元分析杂志101 271-290. ·Zbl 1177.62054号
[85] ZHANG,S.和LANG,Z.-Q.(2022)。基于正交最小二乘的线性分类快速特征选择。模式识别123 108419.
[86] ZHANG,X.、MAI,Q.和ZOU,H.(2020)。具有类别响应的充分降维中的最大分离子空间。机器学习研究杂志21 1-36. ·Zbl 1498.68288号
[87] 赵,Z.,LIN,Q.和刘,J.(2017)。LassoSIR:通过Lasso R软件包版本0.1.1的稀疏切片反向回归。
[88] ZHONG,W.,ZENG,P.,MA,P.,LIU,J.S.和ZHU,Y.(2005)。RSIR:用于模体发现的正则切片逆回归。生物信息学21 4169-4175.
[89] 朱丽霞和方国泰(1996)。切片逆回归核估计的渐近性。统计学年鉴24 1053-1068. ·Zbl 0864.62027号
[90] ZHU,Y.和ZENG,P.(2006)。估计回归中中心子空间和中心平均子空间的傅里叶方法。美国统计协会杂志101 1638-1651. ·Zbl 1171.62325号
[91] ZOU,H.和HASTIE,T.(2005)。通过弹性网进行规则化和变量选择。英国皇家统计学会学报B辑67 301-320. ·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。