×

Minimal \(\ sigma \)-用于灵活、充分降维的字段。 (英语) Zbl 1493.62017年

摘要:在高维回归分析中,充分降维(SDR)成为缓解维数灾难的重要工具。最近,有人提出了柔性SDR(FSDR),通过发现低维投影来扩展SDR转化解释变量。然而,预测的维度不能完全代表FSDR可以实现的数据缩减程度。因此,FSDR的最优性和其他理论性质目前还没有得到很好的理解。在本文中,我们建议使用与投影相关的\(\西格玛\)-场及其维度来完全表征FSDR,并将\(\西格玛\)-场称为FSDR\(\西格玛\)-场。我们进一步引入最小FSDR(sigma)域的概念,并考虑具有最小(sigma-)域最优的FSDR投影。在一些温和的条件下,我们证明了最小FSDR(sigma)场的存在,同时达到了最低维数。为了估计最小FSDR(sigma)域,我们提出了一个称为广义核降维(GKDR)方法的两阶段过程,并部分建立了它在弱条件下的一致性。大量仿真实验表明,GKDR方法可以有效地找到最小FSDR(sigma)域,并且性能优于其他现有方法。GKDR应用于实际空气污染数据集,为大气条件与空气质量之间的关系提供了新的线索。

MSC公司:

62B05型 足够的统计数据和字段
62J02型 一般非线性回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] BILLINGSLEY,P.(2008)。概率与测度约翰·威利父子公司。
[2] BREIMAN,L.和FRIEDMAN,J.H.(1985)。估计多元回归和相关性的最佳转换。美国统计协会杂志80 580-598. ·Zbl 0594.62044号
[3] CHENG,Y.,HE,K.-B.,DU,Z.-Y.,ZHENG,M.,DUAN,F.-K.和MA,Y.-L.(2015)。湿度在PM2中起着重要作用。北京的污染。环境污染197 68-75.
[4] CHIAROMONTE,F.和COOK,R.D.(2002年)。足够的降维和回归图形。统计数学研究所年鉴54 768-795. ·Zbl 1047.62066号
[5] 库克·R·D·和韦斯伯格·S·(1991)。用于降维的分段反向回归:注释。美国统计协会杂志86 328-332. ·Zbl 1353.62037号
[6] COVER,T.M.和THOMAS,J.A.(2012年)。信息论要素约翰·威利父子公司。
[7] DE BOOR,C.、DE BOER,C.、MATH Ematicien,E.-U.、DE BOOR,C.和DE BOOR,C.(1978)。花键实用指南27.纽约斯普林格·弗拉格·Zbl 0406.41003号
[8] 樊J.和姚琼(1998)。随机回归中条件方差函数的有效估计。生物特征85 645-660. ·Zbl 0918.62065号
[9] FINE,S.和SCHEINBERG,K.(2001年)。使用低阶核表示的高效SVM训练。机器学习研究杂志2 243-264. ·Zbl 1037.68112号
[10] FUKUMIZU,K.、BACH,F.R.、JORDAN,M.I.等人(2009年)。回归中的内核降维。统计年鉴37 1871-1905. ·Zbl 1168.62049号
[11] FUKUMIZU,K.和LENG,C.(2014)。基于梯度的回归核降维。美国统计协会杂志109 359-370. ·Zbl 1367.62118号
[12] Hastie,T.J.和Tibshirani,R.J.(1990年)。广义可加模型43.CRC出版社·Zbl 0747.62061号
[13] HUANG,K.,ZHUANG,G.,WANG,Q.,FU,J.,LIN,Y.,LIU,T.,HAN,L.和DENG,C.(2014)。2013年1月北京极端雾霾污染:化学特征、形成机制和雾气处理的作用。大气化学和物理讨论14 7517-7556.
[14] JIA,Y.、RAHN,K.A.、HE,K.、WEN,T.和WANG,Y.(2008)。一种新技术,用于仅根据锯齿波周期量化城市气溶胶的区域成分。地球物理研究杂志:大气113
[15] KOBAYASHI,S.和NOMIZU,K.(1963年)。微分几何基础1.跨学科出版商纽约·Zbl 0119.37502号
[16] LEE,K.-Y.,LI,B.,CHIAROMONTE,F.等人(2013)。非线性充分降维的一般理论:公式和估计。统计年鉴41 221-249·Zbl 1347.62018年
[17] 李克诚(1991)。用于降维的分段反向回归。美国统计协会杂志86 316-327. ·Zbl 0742.62044号
[18] LIAN,H.和WANG,Q.(2016)。核加性切片逆回归。中国统计局527-546. ·兹比尔1360.62181
[19] LIANG,X.,LI,S.,ZHANG,S.、HUANG,H.和CHEN,S.X.(2016)。中国五个城市PM2.5数据的可靠性、一致性和空气质量评估。地球物理研究杂志:大气121
[20] ROBERT,P.和ESCOUFIER,Y.(1976年)。线性多变量统计方法的统一工具:RV系数。英国皇家统计学会杂志25 257-265.
[21] Van der Vaart,A.W.(2000年)。渐近统计3.剑桥大学出版社·Zbl 0943.6202号
[22] WANG,L.和YANG,L.(2009)。单指标模型的样条估计。中国统计局19 765. ·Zbl 1166.62023号
[23] WANG,T.和ZHU,L.(2018)。回归中的灵活降维。中国统计局28 1009-1029. ·Zbl 1390.62126号
[24] WEN,Z.和YIN,W.(2013)。一种可行的正交约束优化方法。数学规划142 397-434. ·Zbl 1281.49030号
[25] 威廉姆斯,C.K.和西格,M.(2001)。使用Nyström方法加速内核机器。神经信息处理系统的研究进展682-688.
[26] WU,H.M.(2008)。核切片逆回归及其在分类中的应用。计算与图形统计杂志17 590-610.
[27] XIA,Y.、TONG,H.、LI,W.和ZHU,L.-X.(2002)。降维空间的自适应估计。英国皇家统计学会杂志:B辑(统计方法)64 363-410. ·Zbl 1091.62028号
[28] ZHANG,R.、WANG,G.、GUO,S.、ZAMORA,M.L.、YING,Q.、LIN,Y.、WANG,W.、HU,M.和WANG,Y.(2015)。城市细颗粒物的形成。化学品审查115 3803-3855.
[29] ZHU,Y.和ZENG,P.(2006)。用于估计回归中的中心子空间和中心均值子空间的傅立叶方法。美国统计协会杂志101 1638-1651. ·Zbl 1171.62325号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。