×

噪声高维数据的多维缩放。 (英语) Zbl 1461.62235号

摘要:多维缩放(MDS)是一种在低维中嵌入数据的经典技术,至今仍在广泛使用。在本文中,我们研究了现代环境中的MDS,特别是高维和环境测量噪声。我们表明,随着环境噪声水平的增加,MDS会发生急剧崩溃,这取决于数据维数和噪声水平,并推导出白噪声情况下该崩溃点的显式公式。然后我们介绍了MDS+,它是MDS的一个简单变体,它将收缩非线性应用于MDS相似矩阵的特征值。在衡量嵌入质量的自然损失函数下,我们证明了MDS+是唯一的渐近最优收缩函数。与MDS相比,MDS+提供了改进的嵌入,有时效果显著。重要的是,MDS+计算最佳嵌入维度,数据应嵌入到其中。

MSC公司:

62兰特 大数据和数据科学的统计方面
62甲12 多元分析中的估计
62-08 统计问题的计算方法

软件:

MNIST公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 约书亚·特南鲍姆(Joshua Tenenbaum);De Silva,Vin;John Langford,《非线性降维的全球几何框架》,《科学》,29055002319-2323(2000)
[2] 萨姆·罗伊斯(Sam Roweis);Saul,Lawrence,通过局部线性嵌入降低非线性维数,《科学》,2902323-2326(2000)
[3] 罗纳德·科伊夫曼(Ronald R.Coifman)。;Lafon,Stéphane,扩散图,应用。计算。哈蒙。分析。,21, 5-30 (2006) ·Zbl 1095.68094号
[4] 帕斯卡·文森特;雨果·拉罗谢尔;约书亚·本吉奥;Manzagol,Pierre-Antoine,《利用去噪自动编码器提取和组合鲁棒特征》(第25届国际机器学习会议论文集(2008)),1096-1103
[5] 克里斯托弗·毕晓普。;马库斯·斯文森;Williams,Christopher KI,生成地形图的发展,神经计算,21203-224(1998)·Zbl 0936.68091号
[6] Aurélien Bellet,Amaury Habrard,Marc Sebban,《特征向量和结构化数据的度量学习调查》,arXiv,2013年·兹比尔1308.68005
[7] 约书亚·本吉奥;亚伦·库维尔(Aaron Courville);Vincent,Pascal,《表征学习:回顾与新视角》,IEEE Trans。模式分析。机器。智力。,35, 8, 1798-1828 (2013)
[8] 托格森,W.S.,《多维尺度:理论与方法》,《心理测量学》,第17期,第401-419页(1952年)·Zbl 0049.37603号
[9] 沃伦·托格森(Warren S.Torgerson),《尺度理论与方法》(1958),威利·Zbl 0049.37603号
[10] 约瑟夫·克鲁斯卡尔(Joseph B.Kruskal)。;Wish,Myron,多维缩放(1978),加利福尼亚州贝弗利山
[11] 特雷弗·考克斯;Cox,Michael,《多维尺度》(2000),查普曼和霍尔/CRC·Zbl 1004.91067号
[12] 伯格,英格尔;Patrick Groenen,《现代多维尺度:理论与应用》,J.Educ。测量。,40, 3, 277-280 (2003) ·Zbl 0862.62052号
[13] Young,Forrest W.,《多维尺度:历史、理论和应用》(2013),心理学出版社
[14] Michael C.Hout。;梅根·H·帕佩什。;Stephen D.Goldinger,多维标度,Wiley Interdiscip。版次,认知。科学。,4, 93-103 (2013)
[15] Cattell,Raymond B.,因子数的scree检验,Multivar。行为。第1245-276号决议(1966年)
[16] Peterfreund,Erez,“噪声高维数据的多维缩放”(2018)的代码补充,在线阅读
[17] Paul Debashis,《大维尖峰协方差模型样本特征结构的渐近性》,Stat.Sin。,17, 1617-1642 (2007) ·Zbl 1134.62029号
[18] Baik、Jinho;杰拉德·本·阿鲁斯;Péché,Sandrine,非零复样本协方差矩阵最大特征值的相变,Ann.Probab。,33, 1643-1697 (2005) ·Zbl 1086.15022号
[19] 大卫·L·多诺霍。;加维什语,马坦语;Johnstone,Iain M.,尖峰协方差模型中特征值的最佳收缩,Ann.Stat.(2018)·Zbl 1403.62099号
[20] Yann、LeCun;科琳娜、科尔特斯;Christopher,Burges,手写数字的MNIST数据库,Courant Inst.Math。科学。,1-10(1998年)
[21] Hideki Tanizawa;岩崎,奥萨木;田中、Atsunari;约瑟夫·卡皮齐(Joseph R.Capizzi)。;普里扬卡拉·维克拉马辛格;Lee,Mihee;傅志燕;Noma,Ken-ichi,《裂变酵母基因组的长程关联映射揭示了与转录调控相关的全球基因组组织》,《核酸研究》,38,8164-8177(2010)
[22] 扬,盖尔;Householder,Alston S.,根据相互距离讨论一组点,《心理测量学》,3,19-22(1938)·JFM 64.1302.04标准
[23] Gower,John C.,用于多元分析的潜在根和向量方法的一些距离特性,生物特征,53325-338(1966)·Zbl 0192.26003号
[24] 白志东;Silverstein,Jack W.,《大维随机矩阵的谱分析》,第20卷(2010年),Springer出版社·Zbl 1301.60002号
[25] 约瑟夫·克鲁斯卡尔(Joseph B.Kruskal),《通过优化非计量假设的拟合优度实现多维标度》,《心理测量学》,29,1-27(1964)·Zbl 0123.36803号
[26] Kruskal,J.B.,《非度量多维尺度:数值方法》,《心理测量学》,29115-129(1964)·Zbl 0123.36804号
[27] 考克斯,米切尔AA;Cox,Trevor F.,《多维标度中的应力解释》,《统计计算杂志》。模拟。,37, 211-223 (1990)
[28] Johnstone,Iain M.,《关于主成分分析中最大特征值的分布》,《Ann.Stat.》,295-327(2001)·Zbl 1016.62078号
[29] Lee,Seunggeun;邹飞;Fred A.Wright,《高维环境下主成分得分的收敛与预测》,《Ann.Stat.》,383605(2010)·兹比尔1204.62097
[30] Schönemann,Peter H.,正交procutes问题的广义解,《心理测量学》,31,1-10(1966)·Zbl 0147.19401号
[31] 约翰·赫利(John R.Hurley)。;雷蒙德·卡特尔(Raymond B.Cattell),《procrustes程序:产生直接旋转以测试假设的因子结构》(The procrusters program:producting direct rotation to test a virtualized factor structure),贝哈夫(Behav)。科学。,7258-262年(1962年)
[32] Forrester,Peter J.,Log-Gases and Random Matrices(2010),普林斯顿大学出版社·Zbl 1217.82003年
[33] David L.Donoho,Matan Gavish,《奇异值阈值矩阵去噪的最小风险》,arXiv,2014年·2014年10月13日
[34] 佛罗伦萨贝纳伊奇·乔治斯;Rao Nadakuditi,Raj,大型矩形随机矩阵低秩扰动的奇异值和向量,J.Multivar。分析。,111, 120-135 (2012) ·Zbl 1252.15039号
[35] 安德烈·沙巴林(Andrey A.Shabalin)。;Nobel,Andrew B.,《高斯噪声下低阶矩阵的重构》,J.Multivar。分析。,118, 67-76 (2013) ·Zbl 1280.15022号
[36] 大卫·多诺霍(David L.Donoho)。;Gavish,Matan,奇异值的最佳硬阈值为(4/\sqrt{3}),IEEE Trans。《信息论》,60,5040-5053(2014)·Zbl 1360.94071号
[37] 加维什语,马坦语;Donoho,David L.,奇异值的最优收缩,IEEE Trans。信息理论,63,4,2137-2152(2017)·Zbl 1366.94100号
[38] Damien Passemier,Jian Feng Yao,高维严格因子模型中的方差估计和良好性检验,arXiv,2013。
[39] 希拉、克里奇曼;Nadler,Boaz,《信号数量的非参数检测:假设检验和随机矩阵理论》,IEEE Trans。信号处理。,57, 3930-3941 (2009) ·Zbl 1391.94523号
[40] 弗拉基米尔·马尔琴科;Pastur,Leonid,一些随机矩阵集的特征值分布,数学。苏联Sb.,1457-483(1967)·Zbl 0162.22501号
[41] 罗曼·库伊莱特(Romain Couillet);Debbah,Merouane,《无线通信随机矩阵方法》(2011),剑桥大学出版社·Zbl 1252.94001号
[42] 佛罗伦萨贝纳伊奇·乔治斯;爱丽丝·吉奥奈特(Alice Guionnet);Maida,Mylène,随机矩阵有限秩变形的极值特征值的涨落,电子。J.Probab.等人。,16, 1621-1662 (2011) ·Zbl 1245.60007号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。