朱、穆;阿里·戈德西 通过使用剖面似然从碎石图中自动选择尺寸。 (英语) Zbl 1157.62429号 计算。统计数据分析。 51,第2期,918-930(2006). 摘要:大多数降维技术都会生成有序坐标,因此在后续分析中只需考虑前几个坐标。使用多少坐标的选择通常是通过视觉启发式进行的,即通过绘制屏幕图并寻找“大间隙”或“弯头”。在本文中,我们提供了一个简单的自动过程,通过最大化简单的轮廓似然函数来实现这一目标。我们给出了各种模拟和实际示例。 引用于29文件 MSC公司: 62小时25分 因子分析和主成分;对应分析 62小时99 多变量分析 关键词:数据压缩;去噪;等距特征映射;潜在语义索引;流形学习;主成分分析;重采样方法;奇异值分解 软件:TMG公司;ElemStatLearn(电子状态学习) PDF格式BibTeX公司 XML格式引用 \textit{M.Zhu}和\textit{A.Ghodsi},计算。统计数据分析。51,第2号,918--930(2006;Zbl 1157.62429) 全文: 内政部 参考文献: [1] 考克斯,T.F。;考克斯,M.A.A.,《多维尺度》(2001),查普曼和霍尔出版社:纽约查普曼与霍尔出版社·Zbl 1004.91067号 [2] Deerwester,S.公司。;Dumais,S.T。;Landauer,T.K。;Furnas,G.W。;Harshman,R.A.,《潜在语义分析索引》,J.Soc.Inform。科学。,41, 6, 391-407 (1990) [3] Dumais,S.T.,《改进从外部来源检索信息》,《行为研究方法仪器》。计算。,23, 2, 229-236 (1991) [4] 哈斯蒂·T·J。;蒂布希拉尼,R.J。;Friedman,J.H.,《统计学习的要素:数据挖掘、推断和预测》(2001年),施普林格出版社:柏林施普林格·Zbl 0973.62007号 [5] Jolliffe,I.T.,主成分分析(2002),施普林格:柏林施普林格出版社·Zbl 1011.62064号 [6] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析(1979),学术出版社:纽约学术出版社·Zbl 0432.62029号 [7] 麦卡拉,P。;Nelder,J.A.,《广义线性模型》(1989),查普曼和霍尔出版社:纽约查普曼与霍尔出版社·Zbl 0744.62098号 [8] 彭,F。;舒尔曼斯,D。;Wang,S.,用统计语言模型增强朴素贝叶斯分类器,Inform。检索,7,3,317-345(2003) [9] Roweis,S.T。;Saul,L.K.,局部线性嵌入的非线性降维,《科学》,290,2323-2326(2000) [10] Salton,G。;Buckley,C.,自动文本检索中的术语权重方法,Inform。过程。管理,24,5,513-523(1988) [11] Sprott,D.A.,《科学中的统计推断》(2000),施普林格出版社·Zbl 0955.62006号 [12] Tenenbaum,J.B。;德席尔瓦,V。;Langford,J.C.,《非线性降维的全球几何框架》,《科学》,290,2319-2323(2000) [13] Zeimpekis,D.,Gallopoulos,E.,2004年。TMG:一个MATLAB工具箱,用于从文本集合生成术语文档矩阵。希腊帕特拉斯大学计算机工程与信息学系HPCLAB-SCG 1/6-04技术报告。;Zeimpekis,D.,Gallopoulos,E.,2004年。TMG:一个MATLAB工具箱,用于从文本集合生成术语文档矩阵。技术报告HPCLAB-SCG 1/6-04,希腊帕特拉斯大学计算机工程与信息学系。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。