×

Simple Poisson PCA:一种同时确定维数的(稀疏)特征提取算法。 (英语) Zbl 1482.62020年

摘要:降维工具为分析高维大数据提供了一种流行的方法。本文提出了一种非高斯数据稀疏主成分分析算法。由于我们对该算法的兴趣源于文本数据分析中的应用,因此我们将重点放在泊松分布上,泊松分布广泛用于文本数据分析。除了稀疏性之外,我们的算法还能够有效地确定模型中所需的主成分数量(顺序确定)。通过合成数据和实际数据示例证明了我们方案的良好性能。

MSC公司:

62-08 统计问题的计算方法
62H25个 因子分析和主成分;对应分析

软件:

剪影
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bishop CM(1999)贝叶斯PCA。主题:神经信息处理系统的进展。第11卷,第382-388页
[2] Buntine,W.,EM和多项式PCA的变分扩展,马赫学习ECML,2002,23-34(2002)·Zbl 1014.68524号
[3] 柯林斯,M。;达斯古普塔,S。;Schapire,RE,《主成分分析对指数族的推广》,Adv Neural Inf Process Syst,14617-624(2002)
[4] 范,J。;Li,R.,《基于非一致惩罚似然的变量选择及其预言属性》,美国统计协会,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[5] Frommlet,F。;Nuel,G.,L0正则化的自适应脊过程,《公共科学图书馆·综合》,11,2,1-23(2016)·doi:10.1371/journal.pone.0148620
[6] Landgraf AJ,Lee Y(2015)广义主成分分析:饱和模型参数的投影。俄亥俄州立大学统计系技术报告,(890)。可从以下位置获得:http://www.stat.osu.edu网站/yklee/mss/tr890.pdf
[7] Li,J.等人。;Tao,D.,简单指数族PCA,IEEE Trans。神经网络。学习。系统。,24, 3, 485-497 (2013) ·doi:10.1109/TNNLS.2012.2234134
[8] Mackay,DJC,《概率网络和似然预测——监督神经网络实用贝叶斯方法综述》,网络计算神经系统,6,3,469-505(1995)·Zbl 0834.68098号 ·doi:10.1088/0954-898X_6_3_011
[9] 穆罕默德,S。;海勒,K。;Ghahramani,Z.,贝叶斯指数族PCA,Adv Neural Inf Process Syst,21089-1096(2009)
[10] Pearson,K.,《关于最接近空间点系的直线和平面》,Lond Edib Dublin Philos Mag J Sci,2,1,559-572(1901)·JFM 32.0710.04号 ·doi:10.1080/14786440109462720
[11] Rousseeuw,PJ,Silhouettes:聚类分析解释和验证的图形辅助,《计算应用数学杂志》,20,53-65(1987)·Zbl 0636.62059号 ·doi:10.1016/0377-0427(87)90125-7
[12] 斯莫尔曼,L。;Artemiou,A。;Morgan,J.,《稀疏广义主成分分析》,《模式识别》,83,443-455(2018)·doi:10.1016/j.patcog.2018年6月14日
[13] Tibshirani,R.,通过套索进行回归收缩和选择,J R Stat Soc Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号
[14] 小费,ME;Bishop,CM,概率主成分分析,J R Stat Soc Ser B(Stat Methodol),61,3,611-622(1999)·Zbl 0924.62068号 ·doi:10.1111/1467-9868.00196
[15] Yi,S。;赖,Z。;何,Z。;张,Y。;Liu,Y.,联合稀疏主成分分析,模式识别,61524-536(2017)·Zbl 1428.68266号 ·doi:10.1016/j.patcog.2016.08.025
[16] 邹,H。;哈斯蒂,T。;Tibshirani,R.,稀疏主成分分析,计算机图形统计杂志,2265-286(2006)·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。