×

概率原型分析。 (英语) Zbl 1352.62083号

摘要:原型分析将一组观察结果表示为纯模式或原型的凸组合。通过近似观察值的凸包来寻找原型的原始几何公式假设它们是实际值。不幸的是,这与许多实际情况不相符。在本文中,我们从基本原理重新审视了原型分析,并提出了一个概率框架,该框架可容纳其他观察类型,如整数、二进制和概率向量。我们通过令人信服的实际应用验证了所提出的方法,即基于表现数据的原型足球运动员、基于二进制调查数据的原型冬季游客、基于灾难计数数据的原型受影响国家以及基于术语频率数据的文档原型。我们还提供了一个合适的可视化工具来更好地总结原型分析解决方案。

数学溢出问题:

足球的数学基础

MSC公司:

62甲12 多元分析中的估计
62年02月 一般非线性回归
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bache,K.和Lichman,M.(2013)。UCI机器学习库。http://archive.ics.uci.edu/ml。
[2] Bauckhage,C.和Thurau,C.(2009年)。使原型分析实用化。在模式识别方面,计算机科学课堂讲稿,第5748卷,施普林格,柏林-海德堡,第272-281页。doi:10.1007/978-3642-03798-6_28。
[3] Bhattacharya,A.和Dunson,D.B.(2012年)。多元无序分类数据的单因子模型。《美国统计协会杂志》,107(497),362-377。doi:10.1080/01621459.2011.646934·Zbl 1263.62097号 ·doi:10.1080/01621459.2011.646934
[4] Blei,D.M.、Ng,A.Y.和Jordan,M.I.(2003年)。潜在的dirichlet分配。机器学习研究杂志,3,993-1022·Zbl 1112.68379号
[5] Chan,B.H.P.、Mitchell,D.A.和Cram,L.E.(2003)。星系光谱的原型分析。皇家天文学会月刊,338(3),790-795。doi:10.1046/j.1365-8711.2003.06099.x·文件编号:10.1046/j.1365-8711.2003.06099.x
[6] Cutler,A.和Stone,E.(1997年)。移动原型。《物理学D:非线性现象》,107(1),1-16。doi:10.1016/S0167-2789(97)84209-1,http://www.sciencedirect.com/science/article/pii/S0167278997842091。 ·Zbl 1369.68285号
[7] Cutler,A.和Breiman,L.(1994)。原型分析。技术计量学,36(4),338-347·Zbl 0804.62002号 ·doi:10.1080/00401706.1994.10485840
[8] Davis,T.和Love,B.C.(2010年)。通过与竞争选项的对比,类别信息的记忆得到了理想化。心理科学,21(2),234-242。doi:10.1177/0956797609357712·数字对象标识代码:10.1177/0956797609357712
[9] Ding,C.,Li,T.,Peng,W.和Park,H.(2006年)。用于聚类的正交非负矩阵三因子分解。第12届ACM SIGKDD知识发现和数据挖掘国际会议论文集,第126-135页。doi:10.1145/1150402.1150420。
[10] Ding,C.H.Q.,Li,T.和Jordan,M.I.(2010年)。凸矩阵分解和半非负矩阵分解。IEEE模式分析和机器智能汇刊,32(1),45-55·doi:10.10109/TPAMI.2008.277
[11] Dolnicar,S.和Leisc,F.(2004年)。通过袋装集群细分市场。《澳大利亚营销杂志》,12(1),51-65·doi:10.1016/S1441-3582(04)70088-9
[12] do Nascimento,J.M.P.和Dias,J.M B.(2005)。顶点分量分析:一种快速算法,用于解混高光谱数据。IEEE地球科学与遥感汇刊,43(4),898-910。doi:10.1109/TGRS.2005.844293·doi:10.1109/TGRS.2005.844293
[13] Dolnicar,S.、Grün,B.和Leisch,F.(2011年)。快速、简单、可靠:强制二元调查问题。《国际市场研究杂志》,53(2),231-252。doi:10.2501/IJMR-53-2-231-252·doi:10.2501/IJMR-53-2-231-252
[14] EM-DAT(2013)。OFDA/CRED国际灾难数据库。比利时布鲁塞尔卢万天主教大学;http://www.emdat.net。
[15] Eugster,M.J.A.和Leisch,F.(2013年)。原型:原型分析。http://CRAN.R-project.org/package=原型,R包版本2.1-2·Zbl 1328.65027号
[16] Eugster,M.J.A.和Leisch,F.(2011年)。加权和稳健的原型分析。计算统计与数据分析,55(3),1215-1225。doi:10.1016/j.csda.2010.10.017·Zbl 1328.65027号 ·doi:10.1016/j.csda.2010.10.017
[17] Eugster,M.J.A.(2012年)。基于原型运动员的绩效档案。国际运动成绩分析杂志,12(1),166-187。
[18] Févotte,C.和Idier,J.(2011年)。具有贝塔发散性的非负矩阵分解算法。神经计算,23(9),2421-2456·Zbl 1231.65072号 ·doi:10.1162/NECO_a_00168
[19] Friendly,M.(2000)。可视化分类数据。北卡罗来纳州卡里:SAS研究所·Zbl 1429.62015号
[20] Hahsler,M.和Hornik,K.(2007年)。旅行销售人员问题的TSP基础设施。《统计软件杂志》,23(2),1-21。http://www.jstatsoft.org/v23/i02/。
[21] Hofmann,T.(1999)。概率潜在语义索引。在第22届ACM SIGIR信息检索研究与开发国际年会的会议记录中。ACM,美国纽约州纽约市,SIGIR’99,第50-57页。数字对象标识代码:10.1145/312624.312649
[22] Lee,D.D.和Seung,H.S.(2000年)。非负矩阵分解算法。《神经信息处理系统进展》,第13卷,第556-562页·Zbl 1231.65072号
[23] Lee,D.D.和Seung,H.S.(1999年)。通过非负矩阵分解学习对象的各个部分。《自然》,401(6755),788-791。doi:10.1038/44565·Zbl 1369.68285号 ·doi:10.1038/44565
[24] Li,S.、Louviere,J.、Carson,R.和Wang,P.(2003)。原型分析:一种基于极端个体细分市场的新方法。艾伦伯格和贝斯的庆祝活动:营销知识、发现和贡献。ANZMAC 2003年会议记录。http://epres.lib.uts.edu.au/research/handle/10453/2183。 ·Zbl 1328.65027号
[25] Marinetti,S.、Finesso,L.和Marsilio,E.(2007年)。红外图像序列的原型和主要成分。红外物理与技术,49(3),272-276。doi:10.1016/j.infrared.2006.06.017,http://www.sciencedirect.com/science/article/pii/S1350449506000910。
[26] Mohamed,S.、Heller,K.A.和Ghahramani,Z.(2009年)。贝叶斯指数族PCA。《神经信息处理系统进展》,第21卷,第1089-1096页。
[27] Mørup,M.和Hansen,L.K.(2012年)。机器学习和数据挖掘的原型分析。神经计算,80,54-63。doi:10.1016/j.neucom.2011.06.033·doi:10.1016/j.neucom.2011.06.033
[28] Porzio,G.C.、Ragozini,G.、Vistocco,D.(2008)。关于原型作为基准的使用。《商业和工业中的应用随机模型》,24(5),419-437。doi:10.1002/asmb.727,http://onlinelibrary.wiley.com/doi/10.1002/asmb.727/abstract。 ·Zbl 1199.90016号
[29] Seiler,C.和Wohlrabe,K.(2013年)。原型科学家。信息计量学杂志,7(2),345-356。doi:10.1016/j.joi.2012.11.013·doi:10.1016/j.joi.2012.11.013
[30] Sifa,R.和Bauckhage,C.(2013)。原型动作:通过原型分析指导游戏行为学习。摘自:2013年IEEE游戏计算智能会议(CIG),第1-8页。doi:10.1109/CIG.2013.6633609。
[31] Steinley,D.(2006)。K-表示聚类:半个世纪的综合。英国数学与统计心理学杂志,59(1),1-34。doi:10.1348/000711005X48266·doi:10.1348/000711005X48266
[32] Stone,E.和Cutler,A.(1996年)。时空动态的原型分析。《物理学D:非线性现象》,90(3),209-224。doi:10.1016/0167-2789(95)00244-8·Zbl 0900.76189号 ·doi:10.1016/0167-2789(95)00244-8
[33] Thögersen,J.C.、Mörup,M.、Damkiñr,S.、Molin,S.和Jelsbak,L.(2013)。不同铜绿假单胞菌转录组的原型分析揭示了囊性纤维化气道的适应性。BMC生物信息学,14(1),279。doi:10.1186/1471-2105-14-279,http://www.biomedcentral.com/1471-2105/14/279/abstract。 ·Zbl 1263.62097号
[34] Thurau,C.、Kersting,K.和Bauckhage,C.(2009年)。野生凸非负矩阵分解。在2009年第九届IEEE数据挖掘国际会议上。ICDM’09,第523-532页。doi:10.1010/ICM.2009.55。
[35] Thurau,C.、Kersting,K.和Bauckhage,C.(2010年)。是的,我们可以:用于描述性网络规模矩阵分解的单纯形体积最大化。摘自:第19届ACM信息和知识管理国际会议记录,ACM,美国纽约州纽约市,CIKM’10,第1785-1788页。doi:10.1145/1871437.1871729。
[36] Tibshirani,R.和Walter,G.(2005年)。通过预测强度进行聚类验证。计算与图形统计杂志,14,511-528·doi:10.1198/106186005X59243
[37] Woodbury,M.A.和Clive,J.(1974年)。临床纯类型作为模糊划分。控制论杂志,4(3),111-121。doi:10.1080/01969727408621685·Zbl 0322.62071号 ·doi:10.1080/01969727408621685
[38] Xiong,Y.、Liu,W.、Zhao,D.和Tang,X.(2013)。通过原型外壳排名进行人脸识别。2013年IEEE计算机视觉国际会议(ICCV),第585-592页。doi:10.1109/ICCV.2013.78。
[39] Yang,Z.和Oja,E.(2012)。低秩双随机矩阵分解聚类。arXiv:12064676号http://arxiv.org/abs/1206.4676。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。