×

可持续性的描述性矩阵分解。采用对立原则。 (英语) Zbl 1235.6202号

概述:气候变化、全球能源足迹和可持续发展战略已成为相当重要的政治和公共利益话题。公众辩论的信息来源于成倍增长的数据量,在口译方面存在不同的党派利益。因此,我们认为需要数据分析方法,以提供即使是非专业人士也能直观理解的结果。此外,这些方法应该是有效的,以便非专业用户可以低成本进行自己的分析,以了解不同参数和影响因素的影响。
我们讨论了一种新的分解数据矩阵的技术,它可以满足这两个要求。其基本思想是通过极值数据点的凸组合来表示一组数据。这通常适应人类认知。与已有的因子分解方法相比,本文提出的方法还可以确定过完备基。同时,凸组合允许高效的矩阵分解。基于距离几何领域所采用的技术,我们导出了一种线性时间算法,以确定适合分解的基向量。通过几个环境和发展数据集的例子,我们讨论了所提出方法的性能和特征,并验证了与现有的凸性约束方法相比,在不降低性能的情况下可以获得显著的效率增益。

MSC公司:

62-07 数据分析(统计)(MSC2010)
62页第12页 统计在环境和相关主题中的应用
15A23型 矩阵的因式分解

软件:

MapReduce
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Achlioptas D,McSherry F(2007)低阶矩阵近似的快速计算。美国临床医学杂志54(9):1–19·Zbl 1311.94031号
[2] Aguilar O,Huerta G,Prado R,West M(1998)时间序列中潜在结构的贝叶斯推断。收录:Bernardo J、Bergen J、Dawid A、Smith A(编辑)贝叶斯统计。牛津大学出版社·Zbl 0974.62066号
[3] Blumenthal LM(1953)距离几何的理论和应用。牛津大学出版社·Zbl 0050.38502号
[4] Chan B,Mitchell D,Cram L(2003)星系光谱的原型分析。Mon Not R Astron Soc蒙诺·R·阿斯顿Soc 338(3):790–795·文件编号:10.1046/j.1365-8711.2003.06099.x
[5] Chang CI,Wu CC,Liu WM,Ouyang YC(2006)基于单纯形的端点提取算法的一种新的增长方法。IEEE T Geosci Remote 44(10):2804–2819·doi:10.1109/TGRS.2006.881803
[6] Crippen G(1988)距离几何和分子构象。纽约威利·Zbl 1066.51500号
[7] Cutler A,Breiman L(1994)原型分析。技术计量36(4):338–347·Zbl 0804.62002号 ·doi:10.1080/00401706.1994.10485840
[8] Dean J,Ghemawat S(2008)Mapreduce:大型集群上的简化数据处理。通信ACM 51(1):107–113·Zbl 05394988号 ·数字对象标识代码:10.1145/1227452.1327492
[9] Ding C,Li T,Jordan M(2010)凸矩阵分解与半非负矩阵分解。IEEE T型分析32(1):45–55·doi:10.10109/TPAMI.2008.277
[10] Drineas P,Kannan R,Mahoney M(2006)快速蒙特卡罗算法III:计算压缩近似矩阵分解。SIAM J计算36(1):184–206·Zbl 1111.68149号 ·doi:10.1137/S0097539704442702
[11] Faloutsos C,Lin KI(1995)FastMap:传统和多媒体数据集的索引、数据挖掘和可视化的快速算法。摘自:圣地亚哥ACM SIGMOD国际数据管理会议记录
[12] Foster D,Nascimento S,Amano K(2004)自然场景中彩色表面神经识别的信息限制。视觉神经科学21:331–336·doi:10.1017/S0952523804213335
[13] Gomes C(2009)计算可持续性。桥梁,国家工程学院39(4):6–11
[14] Goreinov SA,Tyrtyshnikov EE(2001)低秩矩阵近似中的最大体积概念。当代数学280:47–51·Zbl 1003.15025号 ·doi:10.1090/conm/280/4620
[15] Hotelling H(1933)将复杂的统计变量分析为主成分。教育心理学杂志24(7):498–520·JFM 59.1182.04号文件 ·doi:10.1037/h0070888
[16] Kersting K,Wahabzada M,Thurau C,Bauckhage C(2010)聚类海量数据的层次凸NMF。In:第二届亚洲机器学习会议(ACML-10)会议记录·Zbl 1235.6202号
[17] Lee DD,Seung HS(1999)通过非负矩阵分解学习对象的各个部分。自然401(6755):788–799·Zbl 1369.68285号 ·doi:10.1038/44565
[18] Lucas A,Klaassen P,Spreij P,Straetmans S(2003)一般潜在因素模型信用损失分布的尾部行为。应用数学金融10(4):337–357·Zbl 1070.91032号 ·doi:10.1080/1350486032000160786
[19] 麦凯D(2009)《可持续能源——无热空气》。剑桥UIT有限公司
[20] Miao L,Qi H(2007)使用最小体积约束非负矩阵分解从高度混合数据中提取端元。IEEE T Geosci Remote 45(3):765–777·doi:10.1109/TGRS.2006.888466
[21] Nascimento JMP,Dias JMB(2005)《顶点分量分析:解混高光谱数据的快速算法》。IEEE T Geosci Remote 43(4):898–910·doi:10.1109/TGRS.2005.844293
[22] Ostrouchov G,Samatova N(2005)《关于多元数据的快速映射和凸壳:走向快速稳健的降维》。IEEE T型分析27(8):1340–1434·Zbl 05112032号 ·doi:10.1109/TPAMI.2005.164
[23] Sippl M,Sheraga H(1986)Cayley-Menger坐标。国家科学院院刊83(8):2283–2287·Zbl 0587.51013号 ·doi:10.1073/pnas.83.8.2283
[24] 斯皮尔曼C(1904)一般智力是客观确定和衡量的。美国心理学杂志15:201–293·doi:10.307/1412107
[25] Thurau C,Kersting K,Bauckhage C(2009)野外凸非负矩阵分解。在:IEEE国际数据挖掘会议论文集,迈阿密·Zbl 1235.6202号
[26] Thurau C,Kersting K,Wahabzada M,Bauckhage C(2010)大规模数据集的凸非负矩阵分解。知识信息系统(KAIS)。doi:10.1007/s10115-010-0352-6·Zbl 1235.6202号
[27] Winter ME(1999)N-FINDR:高光谱数据中快速自主光谱端元测定的算法。摘自:温哥华应用地质遥感国际会议记录
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。