×

高维和非欧几里德数据的多尺度几何特征提取及其应用。 (英语) Zbl 1468.62303号

摘要:提出并分析了一种从数据云中提取多尺度几何特征的方法。基于几何考虑,我们将每对数据点映射为一个基于单位区间定义的实值特征函数。然后根据特征函数的集合进行进一步的统计分析。通过不同的应用,包括分类和异常检测,说明了该方法的潜力。还探讨了与其他概念的联系,如随机集理论、局部深度测度和非线性降维。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G07年 密度估算
62兰特 度量空间统计

软件:

SiZer公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aeberhard,S.、Coomans,D.和de Vel,O.(1994)。C高维环境下统计模式识别方法的比较分析。模式识别27 1065-1077.
[2] Agostinelli,C.(2018)。功能数据的局部半区域深度。《多元分析杂志》。163 67-79. ·Zbl 1490.62512号 ·doi:10.1016/j.jmva.2017.10.004
[3] Agostinelli,C.和Romanazzi,M.(2011)。局部深度。J.统计。计划。推断141 817-830. ·Zbl 1353.62019年 ·doi:10.1016/j.jspi.2010.08.001
[4] Alon,U.、Barkai,N.、Notterman,D.A.、Gish,K.、Ybara,S.、Mack,D.和Levine,A.J.(1999)。寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示了广泛的基因表达模式。程序。国家。阿卡德。科学。美国96 6745-6750.
[5] Bubenik,P.(2015)。使用持久性环境进行统计拓扑数据分析。J.马赫。学习。物件。16 77-102. ·Zbl 1337.68221号
[6] Bubenik,P.和Kim,P.T.(2007)。持久同源性的统计方法。同伦,同伦应用。9 337-362. ·兹比尔1136.55004
[7] Campos,G.O.、Zimek,A.、Sander,J.、Campello,R.J.G.B.、Micenková,B.、Schubert,E.、Assent,I.和Houle,M.E.(2016)。非监督异常值检测的评估:测量、数据集和实证研究。数据最小知识。发现。30 891-927. ·doi:10.1007/s10618-015-0444-8
[8] Chandler,G.和Polonik,W.(2021年)。对“高维和非欧几里得数据的多尺度几何特征提取及其应用”的补充https://doi.org/10.1214/20-AOS1988SUPP(网址:https://doi.org/10.1214/20-AOS1988SUPP)
[9] Chaudhuri,P.和Marron,J.S.(1999年)。曲线结构勘探的SiZer。J.Amer。统计师。协会。94 807-823. ·Zbl 1072.62556号 ·doi:10.2307/2669996
[10] Chen,Y.、Dang,X.、Peng,H.和Bart,H.L.(2008)。利用核化空间深度函数进行离群点检测。IEEE传输。模式分析。机器。智力。31 288-305.
[11] Cuturi,M.(2010年)。机器学习技术报告中的正定核。
[12] Dutta,S.、Sarkar,S.和Ghosh,A.K.(2016)。使用局部空间深度的多尺度分类。J.马赫。学习。物件。17第ID 218条·Zbl 1434.62119号
[13] Einmahl,J.H.J.和Mason,D.M.(1992年)。广义分位数过程。安。统计师。20 1062-1078. ·Zbl 0757.60012号 ·doi:10.1214/aos/1176348670
[14] Elmore,R.T.、Hettmansperger,T.P.和Xuan,F.(2006)。球形数据深度和多元中值。数据深度:稳健多元分析、计算几何及应用.DIMACS系列。离散数学。理论。计算。科学。72 87-101. 阿默尔。数学。佛罗里达州普罗维登斯Soc。
[15] Fraiman,R.、Gamboa,F.和Moreno,L.(2019年)。按深度连接两两测地线球体:DCOPS。《多元分析杂志》。169 81-94. ·Zbl 1404.60070号 ·doi:10.1016/j.jmva.2018.08.008
[16] Genton,M.G.(2002)。机器学习的内核类:统计学的观点。J.马赫。学习。物件。2 293-312. ·Zbl 1037.68111号 ·网址:10.1162/15324430260185637
[17] Kotík,L.和Hlubinka,D.(2017年)。半空间深度的加权局部化及其性质。《多元分析杂志》。157 53-69. ·Zbl 1362.62029号 ·doi:10.1016/j.jmva.2017.02.008
[18] Leng,X.和Müller,H.-G.(2006年)。使用功能数据分析对时间基因表达数据进行分类。生物信息学22 68-76. ·doi:10.1093/bioinformatics/bti742
[19] 刘瑞云(1988)。关于简单深度的概念。程序。国家。阿卡德。科学。美国85 1732-1734. ·Zbl 0635.62039号 ·doi:10.1073/pnas.85.6.1732
[20] 刘瑞云(1990)。基于随机单纯形的数据深度概念。安。统计师。18 405-414. ·Zbl 0701.62063号 ·doi:10.1214操作系统/117634707
[21] 马萨诸塞州J.-C.(2004年)。Tukey深度过程的渐近性,以及对多元修剪平均值的应用。伯努利10 397-419. ·Zbl 1053.62021号 ·doi:10.3150/bj/1089206404
[22] Minotte,M.和Scott,D.(1993年)。模式树:用于可视化非参数密度特征的工具。J.计算。图表。统计师。2 51-68.
[23] Paindaveine,D.和Van Bever,G.(2013年)。从深度到局部深度:关注中心性。J.Amer。统计师。协会。108 1105-1119. ·Zbl 06224990号 ·doi:10.1080/01621459.2013.813390
[24] Pham,N.(2018)。L1-深度重访:高维空间中基于角度的稳健异常因子。数据库中的机器学习与知识发现105-121. 柏林施普林格。
[25] Rényi,A.和Sulanke,R.(1963年)。这是一个很好的例子。Z.Wahrsch公司。版本。盖比岩2 75-84. ·Zbl 0118.13701号 ·doi:10.1007/BF00535300
[26] Serfling,R.(2019年)。一般数据空间上的深度函数,I.透视图,考虑“密度”和“局部”深度。可在https://personal.utdallas.edu(个人网站)/农奴制/论文/I.透视.pdf。
[27] Shawe Taylor,J.和Cristianini,N.(2004年)。模式分析的核方法剑桥大学出版社,剑桥。
[28] Spellman,P.T.、Sherlock,G.、Zhang,M.Q.、Iyer,V.R.、Anders,K.、Eisen,M.B.、Brown,P.O.、Botstein,D.和Futcher,B.(1998)。利用微阵列杂交技术对酿酒酵母细胞周期调控基因的综合鉴定。分子生物学。单元格9 3273-3297.
[29] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.(2000)。非线性降维的全局几何框架。科学类290 2319-2323.
[30] Ting,K.M.、Zhou,G.-T.、Liu,F.-T.和Tan,S.C.(2013)。质量估算。机器。学习。90 127-160. ·Zbl 1260.68349号 ·doi:10.1007/s10994-012-5303-x
[31] Zuo,Y.和Serfling,R.(2000)。统计深度函数的一般概念。安。统计师。28 461-482 ·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。