×

Mapper的统计分析和参数选择。 (英语) Zbl 1444.62172号

摘要:在本文中,我们研究了一维映射器到其连续模拟Reeb图的统计收敛性问题。我们证明了Mapper是Reeb图的最优估计量,作为副产品,它提供了一种自动调整其参数并计算其拓扑特征(如循环和耀斑)置信域的方法。这样可以避免测试大型参数网格并将最稳定的参数保持在强制设置中的问题,强制设置广泛用于映射器的可视化、聚类和特征选择。

MSC公司:

62R40型 拓扑数据分析
62G15年 非参数容差和置信区域
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 阿拉文达克珊巴布。Z字形粗化、映射器稳定性和基因网络分析。博士论文,2013年。
[2] 乌尔里希·鲍尔(Ulrich Bauer)、葛晓音(Xiaoyin Ge)和王玉树(Yusu Wang)。测量Reeb Graphs之间的距离。2014年第30届计算几何研讨会论文集,第464–473页·Zbl 1395.68288号
[3] 乌尔里希·鲍尔(Ulrich Bauer)、伊丽莎白·蒙克(Elizabeth Munch)和王玉树(Yusu Wang)。Reeb图交错度量和函数畸变度量的强等价性。第31届计算几何研讨会论文集,2015年·Zbl 1382.58010号
[4] 西尔维娅·比亚索蒂(Silvia Biasotti)、达尼埃拉·乔治(Daniela Giorgi)、米歇拉·斯帕格诺(Michela Spagnuolo)和比安卡·法西迪耶诺(Bianca Falcidieno)。形状分析和应用的Reeb图。理论计算机科学,392:5-222008。35 ·Zbl 1134.68064号
[5] 格拉德·比亚和安德烈·马斯。PCA核估计。《统计与风险建模及其在金融和保险中的应用》,29(1):19-462012年·Zbl 1234.62091号
[6] Gilles Blanchard、Olivier Bousquet和Laurent Zwald。核主成分分析的统计性质。机器学习,66(2-3):259–2942007·Zbl 1078.68133号
[7] Micka¨el Buchet、Fr´ed´eric Chazal、Steve Oudot和Donald Sheehy。度量的有效且健壮的持久同调。2015年第26届离散算法研讨会论文集,第168-180页·Zbl 1371.55005号
[8] 马修·卡里尔。覆盖复合体。在GUDHI用户和参考手册中。GUDHI编辑委员会,2017年。统一资源定位地址http://gudhi.gforge.inria.fr/doc/latest/group__cover__complex.html。
[9] 马修·卡里尔和史蒂夫·奥多。Reeb图的局部等价性和诱导度量。第33届计算几何研讨会论文集,2017a·Zbl 1432.68504号
[10] 马修·卡里尔和史蒂夫·奥多。一维映射器的结构和稳定性。计算数学基础,2017b·Zbl 1387.68247号
[11] 埃里克·查扎尔(eric Chazal)神父、大卫·科恩·斯坦纳(David Cohen-Steiner)神父和昆汀·埃里戈特(Quentin M´erigot)神父。概率测度的几何推断。计算数学基础,11(6):733–7512011·Zbl 1230.62074号
[12] 埃里克·查扎尔神父、布列塔尼·法西、法布里奇奥·莱奇、亚历山德罗·里纳尔多、阿尔蒂·辛格和拉里·瓦瑟曼。关于持久性图和景观的引导。信息系统建模与分析,20(6):111-1202013。
[13] 埃里克·查扎尔(eric Chazal)神父、布列塔尼·法西(Brittany Fasy)、法布里奇奥·莱奇(Fabrizio Lecci)、伯特兰·米歇尔(Bertrand Michel)、亚历山德罗·里纳尔多(Alessandro Rinaldo)和拉里·瓦瑟曼。稳健的拓扑推理:到测度的距离和核距离。CoRR,abs/1412.71972014年。接受发表在《机器学习研究杂志》上·Zbl 1435.62452号
[14] 埃里克·查扎尔(eric Chazal)神父、布列塔尼·法西(Brittany Fasy)、法布里奇奥·莱奇(Fabrizio Lecci)、伯特兰·米歇尔(Bertrand Michel)、亚历山德罗·里纳尔多(Alessandro Rinaldo)和拉里·瓦瑟曼。持久同调的子采样方法。第32届机器学习国际会议论文集,第2143–2151页,2015a。
[15] 埃里克·查扎尔(eric Chazal)、马克·格利塞(Marc Glisse)、凯瑟琳·拉布鲁埃(Catherine Labru'ere)和伯特兰·米歇尔(Bertrand Michel)神父。拓扑数据分析中持久图估计的收敛速度。机器学习研究杂志,16:3603–36352015b·Zbl 1351.62009年
[16] 弗雷德里克·查扎尔、Vin de Silva、Marc Glisse和Steve Oudot。持久性模块的结构和稳定性。施普林格,2016年a·Zbl 1362.55002号
[17] 埃里克·查扎尔(eric Chazal)神父、帕斯卡·马萨特(Pascal Massart)神父和伯特兰·米歇尔(Bertrand Michel)神甫。稳健几何推理的收敛速度。《电子统计杂志》,10(2):2243–2286,2016b·兹比尔1347.62055
[18] X.Chen、A.Golovinskiy和T.Funkhouser。3D网格分割基准。ACM图形汇刊,28(3):2009年1月12日。
[19] 大卫·科恩·斯坦纳(David Cohen-Steiner)、赫伯特·埃德尔斯布鲁纳(Herbert Edelsbrunner)和约翰·哈勒(John Harer)。持久性图的稳定性。离散与计算几何,37(1):103–1202007。36 ·Zbl 1117.54027号
[20] 大卫·科恩·斯坦纳(David Cohen-Steiner)、赫伯特·埃德尔斯布鲁纳(Herbert Edelsbrunner)和约翰·哈勒(John Harer)。使用Poincar´e和Lefschetz对偶扩展持久性。计算数学基础,9(1):79-1032009·Zbl 1189.55002号
[21] 安东尼奥·库瓦斯(Antonio Cuevas)。集合估计:统计学和几何学之间的另一座桥梁。《Operativa研究指南》,25(2):71-852009年。
[22] 安东尼奥·奎瓦斯(Antonio Cuevas)和阿尔贝托·罗德(Alberto Rodr´´­guez-Casal)。关于边界估计。《应用概率进展》,第340-354页,2004年·Zbl 1045.62019号
[23] 文·德·席尔瓦(Vin de Silva)、伊丽莎白·蒙克(Elizabeth Munch)和阿米特·帕特尔(Amit Patel)。分类Reeb图。离散和计算几何,55:854–9062016·Zbl 1350.68271号
[24] 罗纳德·德沃尔和乔治·洛伦茨。构造近似法,第303卷。施普林格科学与商业媒体,1993年·Zbl 0797.41016号
[25] Tamal Dey和Yusu Wang。Reeb Graphs:近似和持久性。离散与计算几何,49(1):46-732013·Zbl 1261.68095号
[26] Tamal Dey、Facundo M´emoli和Yusu Wang。神经、Reeb空间、映射器和多尺度映射器的拓扑分析。《第33届计算几何研讨会论文集》,第77卷,第36:1–36:16页,2017年·Zbl 1436.55007号
[27] 巴巴拉·迪·法比奥和克劳迪娅·兰迪。曲面Reeb图的编辑距离。离散与计算几何,55(2):423–4612016·Zbl 1332.05038号
[28] 赫伯特·埃德尔斯布伦纳和约翰·哈勒。计算拓扑:简介。AMS书店,2010年·Zbl 1193.55001号
[29] 布列塔尼·法西(Brittany Fasy)、法布里奇奥·莱奇(Fabrizio Lecci)、亚历山德罗·里纳尔多(Alessandro Rinaldo)、拉里·瓦瑟曼(Larry Wasserman)、西瓦拉曼·巴拉克里希南(Sivaraman Balakrishnan)和阿尔蒂。持久性图的置信集。《统计年鉴》,42(6):2301–23392014年·Zbl 1310.62059号
[30] Jerome Friedman、Trevor Hastie和Robert Tibshirani。统计学习的要素。斯普林格统计系列,柏林,2001年·Zbl 0973.62007号
[31] 克里斯托弗·吉诺维塞(Christopher Genovese)、马可·佩罗内·佩西菲科(Marco Perone-Pacifico)、伊莎贝拉·威尔迪内利(Isabella Verdinelli)和拉里·瓦瑟曼(Larry Wasserman)。Hausdorff损失下的流形估计和奇异反褶积。《统计年鉴》,40:941–9632012a·Zbl 1274.62237号
[32] 克里斯托弗·吉诺维塞(Christopher Genovese)、马可·佩罗内·佩西菲科(Marco Perone-Pacifico)、伊莎贝拉·威尔迪内利(Isabella Verdinelli)和拉里·瓦瑟曼(Larry Wasserman)。Minimax流形估计。机器学习研究杂志,13:1263–12912012b·Zbl 1283.62112号
[33] TS.Hinks,X.Zhou,KJ。Staples,BD.Dimitrov,A.Manta,T.Petrossian,P.Lum,CG。JA史密斯。沃德、PH霍沃思、AF.Walls、SD、Gadola和R.Djukanovic。哮喘患者的先天性和适应性t细胞:与严重程度和疾病机制的关系。《过敏与临床免疫学杂志》,136(2):323–3332015。37
[34] P.Lum、G.Singh、A.Lehman、T.Ishkanov、M.Vejdemo Johansson、M.Alagappan、J.Carlsson和G.Carlsson。使用拓扑从复杂数据的形状中提取见解。《科学报告》,2013年3月。
[35] 德米特里·莫罗佐夫。持久性和稳定性的同调错觉。杜克大学计算机科学系博士论文,2008年。
[36] 伊丽莎白·蒙克和贝王。Reeb空间的范畴表示与Mapper之间的收敛性。《第32届计算几何研讨会论文集》,第51卷,第53:1–53:16页,2016年·Zbl 1388.68289号
[37] Sameer Nene、Shree Nayar和Hiroshi Murase。哥伦比亚对象图像库(COIL100)。技术报告CUCS-006-961996。
[38] 杰西卡·尼尔森(Jessica Nielson)、杰西·帕奎特(Jesse Paquette)、刘爱文(Aiwen Liu)、克里斯蒂安·关迪克(Cristian Guandique)、艾米·托瓦尔(Amy Tovar)、井上春树(Tomoo Inoue)、卡伦·阿曼达·欧文(Karen-Amanda Irvine)、约翰·根塞尔(John Gensel)、詹妮弗·克鲁克(Jennifer Kloke)、坦亚·彼得罗西安(。临床前脊髓损伤和创伤性脑损伤发现的拓扑数据分析。《自然通讯》,2015年6月。
[39] 史蒂夫·奥多特。持久性理论:从Quiver表示到数据分析。数学调查和专题论文排名209。美国数学学会,2015年·Zbl 1335.55001号
[40] 杰拉尔德·里文(Gerald Reaven)和鲁伯特·米勒(Rupert Miller)。试图通过多维分析确定化学性糖尿病的性质。《糖尿病》,16(1):17-241979年。
[41] 乔治·里布。Surles points singuliers d'une forme de Pfaff complete’entement int’egrable ou d'une-fonction num’erique。巴黎科学院,222:847-8491946年·Zbl 0063.06453号
[42] 马蒂奥·鲁科(Matteo Rucco)、伊曼纽拉·梅雷利(Emanuela Merelli)、达米尔·赫尔曼(Damir Herman)、德维·拉马南(Devi Ramanan)、坦尼亚·彼得罗西安(Tanya Petrossian)、洛伦佐·法尔塞蒂(Lorenzo Falsetti)、辛齐。利用拓扑数据分析诊断肺栓塞。《理论与应用计算机科学杂志》,9(1):41-552015年。
[43] G.Sarikonda、J.Pettus、S.Phatak、S.Sachithanantham、JF.Miller、JD。Wesley、E.Cadag、J.Chae、L.Ganesan、R.Mallios、S.Edelman、B.Peters和M.von Herrath。Cd8 t细胞对胰岛抗原的反应是1型糖尿病特有的,而cd4 t细胞对1型糖尿病和2型糖尿病都存在反应。《自身免疫杂志》,50:77–822014年。
[44] 约翰·肖·泰勒、克里斯托弗·威廉姆斯、尼洛·克里斯蒂亚尼尼和爵士·坎多拉。关于Gram矩阵的特征谱和核PCA的泛化误差。IEEE信息理论汇刊,51(7):2510–25222005·Zbl 1310.15076号
[45] 古吉特·辛格(Gurjeet Singh)、法昆多·梅莫利(Facundo M´emoli)和冈纳·卡尔松(Gunnar Carlsson)。高维数据集分析和三维对象识别的拓扑方法。在基于点的图形研讨会上,第91-100页,2007年。38
[46] 袁尧、孙健、黄旭辉、格雷格·鲍曼、古吉特·辛格、迈克尔·莱斯尼克、列奥尼达斯·吉巴斯、维杰伊·潘德和冈纳·卡尔松。探索生物分子折叠路径中低密度态的拓扑方法。化学物理杂志,130(14),2009。
[47] 余斌。阿苏德、法诺和勒康。Lucien Le Cam的Festschrift,第423-435页。施普林格,1997年·兹伯利0896.62032
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。