×

持久性图的功能摘要。 (英语) Zbl 1452.62999号

持久性图/条形码不是统计和机器学习的自然对象,因此需要将这些对象映射到各种功能摘要和向量表示中。本文首先简要回顾了出现的不同功能摘要。在后面的部分中,将这些总结应用于两个数据应用程序,即前列腺癌的模拟结构形态学和纤维蛋白网络,并将结果进行比较。
理论部分侧重于不同功能总结的共同基础,尤其侧重于其中一个功能的概括,即广义景观功能。这种泛化允许使用标准三角形内核以外的内核构建横向函数。不同的内核允许使用带宽参数来控制持久性图的特征是如何捕获的,并且声称图上的重要特征是用较少的通用横向函数捕获的,这是一种降维形式。
论文的理论部分显示了函数总结的统计结果,例如样本均值收敛到总体均值,以及广义景观函数的置信带。同时还讨论了零假设、分类和聚类的两个样本检验。
有趣的是,在应用部分,广义景观函数的分类性能优于其他一些总结以及具有不同带宽参数的其他广义景观函数。这证明了更灵活的方法的有效性,可以通过参数调整优化分类性能。当然,这会带来额外的成本,即必须选择一个内核并找到最佳参数,但这是标准的机器学习实践。

理学硕士:

62R40型 拓扑数据分析
62兰特 功能数据分析
62H30型 分类和区分;聚类分析(统计方面)
62G15年 非参数容差和置信区域
55N31号 持久同源性及其应用,拓扑数据分析
68T05型 人工智能中的学习和自适应系统
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿卜杜拉希,A。;Meysamie,A。;Sheikhbahaei,S。;Ahmadi,A。;大不里士,HM;Bakhshandeh,M。;Hosseinzadeh,H.,伊朗病理学家前列腺癌Gleason评分的国际/观察者内重复性,Urol。J.,9,2,486-490(2012)
[2] Adams,H。;艾默生,T。;Kirby,M。;内维尔·R。;彼得森,C。;希普曼,P。;Chepushtanova,S。;Hanson,E。;莫塔·F。;Ziegelmeier,L.,《持久性图像:持久性同源性的稳定向量表示》,J.Mach。学习。决议,18,1,218-252(2017)
[3] 阿德科克。;卡尔森,E。;Carlsson,G.,持久性条形码上的代数函数环,Homol。同伦应用。,1818-402(2016)·兹比尔1420.55017
[4] 阿德勒,RJ,《关于偏移集、管状公式和随机场的最大值》,《应用年鉴》。概率。,10, 1-74 (2000) ·Zbl 1171.60338号
[5] 阿德勒,RJ;Agami,S.,用平面点过程建模持久性图,并用袋图揭示拓扑结构,J.Appl。计算。白杨。,3, 3, 139-183 (2019) ·Zbl 1441.62936号
[6] Adler,R.J.,Bobrowski,O.,Borman,M.S.,Subag,E.,Weinberger,S.:随机场和复合物的持久同源性。收录于:《借力:理论驱动应用——劳伦斯·D·布朗的艺术史》,第6卷,第124-143页。数理统计研究所(2010)
[7] 本迪,P。;马龙,JS;米勒,E。;Pieloch,A。;Skwerer,S.,脑动脉树的持续同源性分析,Ann.Appl。统计,10,1,198(2016)
[8] Biscio,C.,Möller,J.:累积持久性函数,一种用于拓扑数据分析的新的有用函数摘要统计,以期用于脑动脉树和空间点处理应用。arXiv预印arXiv:1611.00630(2016)
[9] Bubenik,P.,《使用持久性景观的统计拓扑数据分析》,J.Mach。学习。第16号、第1号、第77-102号决议(2015年)·Zbl 1337.68221号
[10] 坎贝尔,RA;奥维迈尔,KA;塞尔兹曼,CH;谢里丹,不列颠哥伦比亚省;Wolberg,AS,血管外和血管内细胞对纤维蛋白网络形成、结构和稳定性的贡献,血液,114,23,4886-4896(2009)
[11] Carlsson,G.,Topology and data,布尔。美国数学。Soc.,46,2,255-308(2009)·Zbl 1172.62002号
[12] Carlsson,G.、Zomordian,A.、Collins,A.和Guibas,L.J.:形状的持久性条形码。国际J形状模型。11(2), 149-187 (2005) ·Zbl 1092.68688号
[13] 中心,MM;杰马尔,A。;Lortet Tie昆斯,J。;沃德,E。;Ferlay,J。;O.布劳利。;Bray,F.,《前列腺癌发病率和死亡率的国际差异》,《欧洲泌尿外科杂志》。,61, 6, 1079-1092 (2012)
[14] Chazal,F.、Fasy,B.T.、Lecci,F.、Rinaldo,A.、Wasserman,L.:持久性景观和剪影的随机收敛。摘自:第三十届计算几何年会论文集,第474页。ACM(2014)·Zbl 1395.62187号
[15] Chen,Y.C.,Wang,D.,Rinaldo,A.,Wasserman,L.:持久性强度函数的统计分析。arXiv预印arXiv:1510.02502(2015)
[16] Ciollaro,M.,Genovese,C.,Lei,J.,Wasserman,L.:用于无限维模式搜索和聚类的函数均值漂移算法。arXiv预印arXiv:1408.1187(2014)
[17] Cisewski,J。;克罗夫特,RA;Freeman,体育;基因组,CR;Khandai,N。;Ozbek,M。;Wasserman,L.,使用Lyman-alpha森林绘制的星系间介质的非参数3D地图,蒙大拿州。不是。R.阿斯顿。Soc.,440,32599-2609(2014)
[18] 科恩·斯坦纳,D。;Edelsbrunner,H。;Harer,J.,持久性图的稳定性,离散计算。地理。,37, 1, 103-120 (2007) ·Zbl 1117.54027号
[19] Crawford,L.,Monod,A.,Chen,A.X.,Mukherjee,S.,Rabadán,R.:使用拓扑汇总统计进行功能数据分析:平滑Euler特征变换。arXiv预打印arXiv:1611.06818(2016a)
[20] Crawford,L.,Monod,A.,Chen,A.X.,Mukherjee,S.,Rabadán,R.:肿瘤图像的拓扑总结提高了对多形性胶质母细胞瘤无病生存期的预测。arXiv预打印arXiv:1611.06818(2016b)
[21] Degras,DA,含函数数据的非参数回归的同时置信带,Stat.Sin。,21, 1735-1765 (2011) ·Zbl 1225.62052号
[22] Edelsbrunner,H。;Harer,J.,《持久同源性——一项调查》,Contemp。数学。,453, 257-282 (2008) ·Zbl 1145.55007号
[23] 埃德尔斯布伦纳,H。;Letscher博士。;拓扑持久性和简化,离散计算。地理。,28, 4, 511-533 (2002) ·Zbl 1011.68152号
[24] Edelsbrunner,H.,Morozov,D.:持久同源性:理论与实践。收录于:《欧洲数学大会论文集》,第31-50页(2012年)·Zbl 1364.55008号
[25] Engers,R.,泌尿系肿瘤肿瘤分级的再现性和可靠性,世界泌尿外科杂志。,25, 6, 595-605 (2007)
[26] 爱泼斯坦,JI;Egevad,L。;阿明,MB;德拉亨特,B。;Srigley,JR;宾夕法尼亚州汉弗莱;G.委员会,2014年国际泌尿外科病理学会(ISUP)前列腺癌Gleason分级共识会议:分级模式的定义和新分级系统的建议,美国外科病理学杂志。,40, 2, 244-252 (2016)
[27] SM Evans;Patabendi Bandarage,V。;克伦堡,C。;厄内斯特,A。;Millar,J。;Clouston,D.,Gleason组活检和根治性前列腺切除标本之间的一致性:前列腺癌预后登记的队列研究-维多利亚,前列腺国际,4,4,145-151(2016)
[28] 英国法西;莱奇,F。;里纳尔多,A。;Wasserman,L。;Balakrishnan,S。;Singh,A.,《持久性图的置信集》,Ann.Stat.,42,6,2301-2339(2014)·Zbl 1310.62059号
[29] Fasy,B.T.,Payne,S.,Schenfish,A.,Schupback,J.,Stouffer,N.:模拟前列腺癌幻灯片扫描(2018)(即将出版)
[30] Ferlay,J。;Soerjomataram,I。;Dikshit,R。;Eser,S。;马瑟斯,C。;Rebelo,M。;帕金,DM;福尔曼,D。;Bray,F.,《全球癌症发病率和死亡率:GLOBOCAN 2012中的来源、方法和主要模式》,《国际癌症杂志》,136,5,E359-E386(2015)
[31] 费拉蒂,F。;Vieu,P.,《非参数函数数据分析:理论与实践》(2006),纽约:Springer,纽约·兹比尔1119.62046
[32] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》。施普林格统计系列(2001),纽约:施普林格,纽约
[33] 加梅罗,M。;Mischaikow,K。;Kalies,W.,时空混沌的拓扑特征,物理学。版本E,70,3,035203(2004)
[34] Ghrist,R.,《条形码:数据的持久拓扑》,Bull。美国数学。Soc.,45,1,61-75(2008)·Zbl 1391.55005号
[35] Ghrist,RW,《基本应用拓扑》(2014),西雅图:Createspace
[36] 古德曼,M。;病房,KC;AO Osunkoya;Datta,MW;卢瑟林格,D。;杨,AN;马克,K。;科恩,V。;肯尼迪,JC;MJ哈伯;Amin,MB,gleason评分中分歧和错误的频率和决定因素:一项基于人群的前列腺癌研究,前列腺,72,13,1389-1398(2012)
[37] Helpap,B。;克里斯蒂安森,G。;啤酒,M。;Köllermann,J。;Oehler,美国。;Pogrebniak,A。;Fellbaum,C.,《提高前列腺癌小病灶gleason评分的再现性——建议采用腺体融合的诊断标准》,Pathol。昂科尔。第18、3、615-621号决议(2012年)
[38] Humphrey,PA,Gleason分级和前列腺癌预后因素。病理学。,17, 3, 292-306 (2004)
[39] Ieva,F.,Paganoni,A.,Pigoli,D.,Vitelli,V.:心电图曲线形态分析的多元功能聚类。收录于:Cladag 2011(分类和数据分析小组第八届国际会议),第1-4页(2011)
[40] 雅克,J。;Preda,C.,《功能数据聚类:一项调查》,高级数据分析。分类。,8, 3, 231-255 (2014) ·Zbl 1414.62018年
[41] 科伯,M。;莫罗佐夫,D。;Nigmetov,A.,《几何有助于比较持久性图》,J.实验算法。JEA,22,1,1-4(2017)·Zbl 1414.68129号
[42] Khasawneh,F.A.,Munch,E.:使用持久同源性探索随机时滞微分方程的平衡。摘自:ASME 2014国际设计工程技术会议和工程中的计算机和信息会议,第V008T11A034-V008T11A034页。美国机械工程师学会(2014)
[43] Khasawneh,FA;Munch,E.,《使用持久同源性轮流检测Chatter》,Mech。系统。信号处理。,70, 527-541 (2016)
[44] 科索罗克,MR,《经验过程和半参数推断导论》(2007),纽约:施普林格出版社,纽约
[45] 拉普雷希特,MR;萨巴蒂尼,DM;Carpenter,AE,CellProfiler:用于自动生物图像分析的免费通用软件,《生物技术》,42,1,71-75(2007)
[46] Lawson,P.、Berry,E.、Brown,J.Q.、Fasy,B.T.、Wenk,C.:前列腺癌定量形态学分析的拓扑描述符。参加:数字病理学会议,SPIE医学成像的一部分。荣誉奖海报奖(2017)
[47] Lawson,P.,Sholl,A.B.,Brown,J.Q.,Fasy,B.T.,Wenk,C.前列腺癌组织学结构特征定量评估的持久同源性。科学。报告9(1),1-15(2019)
[48] Lei,J。;里纳尔多,A。;Wasserman,L.,《探索函数数据的保角预测方法》,《数学年鉴》。Artif公司。智力。,74, 1-2, 29-43 (2015) ·Zbl 1317.62039号
[49] 李,B。;Yu,Q.,功能数据的分类:分割方法,计算。统计数据分析。,52, 10, 4790-4800 (2008) ·Zbl 1452.62992号
[50] 马,S。;Yang,L。;Carroll,RJ,稀疏纵向回归的同时置信带,Stat.Sin。,22, 95-122 (2012) ·Zbl 1417.62088号
[51] Mileyko,Y。;穆克吉,S。;Harer,J.,持久性图空间上的概率测度,逆概率。,27, 12, 124007 (2011) ·兹比尔1247.68310
[52] Monod,A。;卡利什尼克,S。;贾帕蒂尼奥·加林多;Crawford,L.,《热带地区持久同源性的充分统计与感染性病毒疾病的参数应用》,SIAM J.Appl。代数几何。,337-371年3月2日(2019年)·Zbl 1443.62018年
[53] Munkres,JR,代数拓扑(1964),《上鞍河:普伦蒂斯·霍尔》,上鞍河
[54] Myllymäki,M。;马尔科维奇·卡,T。;格拉巴尼克,P。;Seijo,H。;Hahn,U.,《空间过程的全球包络测试》,J.R.Stat.Soc.Ser。B统计方法。,79, 2, 381-404 (2017) ·Zbl 1414.62404号
[55] Obayashi,I。;Y.Hiraoka。;Kimura,M.,线性机器学习模型的持久性图,J.Appl。计算。白杨。,1, 3-4, 421-449 (2018) ·Zbl 1405.62250号
[56] Padellini,T.,Brutti,P.:(2017)持久火焰:核密度探索的多尺度持久同源性。arXiv预打印arXiv:1709.07097
[57] 马萨诸塞州佩雷;Harer,J.,《滑动窗口和持久性:拓扑方法在信号分析中的应用》,Found。计算。数学。,15, 3, 799-838 (2015) ·Zbl 1325.37054号
[58] 比勒陀利亚,E。;维埃拉,W。;Oberholzer,H。;Auer,R.,《人类和不同动物血小板和纤维蛋白网络的比较扫描电子显微镜》,《国际病理杂志》。,27, 1, 69-76 (2009)
[59] R: 《统计计算的语言和环境》(2017),维也纳:R统计计算基金会,维也纳
[60] JO Ramsay,《功能数据分析》(2006),纽约:威利出版社
[61] 罗宾斯,V。;梅克,韩国;Stoyan,D.,《点数据的计算拓扑:α形状的贝蒂数》,《凝聚态物质的形态》,261-274(2002),纽约:Springer,纽约
[62] 罗宾逊,A。;Turner,K.,拓扑数据分析的假设检验,J.Appl。计算。白杨。,1, 2, 241-261 (2017) ·Zbl 1396.62085号
[63] 罗西,F。;Villa,N.,功能数据分类的支持向量机,神经计算,69,7-9,730-742(2006)
[64] Rubin,H.,随机函数的一致收敛及其在统计学中的应用,数学。《法律总汇》,27,1200-203(1956)·Zbl 0074.34103号
[65] 谢弗,G。;Vovk,V.,保角预测教程,J.Mach。学习。研究,3月9日,371-421(2008)·兹比尔1225.68215
[66] Singh,N.、Couture,H.D.、Marron,J.S.、Perou,C.、Niethammer,M.:组织学图像的拓扑描述符。摘自:医学成像机器学习国际研讨会,第231-239页。斯普林格(2014)
[67] 索斯比,T。;Pichon,C。;Kawahara,H.,《持久的宇宙网及其丝状结构-II》。插图,周一。不是。R.阿斯顿。Soc.,414,1,384-403(2011)
[68] Tarpey,T。;Kinateder,KK,聚类功能数据,J.Classif。,20, 1, 093-114 (2003)
[69] 黄玉,CM;Ziegelmeier,L。;Halverson,T.,生物聚集模型的拓扑数据分析,PLoS ONE,10,5,e0126383(2015)
[70] 马里兰州Truesdale;切萨姆,PJ;土耳其,AT;Sartori,S。;Hruby,千兆瓦;迪尼恩,EP;MC本森;Badani,KK,Gleason对经生物化学证实的前列腺癌的评分一致性:根治性前列腺切除术前是否需要进行病理学重新评估?,北京大学国际,107,5,749-754(2011)
[71] Truong,M。;日本Slezak;林,CP;艾雷马什维利,V。;萨多,M。;Razmaria,AA;Leverson,G。;索洛韦,理学硕士;Eggener,SE;亚伯,EJ;唐斯,TM;Jarrard,DF,Gleason 6前列腺癌风险工具升级的开发和多机构验证,癌症,119,22,3992-4002(2013)
[72] Turner,K.:持久性图集合的平均值和中位数。arXiv预打印arXiv:1307.8300(2013)
[73] 特纳,K。;Mileyko,Y。;穆克吉,S。;Harer,J.,Fréchet表示持久性图的分布,离散计算。地理。,52, 1, 44-70 (2014) ·Zbl 1296.68182号
[74] 特纳,K。;穆克吉,S。;Boyer,DM,建模形状和曲面的持久同源变换,Inf.Inference J.IMA,3,4,310-344(2014)·Zbl 06840289号
[75] Van de Weygaert,R.、Vegter,G.、Edelsbrunner,H.、Jones,B.J.、Pranav,P.、Park,C.、Hellwing,W.A.、Eldering,B.、Kruithof,N.、Bos,E.等人:阿尔法、贝蒂和大解析宇宙:宇宙网拓扑。摘自:《计算科学学报》第十四期,第60-101页。施普林格(2011)·Zbl 1250.85007号
[76] Van der Vaart,AW,《渐近统计学》(剑桥统计与概率数学系列)(2000年),剑桥:剑桥大学出版社,剑桥
[77] Von Luxburg,U.,《光谱聚类教程》,统计计算。,17, 4, 395-416 (2007)
[78] 沃夫克,V。;Gammerman,A。;Shafer,G.,《随机世界中的算法学习》(2005),纽约:Springer,纽约·Zbl 1105.68052号
[79] 王,J-L;Chiou,J-M;Müller,H-G,《功能数据分析综述》,年。修订状态申请。,3, 257-295 (2016)
[80] Wasserman,L.,《所有非参数统计》(2006),纽约:Springer,纽约·Zbl 1099.62029号
[81] Wasserman,L.,拓扑数据分析,《统计及其应用年鉴》,5,501-532(2016)
[82] 沃斯利,KJ,《随机图像的几何》,Chance,9,1,27-40(1996)
[83] 袁,K-H,随机函数一致收敛定理及其应用,J.Multivar。分析。,62, 1, 100-109 (1997) ·Zbl 0879.62020号
[84] Zhu,X.:持久同源:自然语言处理的介绍和新的文本表示。收录于:IJCAI,第1953-1959页(2013)
[85] Zomordian,AJ,计算拓扑。剑桥专著(2005),剑桥:剑桥大学出版社,剑桥
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。