×

兹马思-数学第一资源

持久性图的功能摘要。(英语) Zbl 1452.62999
持久性图/条形码不是统计和机器学习的自然对象,因此需要将这些对象映射到各种功能摘要和向量表示中。本文首先简要回顾了已经出现的不同功能摘要。在后面的部分中,我们将这些总结应用于两种数据应用中,即模拟前列腺癌的结构形态和纤维蛋白网络,并对结果进行比较。
理论部分着重于不同功能总结的共同基础,特别是其中一个概括,即广义景观功能。这种泛化允许使用标准三角形内核以外的内核构造景观函数。不同的内核允许带宽参数来控制如何捕获持久性图的特征,并声称图上的重要特征是用较少的广义景观函数来捕获的,这是一种降维形式。
本文的理论部分给出了函数摘要的统计结果,如样本均值收敛到总体均值和广义景观函数的置信区间。文中还讨论了零假设、分类和聚类的两个样本检验。
有趣的是,在应用部分,广义景观函数的分类性能优于其他一些摘要和其他具有不同带宽参数的广义景观函数。这证明了更灵活的方法的有效性,在这种方法中,可以通过参数调整来优化分类性能。当然,这会带来额外的成本,即必须选择一个内核并找到最佳参数,但这是标准的机器学习实践。
理学硕士:
62R40型 拓扑数据分析
62R10型 功能数据分析
62小时30分 分类和区分;聚类分析(统计方面)
62G15 非参数容差和置信域
55号31号 持久同调及其应用,拓扑数据分析
68T05型 人工智能中的学习与自适应系统
第62页 统计学在生物学和医学科学中的应用;荟萃分析
PDF格式 双歧杆菌 引用
全文: 内政部
参考文献:
[1] 阿布杜拉希,A。;梅萨米,A。;谢赫巴海,S。;艾哈迈迪,A。;大不里士,嗯;巴克尚德,M。;Hosseinzadeh,H.,《伊朗病理学家前列腺腺癌Gleason评分的观察者间/观察者内再现性》,Urol。J、 第9、2、486-490页(2012年)
[2] 亚当斯,H。;爱默生T。;克比,M。;内维尔,R。;彼得森,C。;希普曼,P。;切普什塔诺娃。;汉森,E。;莫塔,F。;《持久性图像:持续同源性的稳定向量表示》,J。机器。学习。第18、1、218-252号决议(2017年)
[3] 阿德科克,A。;卡尔森E。;Carlsson,G.,《持久性条形码上的代数函数环》,同调。同伦应用,18,1381-402(2016)·Zbl 1420.55017
[4] 刘建平,张志强,随机场的最大值与圆管公式,人工神经网络。申请。Probab.,10,1-74(2000年)·Zbl 1171.60338号
[5] 阿德勒,RJ;Agami,S.,用平面点过程建模持久性图,用bagplots揭示拓扑结构,J。申请。计算机。《地形》,3,3,139-183(2019年)·Zbl 1441.62936
[6] Adler,R.J.,Bobrowski,O.,Borman,M.S.,Subag,E.,Weinberger,S.:随机场和复合物的持久同源性。在:借用力量:理论驱动应用-一个费斯奇里夫为劳伦斯D。布朗,第6卷,第124-143页。数理统计研究所(2010)
[7] 本迪希,P。;马里恩,JS;米勒E。;皮洛克,A。;Skwerer,S.,脑动脉树的持续同源性分析,人工神经网络。申请。Stat.,10198(2016年)
[8] Biscio,C.,Møller,J.:累积持续性函数,拓扑数据分析的一种新的有用的功能摘要统计,以脑动脉树和空间点处理应用为例。arXiv预印本arXiv:1611.00630(2016)
[九] Bubenik,P.,使用持久性景观的统计拓扑数据分析,J。机器。学习。第16、1、77-102号决议(2015年)·Zbl 1337.68221
[10] 罗来纳州坎贝尔市;奥维迈尔,KA;塞尔兹曼,CH;谢里登,不列颠哥伦比亚省;Wolberg,AS,血管外和血管内细胞对纤维蛋白网络形成、结构和稳定性的贡献,血液,114,23,4886-4896(2009)
[11] Carlsson,G.,拓扑与数据,Bull。是。数学。第46、225-308页(2009年)·Zbl 1172.62002
[12] Carlsson,G.,Zomorodian,A.,Collins,A.,Guibas,L.J.:形状的持久性条形码。内景J。形状模型。11(2),149-187(2005年)·Zbl 1092.68688号
[13] 中心,MM;杰马尔,A。;洛特蒂尤伦特,J。;沃德,E。;费雷,J。;吵架,哦。;Bray,F.,前列腺癌发病率和死亡率的国际变化,欧元。欧洲期刊,61,6,1079-1092(2012年)
[14] Chazal,F.,Fasy,B.T.,Lecci,F.,Rinaldo,A.,Wasserman,L.:持久性景观和轮廓的随机收敛性。第三十届计算几何年会论文集。474.ACM(2014年)·Zbl 1395.62187
[15] Chen,Y.-C.,Wang,D.,Rinaldo,A.,Wasserman,L.:持续强度函数的统计分析。arXiv预印本arXiv:1510.02502(2015)
[16] Ciollaro,M.,Genovese,C.,Lei,J.,Wasserman,L.:无限维模式搜索和聚类的函数均值漂移算法。arXiv预印本arXiv:1408.1187(2014)
[17] 西维斯基,J。;科罗拉多州克罗夫特;弗里曼,体育;基诺维斯,CR;坎代,北。;奥兹别克,M。;Wasserman,L.,利用莱曼阿尔法森林绘制星系间介质的非参数3D地图,蒙大拿州。不是。R。阿童木。第440页,第32599-2609页(2014年)
[18] 科恩·施泰纳。;埃德斯布伦纳,H。;Harer,J.,持久性图的稳定性,离散计算。《几何》,37,1103-120(2007)·Zbl 1117.54027
[19] Crawford,L.,Monod,A.,Chen,A.X.,Mukherjee,S.,Rabadán,R.:使用拓扑汇总统计的函数数据分析:平滑欧拉特征变换。arXiv预印本arXiv:1611.06818(2016a)
[20] Crawford,L.,Monod,A.,Chen,A.X.,Mukherjee,S.,Rabadán,R.:肿瘤图像的拓扑总结提高了多形性胶质母细胞瘤无病生存率的预测。arXiv预印本arXiv:1611.06818(2016b)
[21] Degras,DA,非参数回归函数数据的同时置信区间,Stat.Sin.,211735-1765(2011)·Zbl 1225.62052
[22] 埃德斯布伦纳,H。;Harer,J.,《持续同源性——调查》,当代杂志。数学,453257-282(2008)·Zbl 1145.55007号
[23] 埃德斯布伦纳,H。;Letscher,D。;拓扑持久化与简化,离散计算。《几何》,28,4511-533(2002)·Zbl 1011.68152号
[24] Edelsbrunner,H.,Morozov,D.:持久同源性:理论与实践。欧洲数学大会论文集,第31-50页(2012年)·Zbl 1364.55008号
[25] 恩格斯,R.,泌尿外科肿瘤肿瘤分级的可重复性和可靠性,世界J。欧洲期刊,25,6,595-605(2007年)
[26] 爱泼斯坦,吉;埃格瓦德,L。;阿明,MB;德拉亨特,B。;小斯里格利;宾夕法尼亚州汉弗莱;2014年国际泌尿病理学会(ISUP)前列腺癌Gleason分级共识会议:分级模式的定义和新分级系统的建议,Am。J。苏格。病理学,40,2244-252(2016年)
[27] 埃文斯,山猫;帕塔本迪绷带,V。;克伦堡,C。;认真的,A。;米勒,J。;Clouston,D.,Gleason集团活检和根治性前列腺切除标本的一致性:来自前列腺癌预后登记处的队列研究,维多利亚,前列腺Int.,4,4,145-151(2016)
[28] 法西,英国电信;莱奇,F。;里纳尔多,A。;瓦瑟曼,L。;巴拉克里希南,S。;Singh,A.,持久性图的置信集,Ann。Stat.,42,6,2301-2339(2014年)·Zbl 1310.62059
[29] Fasy,B.T.,Payne,S.,Schenfish,A.,Schupback,J.,Stouffer,N.:模拟前列腺癌幻灯片扫描(2018)(即将出版)
[30] 费雷,J。;索尔霍马塔拉姆,I。;迪克希特,R。;Eser,S。;马瑟斯,C。;瑞贝洛,M。;帕金,DM;福尔曼,D。;Bray,F.,全球癌症发病率和死亡率:GLOBOCAN 2012的来源、方法和主要模式,国际期刊。癌症,136,5,E359-E386(2015)
[31] 费拉蒂,F。;Vieu,P.,非参数函数数据分析:理论与实践(2006),纽约:斯普林格,纽约·Zbl 1119.62046
[32] 弗里德曼,J。;黑斯蒂,T。;Tibshirani,R.,《统计学学习的要素》。斯普林格统计系列(2001),纽约:斯普林格,纽约
[33] 加梅罗,M。;米沙伊科,K。;Kalies,W.,时空混沌的拓扑特征,物理。版次。E、 703035203(2004年)
[34] Ghrist,R.,《条形码:数据的持久拓扑》,Bull。是。数学。第45、1、61-75页(2008年)·550ZB05.1升
[35] Ghrist,RW,《基础应用拓扑》(2014),西雅图:Createspace,西雅图
[36] 古德曼,M。;沃德,肯塔基州;奥山科亚州奥山科亚;达塔,兆瓦;路德林格D。;年轻,安;马克,K。;科恩,V。;肯尼迪,JC;哈伯,MJ;Amin,MB,《gleason评分中不一致和错误的频率和决定因素:基于人群的前列腺癌研究》,前列腺,72,13,1389-1398(2012)
[37] Helpap,B。;克里斯蒂安森,G。;啤酒,M。;克勒曼,J。;奥勒,美国。;波格雷布尼亚克。;Fellbaum,C.,《提高前列腺癌小病灶格里森评分的可重复性——腺体融合的诊断标准建议,病理学》。肿瘤学。第18、3615-621号决议(2012年)
[38] Humphrey,PA,Gleason分级和前列腺癌预后因素。病理学,17,3,292-306(2004年)
[39] Ieva,F.,Paganoni,A.,Pigoli,D.,Vitelli,V.:心电图曲线形态分析的多元函数聚类。In:Cladag 2011(分类和数据分析小组第8次国际会议),第1-4页(2011年)
[40] 雅克,J。;Preda,C.,功能数据聚类:调查,高级数据分析。第8、3、231-255页(2014年)·Zbl 1414.62018
[41] 克伯,M。;莫罗佐夫,D。;《几何学有助于比较持久性图》,J。实验算法。JEA,22,1,1-4(2017年)·Zbl 1414.68129号
[42] Khasawneh,F.A.,Munch,E.:用持续同调探索随机时滞微分方程的平衡点。在:ASME 2014国际设计工程技术会议和计算机与工程信息会议,V008T11A034-V008T11A034页。美国机械工程师学会(2014)
[43] 哈萨瓦内,法新社;Munch,E.,《利用持续同源性检测车削中的颤振》,机械。系统。信号处理,70527-541(2016)
[44] Kosorok,MR.经验过程和半参数推断导论(2007),纽约:Springer,纽约
[45] 兰普雷希特先生;萨巴蒂尼,糖尿病患者;Carpenter,AE,CellProfiler:用于自动生物图像分析的免费通用软件,生物技术,42,1,71-75(2007)
[46] Lawson,P.,Berry,E.,Brown,J.Q.,Fasy,B.T.,Wenk,C.:定量前列腺癌形态分析的拓扑描述符。在:数字病理学会议,SPIE医学成像的一部分。荣誉提名海报奖(2017)
[47] 劳森,P.,肖尔,A.B.,布朗,J.Q.,法西,B.T.,温克,C。前列腺癌组织学结构特征定量评价的持续同源性。科学。报告9(1),1-15(2019年)
[48] 雷,J。;里纳尔多,A。;Wasserman,L.,探索功能数据的保角预测方法,人工神经网络。数学。人工制品。国际,74,1-2,29-43(2015年)·Zbl 1317.62039
[49] 李,B。;于,Q.,《功能数据分类:分割方法》,计算机。统计数据分析,52,10,4790-4800(2008)·Zbl 1452.62992
[50] 文学硕士。;杨,L。;Carroll,RJ,《稀疏纵向回归的同步置信区间》,Stat.Sin.,22,95-122(2012)·Zbl 1417.62088
[51] 米列科,Y。;慕克吉。;Harer,J.,持久性图空间上的概率测度,逆概率,27,12,124007(2011)·Zbl 1247.68310号
[52] 莫诺,A。;卡利什尼克,S。;帕蒂诺-加林多,JÁ;克劳福德,L.,《传染病参数应用的持续同源性的热带充分统计》,暹罗J。申请。《代数几何》,3,2337-371(2019年)·14462ZB013
[53] 《代数拓扑学》(1964),上鞍河:普伦蒂斯霍尔,上鞍河
[54] Myllymäki,M。;克维卡先生,T。;格拉巴尼克,P。;Seijo,H。;哈恩,U.,空间过程的全球包络测试,J。R。统计Soc。爵士。B Stat.Methodol.,79,2,381-404(2017年)·Zbl 1414.62404
[55] 我是小野寺五典。;平冈,Y。;Kimura,M.,线性机器学习模型的持续图,J。申请。计算机。《拓扑》,1,3-4,421-449(2018年)·Zbl 1405.62250
[56] Padellini,T.,Brutti,P.:(2017)持久火焰:用于内核密度探索的多尺度持久同调。arXiv预印本arXiv:1709.07097
[57] 佩雷亚,JA;Harer,J.,滑动窗口和持久性:拓扑方法在信号分析中的应用,发现。计算机。数学,153799-838(2015)·Zbl 1325.37054
[58] 普雷托里厄斯。;维埃拉,W。;奥伯霍尔泽。;Auer,R.,人和不同动物血小板和纤维蛋白网络的比较扫描电子显微镜,国际期刊。形态学,27,1,69-76(2009年)
[59] R: 统计计算语言与环境(2017),维也纳:统计计算基金会,维也纳
[60] JO Ramsay,Functional Data Analysis(2006),纽约:威利,纽约
[61] 罗宾斯,V。;韩国梅克;Stoyan,D.,点数据的计算拓扑:形状的betti数,凝聚态物质的形态,261-274(2002),纽约:斯普林格,纽约
[62] 罗宾逊,A。;Turner,K.,拓扑数据分析的假设检验,J。申请。计算机。《拓扑》,1,2,241-261(2017年)·Zbl 1396.62085
[63] 罗西,F。;Villa,N.,功能数据分类的支持向量机,神经计算,69,7-9,730-742(2006)
[64] 鲁宾,H.随机函数的一致收敛及其在统计学中的应用,人工神经网络。数学。Stat.,27,1200-203(1956年)·Zbl 0074.34103
〔65〕 沙弗,G。;Vovk,V.,保角预测教程,J。机器。学习。Res.,2008年3月9日,371-421·Zbl 1225.68215
[66] Singh,N.,Couture,H.D.,Marron,J.S.,Perou,C.,Niethammer,M.:组织学图像的拓扑描述符。In:医学影像学机器学习国际研讨会,第231-239页。斯普林格(2014)
[67] 苏斯比,T。;比丘,C。;Kawahara,H.,持久的宇宙网及其丝状结构II。插图,妈妈。不是。R。阿童木。第414页,第1384-403页(2011年)
[68] 柏油,T。;《聚类功能数据》,J。第20、1093-114页(2003年)
〔69〕 黄玉,厘米;齐格梅尔,L。;Halverson,T.,生物聚集模型的拓扑数据分析,PLoS ONE,10,5,e0126383(2015)
[70] 医学博士特鲁斯代尔;切瑟姆,PJ;土耳其,AT;萨托里,S。;Hruby,吉瓦;迪宁,EP;本森,MC;Badani,KK,Gleason评分与活检确诊前列腺癌的一致性:根治性前列腺切除术前是否有必要进行病理学重新评估?,《BJU国际期刊》,107,5749-754(2011)
[71] 张,M。;斯莱扎克,对吧;林,CP;伊雷马什维利,V。;萨多,M。;拉兹玛丽亚,AA;莱弗森,G。;索洛韦女士;茄子,硒;阿贝尔,EJ;唐斯,TM;Jarrard,DF,《Gleason 6前列腺癌风险升级工具的开发和多机构验证》,癌症,119,22,3992-4002(2013)
[72] Turner,K.:持久性图集合的平均值和中间值。arXiv预印本arXiv:1307.8300(2013)
[73] 特纳,K。;米列科,Y。;慕克吉。;Harer,J.,Fréchet平均值用于持久性图的分布,离散计算。《地理》,52,1,44-70(2014年)·Zbl 1296.68182号
[74] 特纳,K。;慕克吉。;陈国平,张志刚,形状与曲面造型之持续同调转换,资讯推论学。IMA,3,4,310-344(2014年)·Zbl 06840289
[75] Van de Weygaert,R.,Vegger,G.,Edelsbrunner,H.,Jones,B.J.,Pranav,P.,Park,C.,Hellwing,W.A.,Eldering,B.,Kruithof,N.,Bos,E.等人:阿尔法,贝蒂和megaparsec宇宙:关于宇宙网的拓扑结构。In:《计算科学汇刊》第十四期,第60-101页。斯普林格(2011)·Zbl 1250.85007
[76] 范德法特,AW,渐近统计(剑桥统计与概率数学系列)(2000),剑桥:剑桥大学出版社,剑桥
[77] Von Luxburg,U.,光谱聚类教程,Stat.Comput.,17,4,395-416(2007)
[78] 沃夫克,V。;伽默曼,A。;《随机世界中的算法学习》(2005),纽约:斯普林格,纽约·Zbl 1105.68052
[79] 王,J-L;赵,J-M;Müller,H-G,功能数据分析综述,年鉴。版次。Stat.Appl.,3257-295(2016年)
[80] Wasserman,L.,《所有非参数统计》(2006),纽约:斯普林格,纽约·Zbl 1099.62029
[81] Wasserman,L.,拓扑数据分析,统计年鉴及其应用,5501-532(2016)
[82] 《随机图像的几何》,Chance,9,1,27-40(1996)
[83] 袁,K-H,随机函数一致收敛定理及其应用,J。多变量。分析,62,1100-109(1997)·Zbl 0879.62020
[84] 朱,X.:持续同源性:自然语言处理中的一个介绍和一个新的文本表示。In:IJCAI,第1953-1959页(2013年)
[85] AJ,Zomorodian,计算拓扑。剑桥专著(2005),剑桥:剑桥大学出版社,剑桥
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。