×

地理空间数据的持续同源性:一项投票案例研究。 (英语) Zbl 1460.62201号

摘要:持久同源性分析中的一个关键步骤是将数据转换为适当的拓扑对象(在我们的例子中,它是一个简单复数)。用于计算持久同源性的软件包通常在点云上构建Vietoris-Rips或其他基于距离的简单复合体,因为它们相对容易计算。我们研究了构造简单复数的可选方法,以及在简单复数构造期间进行相关选择对持久homology算法输出的影响。我们提出了两种从二维地理空间数据(如地图)构造简单复合体的新方法。我们将这些方法应用于加利福尼亚州选区级投票数据集,从而证明了我们的新构造可以捕获基于距离的构造所忽略的几何特征。因此,我们的新构造可以为地理空间数据生成更多可解释的持久性模块和条形码。特别是,他们能够通过合并有关区域间其他空间关系的信息,将仅在较窄距离范围内出现的短持续性特征(例如,人口稠密城市中的投票模式)与短持续性噪声区分开来。

MSC公司:

62第25页 统计学在社会科学中的应用
62R40型 拓扑数据分析
62立方米 空间过程推断
55N31号 持久同源性及其应用,拓扑数据分析
55单位10 代数拓扑中的单纯形集和复数
第91页第20页 数学地理学和人口学
68单位05 计算机图形;计算几何(数字和算法方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] M.Adamaszek和H.Adams,《越战撕裂圆的复合体》,太平洋数学杂志。,290(2017),第1-40页·Zbl 1366.05124号
[2] H.Adams、T.Emerson、M.Kirby、R.Neville、C.Peterson、P.Shipman、S.Chepushtanova、E.Hanson、F.Motta和L.Ziegelmeier,《持久图像:持久同源的稳定向量表示》,J.Mach。学习。第18号决议(2017年),第218-252页·Zbl 1431.68105号
[3] P.Bajardi、M.Delfino、A.Panisson、G.Petri和M.Tizzoni,《使用手机数据揭示全球城市中国际社区的模式》,《欧洲物理学》。数据科学杂志。,(2015年),第3条。
[4] A.Banman和L.Ziegelmeier,Mind the gap:A study in global development through persistent homology,in Research in Computational Topology,E.W.Chambers,B.T.Fasy,and L.Zielmeier,eds.,Springer International Publishing,Cham,Switzerland,2018年,第125-144页。
[5] R.Barnes和J.Solomon,《选区划分和紧凑性:实施灵活性和滥用》,预印本,https://arxiv.org/abs/1803.02857, 2018.
[6] U.Bauer、M.Kerber、J.Reininghaus和H.Wagner,Phat-Persistent同源算法工具箱,收录于数学软件ICMS 2014,H.Hong和C.Yap,eds.,Springer-Verlag,德国海德堡,2014年,第137-143页·Zbl 1402.65187号
[7] P.Bendich、H.Edelsbrunner、D.Morozov和A.Patel,水平集和层间集的同调和稳健性,同调同伦应用。,15(2013年),第51-72页·Zbl 1266.55004号
[8] O.Bobrowski、S.Mukherjee和J.E.Taylor,通过核估计实现拓扑一致性,伯努利,23(2017),第288-328页·Zbl 1395.62073号
[9] P.Bubenik,使用持久性景观的统计拓扑数据分析,J.Mach。学习。第16号决议(2015年),第77-102页·Zbl 1337.68221号
[10] P.Bubenik、M.Hull、D.Patel和B.Whittle,《持久同源性检测曲率》,《逆向问题》,36(2020),第025008条·Zbl 1508.55004号
[11] H.M.Byrne、H.A.Harrington、R.Muschel、G.Reinert、B.J.Stolz和U.Tillmann,《拓扑表征肿瘤血管系统》,数学。今天,第55期(2019年),第206-210页。
[12] G.Carlsson,数据建模的拓扑方法,《自然物理学评论》。,2(2020年),第697-708页
[13] G.Carlsson、T.Ishkhanov、V.de Silva和A.Zomordian,《自然图像空间的局部行为》,国际出版社。J.计算。《愿景》,76(2008),第1-12页·Zbl 1477.68463号
[14] C.Curto,关于神经代码,拓扑能告诉我们什么?,牛市。阿默尔。数学。Soc.,54(2017),第63-78页·兹比尔1353.92027
[15] M.Duchin和B.E.Tenner,《选举地理的离散几何》,预印本,https://arxiv.org/abs/1808.05860, 2018.
[16] H.Edelsbrunner和J.Harer,计算拓扑:导论,AMS,普罗维登斯,RI,2010·Zbl 1193.55001号
[17] H.Edelsbrunner、D.Kirkpatrick和R.Seidel,关于平面上一组点的形状,IEEE Trans。通知。《理论》,29(1983),第551-559页·Zbl 0512.52001
[18] K.Emmett、B.Schweinhart和R.Rabadan,染色质折叠的多尺度拓扑,《第九届EAI国际生物信息与通信技术会议论文集》,BICT’15,ICST(计算机科学、社会信息与通信工程研究所),2016年,第177-180页。
[19] R.Ghrist,《条形码:数据的持久拓扑》,Bull。阿默尔。数学。Soc.,45(2008),第61-75页·Zbl 1391.55005号
[20] F.Gibou、R.Fedkiw和S.Osher,水平集方法和一些最新应用的回顾,J.Compute。物理。,353(2018),第82-109页·Zbl 1380.65196号
[21] Gudhi项目,《Gudhi用户和参考手册》,3.0.0版,Gudhi编辑委员会,2015年,https://gudhi.inria.fr/doc/3.0.0/。
[22] C.Giusti、R.Ghrist和D.S.Bassett,Two的公司,三个(或更多)是单一的J.Compute。神经科学。,41(2016),第1-14页。
[23] A.Hatcher,《代数拓扑》,剑桥大学出版社,英国剑桥,2002年·Zbl 1044.55001号
[24] D.P.Humphreys、M.R.McGuirl、M.Miyagi和A.J.Blumberg,使用拓扑数据分析快速估计重组率,遗传学,211(2019),第1191-1204页。
[25] P.S.P.Ignacio和I.K.Darcy,通过持久同源性追踪汇款和迁移网络中的模式和形状,《欧洲物理学》。数据科学杂志。,(2019年),第1条。
[26] L.Kanari、P.Dłotko、M.Scolamiero、R.Levi、J.C.Shillock、K.Hess和H.Markram,分支神经元形态的拓扑表示,神经信息。,16(2018),第3-13页。
[27] M.Kerber和R.Sharathkumar,《低维和高维近似Čech复合物》,预印本,https://arxiv.org/abs/1307.3272, 2013. ·Zbl 1406.68119号
[28] M.Kramaír、A.Goullet、L.Kondic和K.Mischaikow,《颗粒系统中力网络的量化》,Phys。D、 283(2014),第37-55页·Zbl 1349.74083号
[29] R.Kwitt、S.Huber、M.Niethammer、W.Lin和U.Bauer,《统计拓扑数据分析——核心观点》,摘自《神经信息处理系统进展》28,C.Cortes、N.D.Lawrence、D.D.Lee、M.Sugiyama和R.Garnett编辑,Curran Associates,2015年,第3070-3078页。
[30] D.Lo和B.Park,《使用拓扑数据分析模拟寨卡病毒的传播》,《公共科学图书馆·综合》,13(2018),第e0192120条。
[31] C.Maria,《过滤复合物》,载于《Gudhi用户和参考手册》3.0.0版,Gudhi编辑委员会,2015年,https://gudhi.inria.fr/doc/3.0/group__simplex__tree.html。
[32] C.Maria、P.Dłotko、V.Rouvreau和M.Glisse,Rips complex,《Gudhi用户和参考手册》3.0.0版,Gudhi编委会,2016,https://gudhi.inria.fr/doc/3.0/group__rips_complex.html。
[33] M.E.J.Newman,《网络》,第二版,牛津大学出版社,英国牛津,2018年·Zbl 1391.94006号
[34] S.Osher和R.Fedkiw,水平集方法和动态隐式曲面,应用。数学。科学。2003年,德国海德堡斯普林格·弗拉格153号·Zbl 1026.76001号
[35] S.Osher和J.A.Sethian,以曲率相关速度传播的前沿:基于Hamilton-Jacobi公式的算法,J.Compute。物理。,79(1988),第12-49页·Zbl 0659.65132号
[36] N.Otter、M.A.Porter、U.Tillmann、P.Grindrod和H.A.Harrington,持久同源性计算路线图,欧洲物理学。数据科学杂志。,第6条(2017年),第17条。
[37] L.Papadopoulos、M.A.Porter、K.E.Daniels和D.S.Bassett,《颗粒和颗粒的网络分析》,《复杂网络杂志》,6(2018),第485-565页。
[38] QGIS协会,QGIS 2.18.17:一个自由和开源的地理信息系统,2016,http://www.qgis.org。
[39] J.Reininghaus、S.Huber、U.Bauer和R.Kwitt,拓扑机器学习的稳定多尺度内核,2015年IEEE计算机视觉和模式识别会议(CVPR),2015年,第4741-4748页。
[40] J.W.Rocks、A.J.Liu和E.Katifori,《流动网络中函数的拓扑基础》,预印本,https://arxiv.org/abs/1901.00822, 2019.
[41] H.Ronellenfitsch、J.Lasser、D.C.Daly和E.Katifori,拓扑表型构成了叶脉网络表型空间的新维度,PLOS计算。《生物学》,11(2015),第1004680条。
[42] V.Rouvreau,Alpha complex,收录于Gudhi用户和参考手册3.0.0版,Gudhi编辑委员会,2015年,https://gudhi.inria.fr/doc/3.0/group__alpha__complex.html。
[43] V.Rouvreau,《Python接口》,载于《Gudhi用户和参考手册》3.0.0版,Gudhi编辑委员会,2016年,https://gudhi.inria.fr/python/3.0.0。
[44] J.Schleuss、J.Fox和P.Krishnakumar,加利福尼亚州2016年选举选区地图,https://github.com/datadesk/california-2016-election-precinct-maps, 2016. (请参见https://www.latimes.com/projects/la-pol-ca-california-neighborhood-election-results网站/相关报纸文章。)
[45] L.Speidel、H.A.Harrington、S.J.Chapman和M.A.Porter,《圆盘连续渗流的拓扑数据分析》,Phys。E版,98(2018),第012318条。
[46] B.J.Stolz、H.A.Harrington和M.A.Porter,脱欧的拓扑“形状”,预印本,https://arxiv.org/abs/1610.00752, 2016.
[47] B.J.Stolz、H.A.Harrington和M.A.Porter,基于耦合时间序列构建的时间依赖功能网络的持久同源性,混沌,27(2017),第047410条。
[48] D.Taylor、F.Klimm、H.A.Harrington、M.Kramaír、K.Mischaikow、M.A.Porter和P.J.Mucha,用于检查网络传播过程的传染图拓扑数据分析,自然社区。,第6条(2015年),第7723条。
[49] L.Vietoris,《数学》,《数学》。《年鉴》,97(1927),第454-472页。
[50] 夏国伟,蛋白质结构、柔韧性和折叠的持久同源性分析,国际。J.数字。方法生物识别。工程,30(2014),第814-844页。
[51] W.Zhou和H.Yan,蛋白质相关相互作用研究中的阿尔法形状和Delaunay三角测量,生物信息简报。,15(2014年),第54-64页。
[52] X.Zhu,A.Vartanian,M.Bansal,D.Nguyen,L.Brandl,《随机多分辨率持久同源核》,载《第二十五届国际人工智能联合会议论文集》,IJCAI’16,AAAI出版社,2016年,第2449-2455页。
[53] A.Zomordian,《快速建造Vietoris-Rips综合体》,《计算机与图形》,34(2010),第263-271页。
[54] A.Zomordian和G.Carlsson,计算持久同源性,离散计算。地理。,33(2005年),第249-274页·Zbl 1069.55003号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。