×

具有多成分异构信息的数据的持久上同调。 (英语) Zbl 1484.55004号

在研究分子结构的几何信息时,希望能够嵌入具有结构持久同源性的非几何信息。本文提出了一个框架,其中使用局部和全局数据丰富了持久上同调。这是通过使用上同调理论在描述非几何信息的持久性条形码上分配函数来实现的。在示例中,计算拓扑软件Dionysus[D.莫罗佐夫,《狄奥尼索斯:计算持久同源性的图书馆》(2012),https://mrzv.org/software/dionysus2/,https://github.com/mrzv/dionysus网址]用于计算持久上同调。这些例子同时使用了合成数据集(相邻环)和实际分子。这些都附有彩色插图。一个例子显示了机器学习和持久上同调是如何使用该框架来预测蛋白质-甘氨酸结合亲和力的。

MSC公司:

55N31号 持久同源性及其应用,拓扑数据分析
55U30型 应用同调代数和范畴理论中的对偶性(代数拓扑方面)
55单位10 代数拓扑中的单纯形集和复数
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] SAMPL6挑战,https://drugdesigndata.org/about/sampl6; 2018-04-10访问。
[2] H.Adams、T.Emerson、M.Kirby、R.Neville、C.Peterson、P.Shipman、S.Chepushtanova、E.Hanson、F.Motta和L.Ziegelmeier,《持久图像:持久同源的稳定向量表示》,J.Mach。学习。第18号决议(2017年),第218-252页·Zbl 1431.68105号
[3] P.J.Ballester和J.B.O.Mitchell,预测蛋白质-甘氨酸结合亲和力的机器学习方法及其在分子对接中的应用,生物信息学,26(2010),第1169-1175页。
[4] U.Bauer,Ripser:高效计算Vietoris-Rips持久性条形码,预打印,https://arxiv.org/abs/1908.02518, 2019.
[5] U.Bauer、M.Kerber、J.Reininghaus和H.Wagner,PHAT持久同源算法工具箱,J.符号计算。,78(2017),第76-90页·Zbl 1348.68181号
[6] N.Bell和A.N.Hirani,PyDEC:外部微积分离散化的软件和算法,ACM Trans。数学。软件,39(2012),3·Zbl 1295.65139号
[7] P.Bendich、H.Edelsbrunner和M.Kerber,《图像的计算鲁棒性和持久性》,IEEE Trans。视觉。计算。Graphics,16(2010),第1251-1260页。
[8] Z.Cang、L.Mu和G.W.Wei,基于机器学习的评分和虚拟筛选中生物分子代数拓扑的可表示性,PLOS计算。《生物学》,14(2018),e1005929。
[9] Z.Cang和G.W.Wei,通过元素特异性持久同源性分析和预测突变后蛋白质折叠能量的变化,生物信息学,33(2017),第3549-3557页。
[10] Z.Cang和G.W.Wei,拓扑网络:用于生物分子性质预测的基于拓扑的深度卷积和多任务神经网络,PLOS Comput。《生物学》,13(2017),e1005690。
[11] Z.Cang和G.W.Wei,整合元素特异性持久同源性和机器学习以预测蛋白质-甘氨酸结合亲和力,国际数学家杂志。方法生物识别。工程,34(2018),e2914。
[12] Y.Cao和L.Li,使用曲率依赖的表面积模型改进蛋白质-甘氨酸结合亲和力预测,生物信息学,30(2014),第1674-1680页。
[13] G.Carlsson,拓扑与数据,布尔。阿默尔。数学。Soc.,46(2009),第255-308页·Zbl 1172.62002号
[14] G.Carlsson和V.De Silva,《曲折的坚持》,Found。计算。数学。,10(2010年),第367-405页·Zbl 1204.68242号
[15] G.Carlsson和A.Zomordian,多维持久性理论,离散计算。地理。,42(2009),第71-93页·Zbl 1187.55004号
[16] J.M.Chan、G.Carlsson和R.Rabadan,病毒进化拓扑,Proc。国家。阿卡德。科学。美国,110(2013),第18566-18571页·Zbl 1292.92014年
[17] F.R.K.Chung,谱图理论,CBMS Reg.Conf.Ser。数学。92,AMS,普罗维登斯,RI,1997年·Zbl 0867.05046号
[18] D.Cohen-Steiner、H.Edelsbrunner和D.Morozov,《通过更新线性时间中的持久性来实现葡萄园和葡萄园》,载于《第22届计算几何年度研讨会论文集》,ACM,纽约,2006年,第119-126页·Zbl 1153.68388号
[19] Y.Dabaghian、F.Meímoli、L.Frank和G.Carlsson,使用持久同源性形成海马空间地图的拓扑范式,PLOS Compute。《生物学》,第8期(2012年),e1002581。
[20] V.De Silva、D.Morozov和M.Vejdemo-Johansson,持久(共)同源性中的二重性,反问题,27(2011),124003·Zbl 1247.68307号
[21] V.De Silva、D.Morozov和M.Vejdemo-Johansson,持久上同调和圆坐标,离散计算。地理。,45(2011年),第737-759页·Zbl 1216.68322号
[22] M.Desbrun、A.N.Hirani、M.Leok和J.E.Marsden,《离散外部微积分》预印本,https://arxiv.org/abs/math/0508341, 2005.
[23] T.J.Dolinsky、J.E.Nielsen、J.A.McCammon和N.A.Baker,PDB(2)PQR:设置、执行和分析泊松-玻尔兹曼静电计算的自动管道,《核酸研究》,32(2004),第W665-W667页。
[24] H.Edelsbrunner,《加权阿尔法形状》,技术报告UIUCDCS-R-92-1760,伊利诺伊州乌尔巴纳-香槟伊利诺伊大学计算机科学系,伊利诺依州乌尔班纳,1992年。
[25] H.Edelsbrunner、D.Letscher和A.Zomordian,拓扑持久性和简化,离散计算。地理。,28(2001),第511-533页·Zbl 1011.68152号
[26] P.Frosini和C.Landi,作为计算机视觉拓扑工具的尺寸理论,模式识别图像分析。,9(1999),第596-603页。
[27] P·加布里埃尔,Unzerlegbare Darstelungen。一、 手稿数学。,6(1972年),第71-103页·Zbl 0232.08001号
[28] M.Gameiro、Y.Hiraoka、S.Izumi、M.Kramar、K.Mischaikow和V.Nanda,蛋白质压缩性的拓扑测量,Jpn。J.Ind.申请。数学。,32(2015),第1-17页·兹比尔1320.55004
[29] T.Goldberg,《简单复形的组合拉普拉斯算子》,巴德学院高级论文,纽约州哈德逊河畔阿丹代尔,2002年。
[30] A.Hatcher,《代数拓扑》,剑桥大学出版社,英国剑桥,2001年·Zbl 1044.55001号
[31] J.-C.豪斯曼,《关于Vietoris-Rips复形和度量空间的上同调理论》,收录于《拓扑学展望》,数学年鉴。138号研究生,普林斯顿大学出版社,新泽西州普林斯顿,1995年,第175-188页·Zbl 0928.55003号
[32] A.N.Hirani,离散外部微积分,博士论文,加州理工学院,帕萨迪纳,加利福尼亚州,2003年。
[33] A.N.Hirani、K.Kalyanaraman、H.Wang和S.Watts,同调谐波共链,预印本,https://arxiv.org/abs/1012.2835, 2010.
[34] D.Horak和J.Jost,单形复形上组合拉普拉斯算子的谱,高等数学。,244(2013),第303-336页·Zbl 1290.05103号
[35] J.Jimeínez、M.Skalic、G.Martinez-Rosell和G.De Fabritiis,KDEEP:通过D-卷积神经网络预测蛋白质与绝对结合亲和力,J.Chem。通知。型号。,58(2018),第287-296页。
[36] E.Jones、T.Oliphant、P.Peterson等人,《SciPy:Python开源科学工具》,2001年,http://www.scipy.org/。
[37] M.Kramar、R.Levanger、J.Tithof、B.Suri、M.Xu、M.Paul、M.F.Schatz和K.Mischaikow,使用持久同源性分析Kolmogorov流和Rayleigh-Benard对流,Phys。D、 334(2016),第82-98页·Zbl 1415.76582号
[38] Z.Liu、Y.Li、L.Han、J.Liu、Z.Zhao、W.Nie、Y.刘和R.Wang,PDB-wide绑定数据收集:PDBbind数据库的当前状态,生物信息学,31(2015),第405-412页。
[39] K.Mischaikow和V.Nanda,莫尔斯过滤理论和持久同调的有效计算,离散计算。地理。,50(2013年),第330-353页·Zbl 1278.57030号
[40] D.Morozov,Dionysus:计算持久同源性的图书馆,2012年,https://mrzv.org/software/dionysus2/, https://github.com/mrzv/dionysus。
[41] E.Munch,《持久同调在时变系统中的应用》,杜克大学论文,北卡罗来纳州达勒姆,2013年。
[42] D.D.Nguyen、Z.Cang、K.Wu、M.Wang、Y.Cao和G.-W.Wei,《姿势和结合亲和力预测的数学深度学习和在D\(3)R大挑战中的排名》,《计算机辅助分子设计杂志》。,33(2019年),第71-82页。
[43] I.Obayashi和M.Yoshiwaki,持久同调的字段选择问题,预印本,https://arxiv.org/abs/11911.11350, 2019.
[44] N.Otter、M.A.Porter、U.Tillmann、P.Grindrod和H.A.Harrington,持久同源性计算路线图,EPJ数据科学。,6 (2017), 17.
[45] F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay,《Scikit-learn:Python中的机器学习》,J.Mach。学习。Res.,12(2011),第2825-2830页·Zbl 1280.68189号
[46] J.A.Perea,通过稀疏过滤的持久上同调实现多尺度投影坐标,离散计算。地理。,59(2018),第175-225页·兹比尔1387.55021
[47] J.A.Perea、A.Deckard、S.B.Haase和J.Harer,《Sw1pers:滑动窗口和1-持久性得分》;发现基因表达时间序列数据的周期性,BMC生物信息学,16(2015),第257页。
[48] E.Rybakken、N.Baas和B.Dunn,使用上同调特征提取对神经数据进行解码,神经计算。,31(2019年),第68-93页·Zbl 1471.92034号
[49] S.Tymochko、E.Munch和F.A.Khasawneh,持久图模板函数的自适应分区,预打印,https://arxiv.org/abs/1910.08506, 2019.
[50] M.Vejdemo-Johansson、F.T.Pokorny、P.Skraba和D.Kragic,周期运动的同调学习,应用。代数工程通信计算。,26(2015),第5-26页·Zbl 1331.68236号
[51] R.Wang、L.Lai和S.Wang,基于结构的结合亲和力预测经验评分函数的进一步开发和验证,计算机辅助分子设计杂志。,16(2002),第11-26页。
[52] C.Wu、S.Ren、J.Wu和K.Xia,加权(Co)同调和加权拉普拉斯,预印本,https://arxiv.org/abs/1804.06990, 2018.
[53] 夏国良,魏国伟,蛋白质结构、柔韧性和折叠的持久同源性分析,国际数学家杂志。方法生物识别。工程,30(2014),第814-844页。
[54] 夏国良,魏国伟,生物分子数据的多维持久性,计算机学报。化学。,36(2015),第1502-1520页。
[55] Xia K.L.和Wei G.W.,低温电子显微镜数据分析的持久拓扑,国际数值杂志。方法生物医学工程,31(2015),e02719。
[56] S.Zhang、Q.Wang、Y.Kawazoe和P.Jena,《三维金属氮化硼》,J.Amer。化学。Soc.,135(2013),第18216-18221页。
[57] A.Zomordian和G.Carlsson,计算持久同源性,离散计算。地理。,33(2005年),第249-274页·Zbl 1069.55003号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。