×

拓扑数据分析及其在精确医学研究中的用途。 (英语) Zbl 1491.62166号

概要:精准医学允许从复杂数据集中提取信息,以促进个人层面的临床决策。拓扑数据分析(TDA)提供了有前途的工具,可以补充精确医学研究中的当前分析方法。我们介绍了TDA语料库的基本概念(简单复合体、映射图、持久性图和持久性景观)。我们展示了如何利用这些数据来加强临床结果的预测,并确定新的感兴趣的亚群,特别是用于了解GENDEP临床试验数据中抑郁症的缓解情况。

理学硕士:

第62页第10页 统计学在生物学和医学中的应用;元分析
62兰特 大数据和数据科学的统计方面
62R40型 拓扑数据分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[2] Adamson,A.S.和Welch,H.G.(2019年)。机器学习和癌症诊断问题——没有黄金标准。《新英格兰医学杂志》,381(24):2285-2287。
[3] Bauer,U.、Kerber,M.、Reininghaus,J.和Wagner,H.(2017年)。Phat-持久Homology算法工具箱。符号计算杂志,78:76-90·Zbl 1348.68181号
[6] Beck,A.T.、Ward,C.H.、Mendelson,M.、Mock,J.和Erbaugh,J.(1961年)。测量抑郁症的调查。普通精神病学档案,4(6):561-571。
[7] Belchí,F.、Brodzki,J.、Burftt,M.和Niranjan,M.(2019年)。映射类型算法不稳定性的数值度量。机器学习研究杂志,21:1-45·Zbl 07307480号
[8] Bubenik,P.(2015)。使用持久性环境进行统计拓扑数据分析。第26页·Zbl 1337.68221号
[9] Carlsson,G.(2009)。拓扑和数据。美国数学学会公报,46(2):255-308·Zbl 1172.62002号
[10] Carr,E.、Carrière,M.、Michel,B.、Chazal,F.和Iniesta,R.(2021)。识别患者的同质子组和重要特征:拓扑机器学习方法。
[11] Carrière,M.(2019年)。MathieuCarrier/Sklearn-Tda。
[12] Carrière,M.(2020年)。MathieuCarrier/Statmapper公司。
[13] Carrière,M.、Michel,B.和Oudot,S.(2018年)。映射器的统计分析和参数选择。机器学习研究杂志,19(1):1-39·Zbl 1444.62172号
[14] Carrière,M.和Oudot,S.(2017年)。Reeb图的局部等价性和诱导度量。第33届计算几何研讨会论文集·Zbl 1432.68504号
[15] Carrière,M.和Oudot,S.(2018年)。一维映射器的结构和稳定性。计算数学基础,18(6):1333-1396·Zbl 1412.55017号
[16] Chartrand,G.(1985)。图论导论。多佛出版公司,纽约,简编版。
[17] Chazal,F.(2016)。高维拓扑数据分析。《离散和计算几何第三手册》。CRC出版社。
[18] Chazal,F.、Massart,P.和Michel,B.(2016)。稳健几何推理的收敛速度。《电子统计杂志》,10(2):2243-2286·兹比尔1347.62055
[19] Chazal,F.和Michel,B.(2021)。拓扑数据分析导论:数据科学家的基础和实践方面。人工智能前沿,4。Chazal,F.和Oudot,S.Y.(2008年)。欧氏空间中基于持久性的重建。《第二十四届计算几何年度研讨会论文集-SCG’08》,第232页,美国马里兰州大学公园,ACM出版社。
[20] Chekroud,A.M.、Zotti,R.J.、Shehzad,Z.、Gueorguieva,R.、Johnson,M.K.、Trivedi,M.H.、Cannon,T.D.、Krystal,J.H.和Corlett,P.R.(2016)。抑郁症治疗结果的跨试验预测:机器学习方法。《柳叶刀精神病学》,3(3):243-250。
[21] Cohen-Steiner,D.、Edelsbrunner,H.和Harer,J.(2007)。持久性粒度的稳定性。离散与计算几何,37(1):103-120·Zbl 1117.54027号
[22] Dagliati,A.、Geifman,N.、Peek,N.,Holmes,J.H.、Sacchi,L.、Bellazzi,R.、Sajjadi,S.E.和Tucker,A.(2020年)。使用拓扑数据分析和伪时间序列从电子健康记录推断时间表型。医学中的人工智能,108:101930。
[23] Devillers,O.、Hornus,S.和Jamin,C.(2022)。dD三角剖分。在CGAL用户和参考手册中。CGAL编辑委员会,5.4版。
[24] Edelsbrunner,H.、Letscher,D.和Zomordian,A.(2000)。拓扑持久性和简化。第41届计算机科学基础年会论文集,第454-463页。
[25] Ekins,S.、Puhl,A.C.、Zorn,K.M.、Lane,T.R.、Russo,D.P.、Klein,J.J.、Hickey,A.J.和Clark,A.M.(2019年)。利用机器学习进行端到端药物发现和开发。《自然材料》,18(5):435-441。
[26] Fasy,B.T.、Kim,J.、Lecci,F.和Maria,C.(2014)。R包TDA简介。arXiv:1411.1830[cs,统计]。
[27] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。统计软件杂志,33(1):1-22。
[28] Ghrist,R.(2018)。同调代数和数据。在Mahoney,M.、Duchi,J.和Gilbert,A.的编辑中,IAS/公园城市数学系列,第25卷,第273-325页。美国数学学会,罗德岛州普罗维登斯·Zbl 1448.68007号
[29] Hamilton,M.(1967年)。原发性抑郁症评定量表的编制。英国社会与临床心理学杂志,6(4):278-296。
[30] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。统计学习的要素:数据挖掘、推理和预测。斯普林格统计系列第一·Zbl 1273.62005年
[31] Hatcher,A.(2002)。代数拓扑。剑桥大学出版社·Zbl 1044.55001号
[32] Henle,M.(1994)。拓扑学的组合导论。纽约多佛图书公司·Zbl 0852.55002号
[33] Ho,D.S.W.、Schierding,W.、Wake,M.、Saffery,R.和O'Sullivan,J.(2019年)。基于Ma-chine学习SNP的精准医学预测。遗传学前沿,10:267。
[34] 伊涅斯塔·R、霍奇森·K、斯塔尔·D、马尔基·K、迈尔·W、里切尔·M、莫尔斯·O、豪泽·J、亨利斯伯格·N、德诺夫斯克·M·Z、苏埃里·D、多布森·R、艾奇森·J·J、法默·A、麦古芬·P、刘易斯·C·M和尤尔·R(2018)。基因和临床变量对抑郁症治疗结果的抗抑郁药物特异性预测。科学报告,8(1):1-9。
[35] Iniesta,R.、Malki,K.、Maier,W.、Rietschel,M.、Mors,O.、Hauser,J.、Henigsberg,N.、Dernovsek,M.Z.、Souery,D.、Stahl,D.、Dobson,R.,Aitchison,K.J.、Farmer,A.、Lewis,C.M.、McGuffn,P.和Uher,R..(2016)。结合临床变量优化抗抑郁治疗结果的预测。《精神病学研究杂志》,78:94-102。
[36] Iniesta,R.、Stahl,D.和McGuffn,P.(2017)。机器学习、统计学习和精神病学生物研究的未来。心理医学,46(12):2455-2465。
[37] Ioannidis,J.、Klavans,R.和Boyack,K.(2016)。跨科学学科的多个引文指标及其组合。《公共科学图书馆·生物学》,14(7)。
[38] Khan,W.、Crockett,K.、O'Shea,J.、Hussain,A.和Khan,B.M.(2021年)。欺骗者眼中的欺骗:基于计算机视觉和机器学习的自动欺骗检测。应用专家系统,169。
[39] Khan,W.、Hussain,A.、Ahmed Khan,S.、Al-Jumailey,M.、Raheel,N.和Liatsis,P.(2019年)。使用类别规则挖掘和模式匹配分析全球人口特征对新型冠状病毒传播的影响。英国皇家学会开放科学,8。Kosniowski,C.(1980年)。代数拓扑第一课程。CUP存档。
[40] Kuhn,M.(2008)。使用插入符号包在r中构建预测模型。《统计软件杂志》,文章,28(5):1-26。
[41] Mitchell,T.M.(1997)。机器学习。McGraw-Hill计算机科学系列。McGraw-Hill,纽约·Zbl 0913.68167号
[42] Mitchell,T.M.(2006)。机器学习的学科。第9页。
[43] Montgomery,S.A.和˚一种新的抑郁量表,设计为Asberg,M.(1979)。对变化敏感。英国精神病学杂志,134:382-389。
[44] Morozov,D.(2007)。Dionysus,一个用于计算持久同源性的C++库。
[45] Müllner,D.和Babu,A.(2013)。Python Mapper:用于数据探索的开源工具链。
[46] Munch,E.(2017)。拓扑数据分析用户指南。学习分析杂志,4(2):47-61。
[47] 《自然》(2019)。医学中机器学习的兴起。《自然材料》,18(5):407-407·Zbl 1425.00052号
[48] Nicolau,M.、Levine,A.J.和Carlsson,G.(2011年)。基于拓扑的数据分析确定了一组具有独特突变模式和良好生存率的乳腺癌。《美国国家科学院院刊》,108(17):7265-7270。
[49] Nielson,J.L.、Cooper,S.R.、Yue,J.K.、Sorani,M.D.、Inoue,T.、Yuh,E.L.、Mukherjee,P.、Petrossian,T.C.、Paquette,J.、Lum,P.Y.、Carlsson,G.E.、Vassar,M.J.、Lingsma,H.F.、Gordon,W.A.、Valadka,A.B.、Okonkwo,D.O.、Manley,G.T.、Ferguson,A.R.和TRACK-TBI调查员(2017)。使用拓扑数据分析揭示创伤性脑损伤中精确的表型-生物标志物关联。PLOS ONE,12(3):e0169490。
[50] Nusrat,S.、Harbig,T.和Gehlenborg,N.(2019年)。基因组数据可视化的任务、技术和工具。计算机图形论坛,38(3):781-805。
[51] Otter,N.、Porter,M.A.、Tillmann,U.、Grindrod,P.和Harrington,H.A.(2017年)。计算持久同源性的路线图。EPJ数据科学,6(1):17。
[52] 佩德雷戈萨(Pedregosa,F.)、瓦罗佐(Varoqueux,G.)、格兰福特(Gramfort,A.)、米歇尔(Michel,V.)、提里昂(Thirion,B.)、格里塞尔(Grisel,O.)、布隆德尔(Blondel,M.)、普雷滕霍弗(Prettenhofer,P.)、韦斯(Weiss,R.)、杜堡(Dubourg,V.,范德普拉斯(Vanderplas,J.)、帕索斯(Passos,A。Scikit-learn:Python中的机器学习。机器学习研究杂志,12:2825-2830·Zbl 1280.68189号
[53] Perroud,N.、Uher,R.、Ng,M.Y.M.、Guipponi,M.、Hauser,J.、Henigsberg,N.和Maier,W.、Mors,O.、Gennarelli,M.,Rietschel,M.和Souery,D.、Dernovsek,M.Z.、Stamp,A.S.、Lathrop,M.。Farmer,A.、Breen,G.、Aitchison,K.J.、Lewis,C.M.、Craig,I.W.和McGuffn,P.(2012)。GENDEP项目中抗抑郁治疗期间自杀意念增加的全基因组关联研究。《药物经济学杂志》,12(1):68-77。
[54] Qu,Z.、Lau,C.W.、Nguyen,Q.V.、Zhou,Y.和Catchpoole,D.R.(2019年)。基因组和癌症数据的可视化分析:系统综述。癌症信息学,18:117693511983554。
[55] R核心团队(2020年)。R: 统计计算语言和环境。奥地利维也纳。
[56] Rajkomar,A.、Dean,J.和Kohane,I.(2019年)。医学中的机器学习。《新英格兰医学杂志》,380(14):1347-1358。
[57] Riemann,B.和Clifford,T.W.K.(1998)。关于几何学基础的假设。第15页。
[58] Sies,A.、Demyttenaere,K.和Mechelen,I.V.(2019年)。通过诱导亚组研究精准医学中的治疗效果。生物制药统计学杂志,29(3):491-507。
[59] Singh,G.、Mémoli,F.和Carlsson,G.(2007年)。用于分析高维数据集和三维对象识别的拓扑方法。PBG@Eurographics。
[60] GUDHI项目(2015年)。GUDHI用户和参考手册。GUDHI编辑委员会。
[61] GUDHI项目(2020年)。GUDHI用户和参考手册。GUDHI编辑委员会,3.1.1版。
[62] Traylor,M.、Markus,H.和Lewis,C.M.(2015)。同质性病例亚群增加了遗传关联研究的效力。欧洲人类遗传学杂志,23(6):863-869。
[63] Uher,R.、Farmer,A.、Maier,W.、Rietschel,M.、Hauser,J.、Marusic,A.、Mors,O.、Elkin,A.、Williamson,R.J.、Schmael,C.、Henigsberg,N.、Perez,J.,Mendlewicz,J、Janzing,J.G.E.、Zobel,A.、Skibinska,M.,Kozel,D.、Stamp,A.S.、Bajs,M.和Placentino,A.、Barreto,M.(2008)。测量抑郁:GENDEP研究中三种量表的比较和整合。心理医学,38(2):289-300。
[64] Uher,R.、Muthén,B.、Souery,D.、Mors,O.、Jaracz,J.、Placentino,A.、Petrovic,A.、Zobel,A.、Henigsberg,n.、Rietschel,M.、Aitchison,K.J.、Farmer,A.和McGuf fn,P.(2010a)。抗抑郁药治疗期间抑郁严重程度的变化轨迹。心理医学,40(8):1367-1377。
[65] Uher,R.、Perlis,R.H.、Henigsberg,N.、Zobel,A.、Rietschel,M.、Mors,O.、Hauser,J.、Dernovsek,M.Z.、Souery,D.、Bajs,M.,Maier,W.、Aitchison,K.J.、Farmer,A.和McGuffn,P.(2012)。抑郁症状维度作为抗抑郁治疗结果的预测因素:兴趣活动症状的可复制证据。心理医学,42(5):967-980。
[66] Uher,R.、Perroud,N.、Ng,M.Y.、Hauser,J.、Henigsberg,N.,Maier,W.、Mors,O.、Pla-centino,A.、Rietschel,M.、Sourey,D.、Zhagar,T.、Czerski,P.M.、Jerman,B.、Larsen,E.R.、Schulze,T.G.、Zobel,A.、Cohen-Woods,S.、Pirlo,K.、Butler,A.W.、Muglia,P.、Barnes,M.R.、Lathrop<、M.、Farmer,A.、Breen,G.、Aitchison,K.J.、Craig,一、。,Lewis,C.M.和McGuffn,P.(2010年b)。GENDEP项目中抗抑郁反应的全基因组药理学。美国精神病学杂志,167(5):555-564。van Rossum,G.(1995)。Python参考手册。
[67] Wing,J.K.、Babor,T.、Brugha,T.、Burke,J.、Cooper,J.E.、Giel,R.、Jablenski,A.、Regier,D.和Sartorius,N.(1990年)。扫描:神经精神病学临床评估一览表。普通精神病学档案,47(6):589-593。
[68] Zomordian,A.(2010年)。快速建造Vietoris-Rips综合体。计算机与图形,34(3):263-271。
[69] Zomordian,A.和Carlsson,G.(2005年)。计算持久同调。离散与计算几何,33(2):249-274·Zbl 1069.55003号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。