×

渗滤液:指数族JIVE模型,用于设计基于DNA的药物反应预测因子。 (英语) Zbl 1530.92062号

唐海旭(主编),《计算分子生物学研究》。第27届国际年会,RECOMB 2023,土耳其伊斯坦布尔,2023年4月16-19日。诉讼程序。查姆:斯普林格。勒克特。注释计算。科学。13976, 120-138 (2023).
摘要:动机:抗肿瘤药物可能通过涉及多个基因组层的机制引起耐药性或敏感性。然而,我们已经证明,与其他组学数据类型相比,基因表达具有大多数预测能力。不幸的是,这是要付出代价的:基因表达生物标记通常很难解释,并且表现出较差的稳健性。
结果:为了获得两者的最佳结果,即基因表达的准确性和其他基因组水平的稳健性,如突变、拷贝数或甲基化,我们开发了Percolate,这是一种提取基因表达和其他组学数据类型之间联合信号的计算方法。我们开发了Percolate的样本外扩展,可以对未发现的样本进行预测,而无需重新计算所有数据的联合信号。我们使用Percolate提取基因表达与突变、拷贝数或甲基化之间的联合信号,并使用样本外扩展对未发现的样本进行响应预测。我们发现,联合信号概括了,有时甚至超过了每种数据类型单独实现的预测性能。重要的是,Percolate创建的分子签名不需要评估基因表达,因此适用于只有一种数据类型的临床应用。
可利用性:Percolate作为Python 3.7包提供,这里提供了重现结果的脚本。
关于整个系列,请参见[Zbl 1524.92002年].

理学硕士:

92C40型 生物化学、分子生物学
92-08 生物问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aben,N.,TANDEM:基于多种分子数据类型的药物反应模型可解释性最大化的两阶段方法,生物信息学,32,17,i413-i420(2016)·doi:10.1093/bioinformatics/btw449
[2] Aben,N.,ITOP:推断组学数据的拓扑,生物信息学,34,17,i988-i996(2018)·doi:10.1093/bioinformatics/bty636
[3] Akaike,H.,统计模型识别的新视角,IEEE Trans。自动。控制,19,6,716-723(1974)·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[4] Argelaguet,R.,《多组分因子分析——多组分数据集无监督集成的框架》,Mol.Syst。生物学,14,6,1-13(2018)·doi:10.15252/msb.20178124
[5] Bersanelli,M.,《多组学数据集成方法:数学方面》,BMC生物信息。,17, 2, 167-177 (2016)
[6] Cantini,L.,《癌症研究的联合多组学降维方法基准》,美国国家通讯社。,12, 1, 1-12 (2021) ·doi:10.1038/s41467-020-20430-7
[7] Collins,M.,《主成分分析对指数族的推广》,NeurIPS,14,1-8(2002)
[8] Costello,JC,《评估和改进药物敏感性预测算法的社区努力》,国家生物技术。,32, 12, 1202-1212 (2014) ·doi:10.1038/nbt.2877
[9] Dempster,JM,基因表达比基因组学更能预测体外癌细胞脆弱性,BioRxiv,1,1-42(2020)
[10] Eklund、EA、KRAS突变对转移性非小细胞肺癌外科临床结局的影响,癌症,142063(2022)·doi:10.3390/cancers14092063
[11] 冯,Q,基于角度的联合和个体变异解释,J.Multivar。分析。,166, 241-265 (2018) ·Zbl 1408.62113号 ·doi:10.1016/j.jmva.2018.03.008
[12] Ghandi,M.,《癌症细胞系百科全书的下一代特征》,《自然》,569,7757,503-508(2019)·doi:10.1038/s41586-019-1186-3
[13] Hanahan,D.,《癌症的标志:下一代》,《细胞》,144,5646-674(2011)·doi:10.1016/j.cell.2011.02.013
[14] Hientz,K.,《p53在肿瘤耐药和靶向化疗中的作用》,Oncotarget,8,5,8921-8946(2017)·doi:10.18632/目标13475
[15] Hoogstraat,M.,《治疗卵巢癌的基因组和转录组可塑性》,《基因组研究》,24,2,200-211(2014)·doi:10.1101/gr.161026.113
[16] Iorio,F.,癌症中药物基因组相互作用的前景,Cell,166,740-754(2016)·doi:10.1016/j.cell.2016.06.017
[17] Jang,IS,癌症细胞系数据药物敏感性预测分析方法的系统评估,Pac。交响乐团。生物计算。,23, 1-7 (2013)
[18] Kim,ST,KRAS突变对一线吉西他滨化疗胰腺癌患者临床结局的影响,Mol.cancer Ther。,10, 10, 1993-1999 (2011) ·doi:10.158/1535-7163.MCT-11-0269
[19] Kim,Y.,等:WON-PARAFAC:一种基因组数据整合方法,用于确定预测体内药物敏感性的可解释因素,第1-30页
[20] Kristensen,V.N.,等:Kristensen-癌症综合基因组分析的原理和方法.pdf。国家癌症研究所。14, 299-313 (2014)
[21] Landgraf,AJ,通过自然参数投影对二进制数据进行降维,J.Multivar。分析。,180, 2020 (1999) ·Zbl 1450.62069号
[22] Lawrence,N.,高斯过程潜在变量模型的概率非线性主成分分析,J.Mach。学习。研究,61783-1816(2005)·Zbl 1222.68247号
[23] Li,J.,简单指数族PCA,IEEE Trans。神经网络。学习。系统。,24, 3, 485-497 (2013) ·doi:10.1109/TNNLS.2012.2234134
[24] Li,Y.,《多视角生物数据集成的机器学习原理综述》,Brief。生物信息。,19, 2, 325-340 (2018)
[25] Liu,LT,ePCA:高维指数族PCA,Ann.Appl。统计人员。,12, 4, 2121-2150 (2018) ·Zbl 1411.62376号 ·doi:10.1214/18-AOAS1146
[26] Lock、EF、Joint和individual variation explained(JIVE),用于多数据类型的综合分析,Ann.Appl。统计人员。,7, 1, 523-542 (2013) ·Zbl 1454.62355号 ·doi:10.1214/12-AOAS597
[27] Martincorena,I.,《癌症和正常细胞的体细胞突变》,《科学》,349,6255,1483-1489(2015)·doi:10.1126/science.aab4082
[28] McLeod,HL,《癌症药物基因组学:早期承诺,但需要协同努力》,《科学》,340,6127,1563-1566(2013)·doi:10.1126/science.1234139
[29] Meghwanshi,M.等人:McTorch,深度学习的流形优化库,第1-5页(2018年)
[30] Paske,A.等人:散文中的自动区分。In:NeurIPS(2017)
[31] 皮特曼,EJ,《充分统计和内在准确性》,数学。程序。剑桥菲洛斯。《社会学杂志》,32,4,567-579(1936)·doi:10.1017/S0305004100019307
[32] Rees,MG,《相关化学敏感性和基础基因表达揭示作用机制》,《自然化学》。生物学,12,2,109-116(2016)·doi:10.1038/nchembio.1986
[33] Relling,MV,《临床药物基因组学》,《自然》,526,7573,343-350(2015)·doi:10.1038/nature15817
[34] Robinson,医学博士,edgeR:用于数字基因表达数据差异表达分析的生物导管包,生物信息学,26,1139-140(2009)·doi:10.1093/生物信息学/btp616
[35] Sagonas,C.,解释的稳健联合和个体方差,CVPR,5739-57482017(2017)
[36] Sharifi-Noghabi,H.,MOLI:用于药物反应预测的多组学与深层神经网络的晚期集成,生物信息学,35,14,i501-i509(2019)·doi:10.1093/bioinformatics/btz318
[37] Shu,H.,D-CCA:高维数据集基于分解的典型相关分析,美国统计协会,115,529,292-306(2020)·兹比尔1437.62211 ·doi:10.1080/01621459.2018.1543599
[38] Smith,AM,标准机器学习方法在转录组学数据的表型预测方面优于深度表征学习,BMC Bioninform。,21, 1, 1-18 (2020) ·doi:10.1186/s12859-020-3427-8
[39] Tipping,ME,概率主成分分析,J.Roy。Stat.Soc.B,61,3,611-622(1999)·Zbl 0924.62068号 ·doi:10.1111/1467-9868.00196
[40] 城镇,FW;希克斯,南卡罗来纳州;Aryee,MJ;Irizarry,RA,基于多项式模型的单细胞RNA-SEQ的特征选择和降维,基因组生物学。,20, 1, 1-16 (2019) ·doi:10.1186/s13059-019-1861-6
[41] Wang,B.,用于在基因组尺度上聚合数据类型的相似网络融合,《自然方法》,11,3,333-337(2014)·doi:10.1038/nmeth.2810
[42] Zou,H.,通过弹性网进行正则化和变量选择Hui,J.Statist。Soc.序列号。B、 67、2、301-320(2005)·兹比尔1069.62054 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。