×

细胞级通路评分与生物约束可变自动编码器的比较。 (英语) Zbl 1533.92157号

Pang,Jun(编辑)等人,《系统生物学中的计算方法》。第21届国际会议,CMSB 2023,卢森堡市,卢森堡,2023年9月13日至15日。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。14137, 62-77 (2023).
摘要:在研究和理解以单细胞分辨率分析基因组数据时出现的复杂模式时,无监督技术无处不在。特别是,无监督的深度学习模型为处理scRNA-seq数据时出现的最常见任务提供了最先进的解决方案。然而,这些复杂模型的生物实用性受到其黑盒性质的影响。为了解决这些局限性,出现了几条研究路线,从事后近似到事后建模。在这项工作中,我们研究了两个生物约束变分自编码器的行为(前hoc建模)。一方面,我们使用一个约束来自信号通路的单层架构,另一方面,根据信号转导机制模型的最新趋势,我们提出了一个双层架构。我们使用模型学习到的表示作为单细胞水平上信号活动的代理。我们使用已知的scRNA-seq公共数据集和明确确定的基本事实来检查评分模型的性能。虽然这两个模型都捕捉到了相关的信号,但最显著的差异可以通过单层体系结构更好地捕捉到,而双层设计能够学习到更细粒度的特征,这些特征可以暴露数据中不太突出的方面。
关于整个系列,请参见[Zbl 1531.92007年].

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abadi,M.等人:TensorFlow:异构分布式系统上的大规模机器学习,2016年3月。doi:10.48550/arXiv.1603.04467
[2] Aibar,S.,SCENIC:单细胞调控网络推断和聚类,《自然方法》,14,11,1083-1086(2017)·doi:10.1038/nmeth.4463
[3] Badia-i-Mompel,P.等人:decobleR:从组学数据推断生物活性的计算方法集合。生物信息学。高级2(1),vbac016(2022)。doi:10.1093/bioadv/vbac016
[4] Benjamini,Y.,Hochberg,Y.:控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计社会服务。B(方法学)57(1),289-300(1995)。doi:10.1111/j.2517-6161.1995.tb02031.x·Zbl 0809.62014号
[5] 乔布克,C。;Loucera,C。;Peña-Chilet,M。;Dopazo,J.,乳腺癌代谢物生成和信号传导活性之间的串扰,国际分子科学杂志。,24, 8, 7450 (2023) ·doi:10.3390/ijms24087450
[6] Dash,T。;Chitlangia,S。;Ahuja,A。;Srinivasan,A.,《将领域知识纳入深度神经网络的一些技术综述》,科学。代表,12,1,1040(2022)·doi:10.1038/s41598-021-04590-0
[7] Gillespie,M.,《反应体途径知识库2022》,核酸研究,50,D1,D687-D692(2022)·doi:10.1093/nar/gkab1028
[8] Graziani,M.,《可解释人工智能的全球分类:统一技术和社会科学术语》,Artif。智力。修订版,56,4,3473-3504(2023)·doi:10.1007/s10462-022-10256-8
[9] Gundogdu,P。;阿拉莫,I。;内波穆塞诺·查莫罗,IA;Dopazo,J。;Loucera,C.,SigPrimedNet:已知和未知细胞类型scRNA-seq注释的信号通知神经网络,生物学,12,4,579(2023)·doi:10.3390/生物12040579
[10] Gundogdu,P。;Loucera,C。;阿拉莫·阿尔瓦雷斯,I。;Dopazo,J。;Nepomuceno,I.,《将通路知识与深度神经网络相结合以降低单细胞RNA-seq数据的维数》,生物数据挖掘,第15、1、1页(2022年)·doi:10.1186/s13040-021-00285-4
[11] 哈里斯,CR,《使用NumPy进行数组编程》,《自然》,585,7825,357-362(2020)·doi:10.1038/s41586-020-2649-2
[12] Heumos,L.等人:跨模式单细胞分析的最佳实践。Nat.Rev.基因。(2023). doi:10.1038/s41576-023-00586-w
[13] Hidalgo,M.R.,Cubuk,C.,Amadoz,A.,Salavert,F.,Carbonell-Caballero,J.,Dopazo,J.:功能细胞活动的高通量估计揭示了疾病机制并预测了相关临床结果。Oncotarget 8(3),5160-5178(2016)。doi:10.18632/目标14107
[14] Kang,HM,《利用自然遗传变异进行多重液滴单细胞RNA测序》,国家生物技术。,36, 1, 89-94 (2018) ·doi:10.1038/nbt.4042
[15] Kingma,D.P.,Ba,J.:《亚当:随机优化方法》,2017年1月。doi:10.48550/arXiv.1412.6980
[16] Kuenzi,BM,使用人类癌症细胞的深度学习模型预测药物反应和协同作用,《癌症细胞》,38,5,672-684.e6(2020)·doi:10.1016/j.cell.2020.09.014
[17] Lähnemann,D.,《单细胞数据科学的十一大挑战》,《基因组生物学》。,21, 1, 31 (2020) ·doi:10.1186/s13059-020-1926-6
[18] Levine,J.H.等:数据驱动的AML表型解剖揭示了与预后相关的祖细胞样细胞。细胞162(1),184-197(2015)。doi:10.1016/j.cell.2015.05.047
[19] Li,C.等:SciBet是一种便携式快速单细胞类型标识符。国家公社。11(1), 1818 (2020). doi:10.1038/s41467-020-15523-2。https://www.nature.com/articles/s41467-020-15523-2,bandiera_abtest:a Cc_license_type:Cc_by Cg_type:Nature Research Journals Number:1 Primary_atype:Research Publisher:Nature Publishing Group Subject_term:Machine learning;转录组学Subject_term_id:机器学习;转录组学
[20] Lotfollahi,M.,《生物学》,《深入学习查询单细胞图谱中的基因程序》,《自然细胞生物学》。,25, 2, 337-350 (2023) ·doi:10.1038/s41556--022-01072-x
[21] Ma,J.,使用深度学习建模细胞的层次结构和功能,《自然方法》,15,4,290-298(2018)·数字对象标识代码:10.1038/nmeth.4627
[22] McInnes,L.,Healy,J.,Melville,J.:UMAP:统一流形近似和降维投影,2020年9月。doi:10.48550/arXiv.1802.03426
[23] Ogata,H。;Goto,S。;佐藤,K。;Fujibuchi,W。;博诺,H。;Kanehisa,M.,KEGG:《京都基因和基因组百科全书》,《核酸研究》,27,1,29-34(1999)·doi:10.1093/nar/27.1.29
[24] 彼得格罗索,R。;李,Z。;Kuang,R.,聚类单细胞RNA测序数据的机器学习和统计方法,简介。生物信息。,21, 4, 1209-1223 (2020) ·doi:10.1093/bib/bbz063
[25] Regev,A.等人:人类细胞图谱会议参与者:人类细胞图集。eLife 6,e27041(2017)。doi:10.7554/eLife.27041
[26] 特拉格,V。;沃尔特曼,L。;新泽西州范·埃克(van Eck),《从鲁汶到莱顿:保障联系紧密的社区》,科学。代表,9,1,5233(2019)·doi:10.1038/s41598-019-41695-z
[27] Virshup,I.等人:scverse项目为单细胞组学数据分析提供了一个计算生态系统。自然生物技术。,1-3 (2023). doi:10.1038/s41587-023-01733-8
[28] Virshup,I.、Rybakov,S.、Theis,F.J.、Angerer,P.、Wolf,F.A.:Anndata:注释数据,2021年12月。数字对象标识代码:10.1101/2021.12.16.473007
[29] Virtanen,P.等人:SciPy 1.0:Python中科学计算的基本算法。《自然方法》17(3),261-272(2020)。doi:10.1038/s41592-019-0686-2
[30] Wang,J.,Zou,Q.,Lin,C.:单细胞RNA测序数据基于深度学习的预处理和聚类方法的比较。生物信息简介。23(1),bbab345(2022)。doi:10.1093/bib/bbab345
[31] 方式,GP;Greene,CS,《利用机器学习发现转录组概要中的通路和细胞类型特征》,Ann.Rev.Biomed。数据科学。,2, 1, 1-17 (2019) ·doi:10.1146/annurev-biodatascience 072018-021348
[32] 沃尔夫,FA;Angerer,P。;Theis,FJ,SCANPY:大规模单细胞基因表达数据分析,基因组生物学。,19, 1, 15 (2018) ·doi:10.1186/s13059-017-1382-0
[33] 扎皮亚,L。;Theis,FJ,超过1000种工具揭示了单细胞RNA-seq分析领域的趋势,Genome Biol。,22, 1, 301 (2021) ·doi:10.1186/s13059-021-02519-4
[34] Zhao,Y。;邵,J。;Asmann,YW,用于转录组数据的可解释机器学习模型的评估和优化,基因组蛋白质组学生物信息学。,20, 5, 899-911 (2022) ·doi:10.1016/j.gpb.2022.07.003
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。