开放式访问
2022年12月 空间蛋白质组学的半监督非参数贝叶斯建模
奥利弗·克鲁克,凯瑟琳·莉莉,劳伦特·加托,保罗·D·W·柯克
作者关联+
附录申请。斯达。 16(4): 2554-2576 (2022年12月)。 DOI:10.1214/22-AOAS1603

摘要

理解亚细胞蛋白质定位是分析上下文特异性蛋白质功能的重要组成部分。定量质谱(MS)的最新进展导致了数千种蛋白质在细胞内亚细胞位置的高分辨率映射。因此,有必要考虑新的建模因素,以捕捉这些数据的复杂性质。我们使用高斯过程回归模型的K成分混合物,在非参数贝叶斯框架中分析空间蛋白质组学数据。高斯过程回归模型解释了亚细胞生态位内的相关结构,每个混合组分捕获了在每个生态位内观察到的不同的相关结构。可用性标记蛋白(即具有预先已知标记位置的蛋白质)激发半监督学习方法来通知高斯过程超参数。此外,我们还为我们的模型提供了一个有效的哈密顿-内-吉布斯采样器。此外,我们通过利用协方差矩阵中的结构来减少与协方差矩阵反演相关的计算负担。协方差矩阵的张量分解允许应用扩展的Trench和Durbin算法来降低反演的计算复杂性,从而加速计算。我们提供详细的案例研究果蝇属胚胎和小鼠多能干细胞,以说明半监督功能贝叶斯数据建模的好处。

资金筹措表

在完成这项工作的同时,OMC是剑桥大学临床医学院资助的Wellcome Trust数学基因组学和医学专业的学生。KSL和LG获得了Wellcome Trust Award 110170/Z/15/Z的支持。PDWK得到了MRC项目参考MC_U_00002/13和国家健康研究所(剑桥大学医院NHS基金会信托的剑桥生物医学研究中心)的支持。
所表达的观点是作者的观点,不一定是NHS、NIHR或卫生和社会护理部的观点。

引用

下载引文

奥利弗·克鲁克。 凯瑟琳·莉莉(Kathryn S.Lilley)。 劳伦·加托(Laurent Gatto)。 保罗·D·W·柯克。 “空间蛋白质组学的半监督非参数贝叶斯建模。” 附录申请。斯达。 16 (4) 2554 - 2576, 2022年12月。 https://doi.org/10.1214/22-AOAAS1603

问询处

收到日期:2020年7月1日;修订日期:2021年10月1日;发布日期:2022年12月
欧几里德项目首次提供:2022年9月26日

数学科学网:MR4489223型
zbMATH公司:1498.62204
数字对象标识符:10.1214/22-AOAS1603

关键词:贝叶斯混合模型,蛋白质组学,半监督学习

版权所有©2022数学统计研究所

第16卷•第4期•2022年12月
返回页首