×

数学ZBZ-数学第一资源

不可忽视的缺失数据对无标记质谱蛋白质组学实验的影响。(英语) Zbl 1411.62377
摘要:一个理想化的无标签发现质谱蛋白质组学实验将提供整个蛋白质组在不同条件下的绝对丰度测量。不幸的是,这个理想没有实现。对肽的测量需要一个推断步骤来获得蛋白质水平的估计。这种推断由于实验因素而变得复杂,这些因素需要进行相对丰度估计,并导致大量不可忽视的缺失数据。测井比例尺上的相对丰度采用参数对比的形式。在一个完整的案例分析中,对比度估计可能会因缺失的数据而产生偏差,大量有用的信息往往会被闲置。
许多分析师为了避免单一数据的缺失而转向了单一的解决方案。不幸的是,这些方法往往会隐藏无法估量的对比,阻止块间信息的恢复,以及无法解释插补的不确定性,从而造成进一步的困难。为了减轻由于缺失值而造成的许多问题,我们建议使用贝叶斯选择模型。我们的模型在模拟数据、带有模拟缺失值的真实数据以及所有真实相对变化都已知的地面真实稀释实验上进行了测试。分析表明,与各种插补策略和完整的案例分析相比,我们的模型可以提高准确性,并对区间覆盖率提供实质性的改进。

理学硕士:
62页35页 统计学在物理学中的应用
15层62层 贝叶斯推理
第62页 统计学在生物学和医学科学中的应用;荟萃分析
软件:
序号;但丁;插补
PDF格式 BibTeX公司 XML 引用
参考文献:
[1] Azzalini,A.(2014年)。偏正态和相关的族。数理统计研究所(IMS)专著3。剑桥大学出版社,剑桥·Zbl 1338.62007
[2] Catherman,A.D.,Skinner,O.S.和Kelleher,N.L.(2014年)。自上而下蛋白质组学:事实与展望。生物化学。生物物理。公共住宅。445 683–693。
[三] 陈英爱和叶茨,J.R.(2007)。癌症蛋白质组学定量鸟枪蛋白质组学。分子肿瘤学。1144-159年。
[4] Clough,T.,Thaminy,S.,Ragg,S.,Aebersold,R.和Vitek,O.(2012年)。复杂设计的无标记LC-MS实验中的统计蛋白质定量和显著性分析。BMC生物信息。13(补充1)S6。
[5] Cox,J.和Mann,M.(2008年)。MaxQuant能够实现高肽识别率、个体化p.p.b.-范围内的质量准确度和蛋白质组范围内的蛋白质定量。纳特。生物技术。1367-1372年。
[6] Cox,J.,Hein,M.Y.,Luber,C.A.,Paron,I.,Nagaraj,N.和Mann,M.(2014年)。通过延迟标准化和最大肽比提取精确的蛋白质组宽标记定量,称为MaxLFQ。分子细胞。蛋白质组学13 2513–2526。
[7] de Brevern,A.G.,Hazout,S.和Malpertuy,A.(2004年)。微阵列实验缺失值对基因组稳定性的影响。BMC生物信息。5艺术。身份证号114。
[8] Fabre,B.,Lambour,T.,Bouyssié,D.,Menneteau,T.,Monsarrat,B.,Burlet Schiltz,O.和Bousquet Dubouch,M.-P.(2014年)。蛋白质复合物亚基化学计量测定的无标记定量方法比较。EuPA开放蛋白质组学4 82–86。
[9] 维蒂•R•D•史密斯(2012)。无标签LC-MS分析的归一化和缺失值插补。BMC生物信息。13(补充1)5。
[10] Karpievitch,Y.,Stanley,J.,Taverner,T.,Huang,J.,Adkins,J.N.,Ansong,C.,Heffron,F.,Metz,T.O.,Qian,W.J.,Yoon,H.,Smith,R.D.和Dabney,A.R.(2009年)。自下而上质谱蛋白质组学中蛋白质定量的统计框架。生物信息学25 2028-2034年。
[11] Keilhauer,E.C.,Hein,M.Y.和Mann,M.(2015年)。用亲和富集质谱法(AE-MS)代替亲和纯化质谱法(AP-MS)精确提取蛋白质复合物。分子细胞。蛋白质组学14 120–135。
[12] Lazar,C.,Gatto,L.,Ferro,M.,Bruley,C.和Burger,T.(2016年)。解释无标签定量蛋白质组学数据集中缺失值的多重性质,以比较插补策略。J、 蛋白质组研究15 1116-1125。
[13] Liebler,D.C.和Zimmerman,L.J.(2013年)。用质谱法对蛋白质进行靶向定量。生物化学52 3797–3806。
[14] Little,R.J.A.和Rubin,D.B.(1987年)。缺失数据的统计分析。威利,纽约·中银0665.62004
[15] (Angel,R.Seso.,2009年)。具有非随机丢失的iTRAQ数据的贝叶斯分析:差异表达蛋白质的鉴定。统计学家。比奥西。1228-245年。
[16] Mueller,L.N.,Rinner,O.,Schmidt,A.,Letarte,S.,Bodenmiller,B.,Brusniak,M.-Y.,Vitek,O.,Aebersold,R.和Müller,M.(2007年)。SuperHirn-一种新的高分辨率LC-MS多肽/蛋白质分析工具。蛋白质组学7 3470–3480。
[17] O'Brien,J.J.,O'Connell,J.D.,Paulo,J.A.,Thakurta,S.,Rose,C.M.,Weekes,M.P.,Huttlin,E.L.和Gygi,S.P.(2018a)。组分蛋白质组学:空间限制对利用等压标签进行蛋白质定量的影响。J、 蛋白质组研究17 590–599。
[18] O'Brien,J.J.,Gunavardena,H.P.,Paulo,J.A.,Chen,X.,Ibrahim,J.G.,Gygi,S.P.和Qaqish,B.F.(2018b)。“不可忽视的缺失数据对无标记质谱蛋白质组学实验的影响”的补充DOI:10.1214/18-AOAS1144补充。
[19] Owen,A.B.和Perry,P.O.(2009年)。奇异值分解与非负矩阵分解的双交叉验证。安。申请。统计3 564–594·Zbl 1166.62047
[20] 波皮提亚,A.D.,钱,W.-J.,杰里,N.,佩特尤克,V.A.,阿德金斯,J.N.,坎普,D.G.,安德森,G.A.和史密斯,R.D.(2008)。但丁:一种定量分析经济学数据的统计工具。生物信息学24 1556-1558。
[21] Ross,P.L.,Huang,Y.N.,Marchese,J.N.,Williamson,B.,Parker,K.,Hattan,S.,Khainovski,N.,Pillai,S.,Dey,S.,Daniels,S.,Purkaysta,S.,Juhasz,P.,Martin,S.,Bartlet Jones,M.,He,F.,Jacobson,A.和Pappin,D.J.(2004年)。用胺反应等压标记试剂定量测定酿酒酵母中的蛋白质。分子细胞。蛋白质组学3 1154–1169。
[22] Röst,H.L.,Rosenberger,G.,Navarro,P.,Gillet,L.,Miladinović,S.M.,Schubert,O.T.,Wolski,W.,Collins,B.C.,MalmströM,J.,MalmströM,L.和Aebersold,R.(2014年)。OpenSWATH能够自动、有针对性地分析独立于数据采集的MS数据。纳特。生物技术。32219-223。
[23] Sacco,F.,Humphrey,S.J.,Cox,J.,Mischnik,M.,Schulte,A.,Klabunde,T.,Schafer,M.和Mann,M.(2016年)。葡萄糖调节和药物干扰的磷酸蛋白组揭示了控制胰岛素分泌的分子机制。纳特。公社。7艺术。身份证号13250。
[24] Sandin,M.,Krogh,M.,Hansson,K.和Levander,F.(2011年)。定量无标签LC-MS分析质量评估的通用工作流程。蛋白质组学11 1114–1124。
[25] 舍夫,H.(1999年)。方差分析。威利,纽约。1959年原著的再版。
[26] Schliekelman,P.和Liu,S.(2014年)。在基于质谱的蛋白质组学中,定量分析合并肽之间的检测竞争对检测概率的影响。J、 蛋白质组研究13 348–361。
[27] Taverner,T.,Karpievitch,Y.V.,Polpitiya,A.D.,Brown,J.N.,Dabney,A.R.,Anderson,G.A.和Smith,R.D.(2012年)。DanteR:一个可扩展的基于R的工具,用于对组学数据进行定量分析。生物信息学28 2404–2406。
[28] Tekwe,C.D.,Carroll,R.J.和Dabney,A.R.(2012年)。生存分析法在LC-MS蛋白质组学定量分析中的应用。生物信息28 1998-2003。
[29] Thompson,A.,Schäfer,J.,Kuhn,K.,Kienle,S.,Schwarz,J.,Schmidt,G.,Neumann,T.和Hamon,C.(2003年)。串联质谱标记:一种新的定量策略,用于复杂蛋白质混合物的MS/MS.Anal比较分析。化学。75 1895年至1904年。
[30] Troyanskaya,O.,Cantor,M.,Sherlock,G.,Brown,P.,Hastie,T.,Tibshirani,R.,Botstein,D.和Altman,R.B.(2001年)。DNA微阵列缺失值估计方法。生物信息学17 520–525。
[31] 韦伯·罗伯逊,B.J.M.,Wiberg,H.K.,Matzke,M.M.,Brown,J.N.,Wang,J.J.,McDermott,J.E.,Smith,R.D.,Rodland,K.D.,Metz,T.O.,Pounds,J.G.和Waters,K.M.(2015年)。以蛋白质组学为基础的全球蛋白质组学评价和缺失值的讨论。J、 蛋白质组研究14 1993-2001。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。