×

捕食图中蛋白质复合体估计的节点抽样。 (英语) Zbl 1329.92047号

摘要:在细胞生物学中,节点边缘图或“网络”数据收集通常使用联合免疫沉淀(CoIP)等诱饵-猎物技术。诱饵-猎物技术检测蛋白质对之间的关系或“相互作用”,CoIP专门测量蛋白质复合体的共员性。CoIP数据的分析通常侧重于估计蛋白质复合体的成员。由于预算和其他限制,使用CoIP对整个网络进行详尽分析并不总是可能的。当蛋白质复合物估计是主要目标时,我们描述了分层抽样方案来选择CoIP实验的诱饵。在经典框架(节点表示蛋白质,边表示成对交互)的基础上,我们将广义节点定义为集合外具有相同邻接关系的相邻节点集,并将其用作选择下一组诱饵的层。在每一轮采样时都会重新定义地层,以纳入累积的数据。该方案保持了蛋白质复合物估算的用户特定质量阈值,与简单随机抽样相比,每轮抽样中正确估算的复合物数量显著增加。R包seqSample包含所有源代码,可在http://vault.northwestern.edu/~dms877/R包/.

MSC公司:

92C40型 生物化学、分子生物学
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altaf-Ul-Amin,M.、Y.Shinbo、K.Mihara、K.Kurokawa和S.Kanaya(2006年):“大型交互网络中检测蛋白质复合物的算法的开发和实现”,BMC生物信息学,第7207页。;
[2] Aryee,M.J.A.和J.Quackenbush(2008):“交互组映射的优化预测策略”,《国家生物技术》。,20, 991-997.;
[3] Bader,G.D.和C.W.Hogue(2002):“分析从不同来源获得的酵母蛋白质相互作用数据”,《国家生物技术》。,20, 991-997.;
[4] Bader,G.D.和C.W.Hogue(2003):“在大型蛋白质相互作用网络中发现分子复合物的自动化方法”,BMC生物信息学,4,2。;
[5] Casey,F.P.,G.Cagney,N.J.Krogan和D.C.Shields(2008):“两两功能交互研究的最佳逐步实验设计”,生物信息学,24,2733-2739。;
[6] Chiang,T.C.和D.Scholtens(2009):“使用R和Bioconductor对蛋白质相互作用数据进行质量和统计评估的一般管线”,《自然协议》。,4, 535-546.;
[7] Chiang,T.C.,D.Scholtens,D.Sarkar,R.Gentleman和W.Huber(2007):“通过定向图分析的蛋白质相互作用数据的覆盖率和误差模型”,《基因组生物学》。,8,R186。;
[8] Damaschke,P.(2011):“通过随机邻域查询在稀疏图中寻找隐藏的中心和支配集”,《网络》,57344-350·Zbl 1223.05208号
[9] Enright,A.J.、S.Van Dongen和C.A.Ouzounis(2002):“大规模检测蛋白质家族的有效算法”,Nuc。《酸类研究》,第30期,第1575-1584页。;
[10] 尤因、R.M.、P.楚、F.埃利斯玛、H.李、P.泰勒、S.克莱米、L.麦克劳姆-卡拉杰夫斯基、M.D.罗宾逊、L.奥康纳、M.李、R.泰勒、M.达西、Y.何、A.海尔布特、L.摩尔、S.张、O.奥纳茨基、Y.V.布克曼、M.埃塞尔、Y.盛、J.瓦西列斯库、M.阿布法哈、J.P.兰伯特、H.S.杜维尔、I.斯图尔特、B.库尔、K.霍格、K.科尔威尔、K.格拉德威什,B.Muskat、R.Kinach、S.L.Adams、M.F.Moran、G.B.Morin、T.Topalogou和D.Figeys。(2007):“通过质谱法对人类蛋白质-蛋白质相互作用进行大规模绘图”,分子系统。生物学,3,89。;
[11] Freidel,C.C.、J.Krumsiek和R.Zimmer(2009年):“启动相互作用组:酵母中蛋白质复合物的无监督鉴定”,J.Comp。生物学,16971-987。;
[12] 加文、A.C.、M.伯歇、R.克劳斯、P.格兰迪、M.马齐奥赫、A.鲍尔、J.舒尔茨、J.M.里克、A.M.米雄、M.克鲁西亚特、C M amd雷莫、C.Höfert、M.舍尔德、M.布拉杰诺维奇、H.鲁夫纳、A.梅里诺、K.克莱因、M.哈达克、D.迪克森、T.鲁迪、V.格诺、A.鲍奇、S.巴斯塔克、B.胡斯、C.勒特温、M.A.海特尔、R.科普利、A.埃德尔曼、E.奎尔夫特,V.Rybin、G.Drewes、M.Raida、T.Bouwmeester、P.Bork、B.Seraphin、B.Kuster、G.Neubauer和G.Superti Furga。(2002):“通过蛋白质复合物的系统分析对酵母蛋白质组的功能组织”,《自然》,415141-147。;
[13] 加文,A.C.,P.阿洛伊,P.格兰迪,R.克劳斯,M.博埃西,M.马齐奥赫,C.劳,L.J.詹森,S.巴斯塔克,B.邓普菲尔德,A.埃德尔曼,M.A.海特尔,V.霍夫曼,C.霍弗特,K.克莱因,M.哈达克,A.M.米孔,M.舍尔德,M.席尔,M.雷莫,T.鲁迪,S.胡珀,A.鲍尔,T.布韦斯特,G.卡萨里,G.德雷维斯,G.纽鲍尔,J.M.里克,B.库斯特,P。Bork,R.B.Russell和G.Superti-Furga(2006):“蛋白质组调查揭示了酵母细胞机械的模块性”,《自然》,440,631-636。;
[14] Geva,G.和R.Sharan(2011):“从联合免疫沉淀数据中识别蛋白质复合物”,生物信息学,27,111-117。;
[15] Goodman,L.A.(1961):《雪球取样》,《数学年鉴》。《统计》,第32卷,第148-170页·Zbl 0099.14203号
[16] Güldener,U.、M.Munsterkötter、G.Kastenmiller、N.Strack、J.van Helden、C.Lemer、J.Richelles、S.J.Wodak、J.García-Martínez、J.E.Pérez-Ortin、H.Michael、a.Kaps、E.Talla、B.Andre、J.L.Souciet、J.De Montigny、E.Bon、C.Gaillardin和H.W.Mewes(2005):“CYGD:综合酵母基因组数据库”,Nuc。《酸类研究》,33,D362-C368。;
[17] Han,J.D.,D.Dupuy,N.Bertin,M.E.Cusick和M.Vidal(2005):“取样对蛋白质相互作用网络拓扑预测的影响”,《国家生物技术》。,23, 839-844.;
[18] Handcock,M.S.和K.J.Gile(2010):“根据采样数据对社交网络进行建模”,Ann.Appl。统计,4,5-25·Zbl 1189.62187号
[19] Kavvadias,D.J.和E.C.Stavropoulos(2005):“生成横向超图的有效算法”,《图形算法》。申请。,9, 239-264.; ·Zbl 1088.05069号
[20] Kikugawa,S.,K.Nishikata,K.Murakami,Y.Sato,M.Suzuki,M.Altaf-Ul-Amin,S.Kanaya和T.Imanishi(2012):“PCDq:人类蛋白质复合物数据库,其质量指数总结了从h-invitation蛋白质相互作用综合数据集预测的蛋白质复合物的不同水平证据”,BMC系统。生物,6补充2,S7。;
[21] Krogan,N.J.,M.H.Lam,J.Fillingham,M.C.Keogh,M.Gebbia,J.Li,N.Datta,G.Cagney,S.Buratowski,A.Emili和J.F.Greenblatt(2004):“蛋白酶体参与DNA双链断裂修复”,《分子细胞》,第16期,第1027-1034页。;
[22] Krogan,N.J.,G.Cagney,H.Yu,G.Zhong,X.Guo,A.Ignatchenko,J.Li,S.Pu,N.Datta,A.P.Tikusis,T.Punna,J.M.Peregrin-Alvarez,M.Shales,X.Zhang,M.Davey,M.D.Robinson,A.Paccanaro,J.E.Bray,A.Sheung,B.Beattie,D.P.Richards,V.Canadien,A.Lalev,F.Mena,P.Wong,A.Starostine,M.Canete,J.Vlasbom,S.Wu,C.Orsi,S.R.Collins、S.Chandran、R.Haw、J.J.Rilstone、K.Gandi、N.J.Thompson、G.Musso、P.St Onge、S.Ghanny、M.H.Lam、G.Butland、A.M.Altaf-Ul、S.Kanaya、A.Shilatifard、E.O'Shea、J.S.Weissman、C.J.Ingles、T.R.Hughes、J.Parkinson、M.Gerstein、S.J.Wodak、A.Emili和J.F.Greenblatt。(2006):《酿酒酵母中蛋白质复合物的全球景观》,《自然》,440637-643。;
[23] Lappe,M.和L.Holm(2004):“以接近最佳效率解开蛋白质相互作用网络”,《国家生物技术》。,22, 98-103.;
[24] Macropol,K.,T.Can和A.K.Singh(2009):“Rrw:在基因组规模的蛋白质网络上重复随机行走以发现局部集群”,BMC生物信息学,10283。;
[25] Pu,S.,J.Wong,B.Turner,E.Cho和S.J.Wodak(2009):“酵母蛋白复合物的最新目录”,Nuc。酸研究,37825-831。;
[26] Royer,L.,M.Reimann,A.F.Stewart和M.Schroeder(2012):“网络压缩作为蛋白质相互作用网络的质量度量”,PLOS One,7,e35729。;
[27] Ruepp,A.、B.Brauner、I.Dunger-Kaltenbach、G.Frishman、C.Montrone、M.Stransky、B.Waegele、T.Schmidt、O.N.Doudieu、V.Stümpflen和H.W.Mewes(2008):“珊瑚:哺乳动物蛋白质复合物的综合资源”,Nuc。《酸类研究》,36,D646-D650。;
[28] Saha,S.,P.Kaur和R.M.Ewing(2010):“诱饵相容性指数:相互作用蛋白质组学实验的计算诱饵选择”,《蛋白质组研究杂志》,第9期,第4972-4981页。;
[29] Scholtens,D.、M.Vidal和R.Gentleman(2005):“全球交互组网络的本地建模”,生物信息学,21,3548-3557。;
[30] Schwartz,A.S.、J.Yu、K.R.Gardenour、R.Finley Jr和T.Ideker(2009):“完成交互组的成本效益策略”,《自然方法》,第655-61页。;
[31] 基因本体联盟(2000):“基因本体:生物学统一的工具”,《自然遗传学》。,25, 25-29.;
[32] Wasserman,S.和K.Faust(1997):《社会网络分析》,纽约:剑桥大学出版社·Zbl 0926.91066号
[33] Xie,Z.,C.K.Kwoh,X.-L.L Li和M.Wu(2011):“从ap-ms数据构建用于蛋白质复合物预测的共复合物得分矩阵”,生物信息学,27,i159-i166。;
[34] Zhang,B.,B.-H.Park,T.Karpinets和N.F.Samatova(2008):“从下拉数据到具有生物相关性的蛋白质相互作用网络和复合物”,生物信息学,24979-986。;
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。