×

兹马思-数学第一资源

从蛋白质相互作用预测的角度研究蛋白质序列中的询问噪声。(英语) Zbl 1397.92544号
摘要:在过去的几十年里,人们对蛋白质之间的关系进行了广泛的研究。特别是,基于序列的蛋白质-蛋白质相互作用(PPIs)预测对于加快生物体相互作用体的绘制过程至关重要。高通量的实验方法使许多模型有机体的PPIs成为已知的,这使得我们可以应用机器学习方法从现有的ppi中学习可理解的规则。在机器学习框架下,组合向量通常被用来编码蛋白质作为真值向量。然而,组成向量值可能与氨基酸的分布高度相关,即自然界中经常观察到的氨基酸往往具有较大的组成向量值。因此,在表示过程中可能需要估计由氨基酸背景分布引起的噪声的公式。在这里,我们介绍了两种去噪合成向量,并成功地应用于系统发育树的构建,以消除噪声。在上验证这两个去噪合成向量时大肠杆菌(E、 大肠杆菌),酿酒酵母(S、 酿酒)而人类PPIs数据集的预测性能却没有得到改善,甚至比未去噪预测还要糟糕。这些结果表明,系统发育树构建过程中的噪声可能是PPIs预测中有价值的信息。
理学硕士:
92D20 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Arango Argoty,G.A.,Jaramillo Garzón,J.A.,Röthlisberger S.,Castellanos Dominguez,C.G.,2011年。基于可变长基序检测和差异分类的蛋白质亚细胞定位预测。会议记录:医学与生物学会IEEE工程,第945-948页。
[2] Ben Hur,A.,预测蛋白质-蛋白质相互作用的核心方法,生物信息学,21,i38-i46,(2005)
[3] Ben Hur,A.;Noble,W.S.,为预测蛋白质-蛋白质相互作用选择负面例子,BMC bioinf.,7,增刊。1,S2,(2006年)
[4] Bock,J.R.;Gough,D.A.,从一级结构预测蛋白质-蛋白质相互作用,生物信息学,17455-460,(2001)
[5] Chan,R.H.F.,Wang,R.W.,Wong,J.C.F.,2010年。最大熵法为合成向量法。在线发布:2010年12月23日http://dx.doi.org/10.1002/9780470892107.ch27。
[6] Chang,C.-C.;Lin,C.-J.,Libsvma支持向量机库,ACM trans。因特尔。系统。技术,2:27,1-27,(2011年)
[7] Chou,K.C.;Zhang,C.T.,回顾蛋白质结构类预测,Crit。版次。生物化学。《分子生物学》,30275-349,(1995年)
[8] 周,K.C.,用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。遗传学,43246-255,(2001)
[9] 周国庆,蛋白质属性预测与伪氨基酸组成之探讨(五十周年回顾),理论与实务。《生物学》,273236-247,(2011年)·邮编:140925
[10] Chou,K.C.;Cai,Y.D.,使用功能域组成和支持向量机预测蛋白质亚细胞位置,生物学杂志。《化学》,27745765-45769,(2002年)
[11] Chou,K.C.;Cai,Y.D.,gocfundcpseaa预测因子预测蛋白质亚细胞位置,生物化学。生物物理。公社,3201236-1239,(2004)
[12] Chou,K.C.;Cai,Y.D.,从杂交空间中的序列预测蛋白质-蛋白质相互作用,J.prot。第5316-322号决议,(2006年)
[13] 周,K.C.;Shen,H.B.,通过融合优化证据预测真核蛋白质亚细胞位置:理论K-最近邻分类器,J.prot。第51888-1897号决议(2006年)
[14] Chou,K.C.;Shen,H.B.,《用于预测各种生物体中蛋白质亚细胞定位的web服务器的细胞ploca包》(更新版本:Cell ploc 2.0:用于预测各种生物体中蛋白质亚细胞定位的改进web服务器包),自然科学,2010,2,1090-1103),自然保护,3,153-162,(2008)
[15] Chou,K.C.;Shen,H.B.,Reviewre advances in developing webserver for predictive protein attributes,Natural sci.,2,63-92,(2009年),(可在\(\langle\)http://www.scirp.org/journal/NS/〉)
[16] Chou,K.C.;Shen,H.B.,用单位点和多位点预测真核生物蛋白质亚细胞定位的新方法Euk mploc 2.0,Plos one,5,e9931,(2010)
[17] Chou,K.C.;Shen,H.B.,《增强植物蛋白质亚细胞定位预测能力的植物mploca自上而下策略》,Plos one,5,e11335,(2010)
[18] Chou,K.C.;Wu,Z.C.;Xiao,X.,Iloc-euka多标记分类器,用于预测单丛和多重真核蛋白质的亚细胞定位,Plos one,6,e18258,(2011)
[十九] Chou,K.C.;Wu,Z.C.;Xiao,X.,Iloc hum:使用累积标记量表预测人类蛋白质的单位点和多位点的亚细胞位置,Mol.biosyst.,8,2,629-641,(2012)
[20] Deng,L.;Guan,J.H.;Dong,Q.W.;Zhou,S.G.,Semihsan迭代半监督方法预测蛋白质-蛋白质相互作用热点,蛋白质pept。利特,18896-905,(2011年)
[21] 邓,N.Y.;Tian,Y.J.;Zhang,C.H.,支持向量机理论,算法和扩展,(2012),科学出版社北京
[22] Dijk,A.;Bosch,D.;Braak,C.;Krol,A.;Ham,R.,《预测II型膜蛋白的亚高尔基化》,生物信息学,24,16,(2008)
[23] Esmaeili,M.;Mohabatkar,H.;Mohsenzadeh,S.,《使用周氏伪氨基酸组成概念预测人乳头状瘤病毒的风险类型》,J.theoret。生物学,263203-209,(2010年)·Zbl 1406.92455
[24] Fields,S.;Song,O.,《检测蛋白质-蛋白质相互作用的新遗传系统》,自然,340,245-246,(1989)
[25] Gavin,A.C.;Boche,M.;Krause,R.;Grandi,P.;Marzioch,M.;Bauer,A.;Schultz,J.;Rick,J.;Michon,A.;Cricat,C.《通过蛋白质复合物的系统分析对酵母蛋白质组的功能组织》,自然,415141-147,(2002)
[26] Georgiou,D.N.;Karakasidis,T.E.;Nieto,J.J.;Torres,A.《利用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.theoret。生物,257,17-26,(2009)·Zbl 1400.92393
[27] Gomez,S.M.;Noble,W.S.;Rzhetsky,A.,学习从蛋白质序列预测蛋白质-蛋白质相互作用,生物信息学,191875-1881,(2003)
[28] Gribskov,M.;Robinson,N.L.,使用接收器工作特性(ROC)分析评估序列匹配,计算。《化学》,20,25-33,(1996年)
[29] Hao,B.L.;Qi,J.;Wang,B.,《基于无序列比对的完整基因组的原核系统发育》,国防部。物理。利特。B、 2,1-4,(2003年)·Zbl 1114.92309
[30] 而何为,Y.;Gruhler,A.;Heilbut,A.;Bader,G.D.;Moore,L.;Adams,S.;Millar,A.;Taylor,P.;Bennett,K.;Boultiler,K.;杨阳,L.;Wolting,C.;Donaldson,I.;Schandorrff,S.;谢wnarane,J.;Vo,M.;Tagart,J.;GodReault,M.;Muskat,B.;Alfarano,C.;杜瓦,D.;琳,Z.;michalickiova,K.;Wilems,A.R.;Sassi,H.;Nielsen,P.A.A.A.A.;LaK.J。;Andersen,J.R.;Johansen,L.E.;Hansen,L.H.;Jespersen,H.;Podtelejnikov,A.;Nielsen,E.;Crawford,J.;Poulsen,V.;Sørensen,B.D.;Matthiesen,J.;Hendrickson,R.C.;Gleeson,F.;Pawson,T.;Moran,M.F.;Durocher,D.;Mann,M.;Hogue,C.W.;Figeys,D.;Tyers,M.《蛋白质复合物的系统识别》酿酒酵母质谱法,自然,415180-183,(2002)
[31] Hoglund,A.;Donnes,P.;Blum,T.;Adolph,H.;Kohlbacher,O.《使用N端靶向序列、序列基序和氨基酸组成对蛋白质亚细胞定位的多定位预测》,生物信息学,22,10,1158-1165,(2006年)
[32] Hu,L.;Huang,T.;Shi,X.;Lu,W.C.;Cai,Y.D.;Chou,K.C.,基于加权蛋白质-蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质的功能,Plos one,6,e14556,(2011)
[33] Ito,T.;Chiba,T.;Ozawa,R.;Yoshida,M.;Hattori,M.;Sakaki,Y.《探索酵母蛋白质相互作用组分的综合双杂交分析》。自然。阿卡德。科学,984569-4574,(2001)
[34] Jiang,M.;Anderson,J.;Gillespie,J.;Mayne,M.,Ushufflea有用的工具,用于在保存k-let计数的同时洗牌生物序列,BMC bioinf.,9192,(2008)
[35] Leslie,C.,Eskin,E.,Noble,W.S.,2002年。光谱核:支持向量机蛋白质分类的字符串核。太平洋生物计算研讨会。太平洋生物计算研讨会,第564-575页。
[36] Ma,D.C.;Diao,Y.B.;Guo,Y.Z.;Li,Y.Z.;Zhang,Y.Q.;Wu,J.;Li,M.L.,一种基于蛋白质-蛋白质相互作用网络和蛋白质序列信息预测蛋白质-蛋白质相互作用的新方法,蛋白质pept。利特,18906-911,(2011年)
[37] Mak,M.;Guo,J.;Kung,S.,基于局部成对轮廓比对和SVM的成对蛋白质亚细胞定位和SVM,IEEE/ACM trans。计算机。生物。生物信息,5,3,416-422,(2008年)
[38] Mei,S.;Wang,Fei,蛋白质亚核定位的基于氨基酸分类的光谱核融合,BMC bioinf.,11,Suppl 1,S17,(2010)
[39] Mohabatkar,H.,《利用周氏伪氨基酸组成预测细胞周期蛋白蛋白质》,蛋白质pept。lett.,171207-1214,(2010年)
[40] Mohabatkar,H.;Mohammad Beigi,M.;Esmaeili,A.《使用周氏伪氨基酸组成和支持向量机概念预测GABA(A)受体蛋白质》,J.theoret。生物学,281,18-23,(2011年)·Zbl 1397.92215
[41] Najafabadi,H.;Salavati,R.,《通过密码子使用对蛋白质相互作用的基于序列的预测》,基因组生物学,9,R87,(2008)
[42] 诺布尔,W.S.,支持向量机在计算生物学中的应用,(),71-92
[43] Pierleoni,A.;Luigi,P.;Fariselli,P.;Casadio,R.,Bacelloa平衡定位预测,生物信息学,22,14,e408-e416,(2006)
[44] 邱,Z.;Wang,X.,使用基于斑块的残基特征预测蛋白质-蛋白质相互作用位点,J.theoret。生物,293C,143-150,(2012年)·Zbl 1307.92088
[45] Ren,L.H.;Shen,Y.Z.;Ding,Y.S.;Chou,K.C.,蛋白质相互作用网络分析的生物实体网络,亚洲控制杂志,13726-737,(2011)·Zbl 1303.93030
[46] Ren,X.W.;Wang,Y.C.;Wang,Y.;Zhang,X.S.;Deng,N.Y.,通过考虑序列表示的逆问题提高蛋白质-蛋白质相互作用预测的准确性,BMC bioinf.,12409,(2011)
[47] Shen,J.W.;Zhang,J.;Luo,X.M.;Zhu,W.L.;Yu,K.Q.;Chen,K.X.;Li,Y.X.;Jiang,H.L.,仅基于序列信息预测蛋白质-蛋白质相互作用,Proc。自然。阿卡德。科学,1044337-4341,(2007)
[48] Vapnik,V.,《统计学习理论的本质》(1995),Springer纽约·Zbl 0833.62008
[49] Vapnik,V.,《统计学习理论》(1998),威利·Zbl 0935.62007
[50] Wang,P.;Xiao,X.;Chou,K.C.,基于序列衍生特征识别核受体亚家族的NR-2la两级预测因子,Plos one,6,e23505,(2011)
[51] 吴庚,张永元,2003年。非平衡数据集学习的类边界对齐。在:ICML 2003学习不平衡数据集研讨会。
[52] Wu,Z.C.;Xiao,X.;Chou,K.C.,Iloc-gposa多层分类器,用于预测单丛和多重革兰氏阳性细菌蛋白质的亚细胞定位,蛋白质pept。lett.,19,(2011年),DOI:BSP/PPL/E pub/0380[pii]
[53] Xia,J.F.;Han,K.;Huang,D.S.,通过旋转森林和自相关描述符对蛋白质相互作用的序列预测,蛋白质pept。lett.,17,137-145,(2010年)
[54] Xiao,X.;Wu,Z.C.;Chou,K.C.,用于预测革兰氏阴性细菌蛋白质亚细胞定位的多标记分类器,Plos one,6,e20592,(2011)
[55] Yang,J.;Jiang,X.F.,一种基于复杂网络预测阿尔茨海默病相关蛋白-蛋白质相互作用的新方法,蛋白质pept。利特,17356-366,(2010年)
[56] Yu,C.Y.;Chou,L.C.;Chang,D.T.H.,研究文章使用蛋白质的一级结构预测非平衡数据中的蛋白质-蛋白质相互作用,BMC bioinf.,11167,(2010)
[57] Yu,Z.G.;Zhou,L.Q.;Anh,V.;Chu,K.H.;Long,S.C.;Deng,J.Q.,《未经序列比对的全基因组所有蛋白质序列的简单组成方法揭示的原核生物和叶绿体的系统发育》,J.mol.Evoll.,60538-545,(2005)
[58] Park,Yungki,基于序列的蛋白质-蛋白质相互作用预测方法的关键评估,不需要同源蛋白质序列,BMC bioinf.,10419,(2009)
[59] Zhang,Y.N.;Pan,X.Y.;Huang,Y.;Shen,H.B.,《从一级序列预测蛋白质-蛋白质相互作用的自适应压缩学习》,J.theoret。《生物学》,283,44-52,(2011年)·Zbl 1397.92243
[60] Zhou,G.P.,《文祥图中LZCC蛋白残基的处置为蛋白质-蛋白质相互作用机制提供了新的见解”,J.theoret。《生物学》,284142-148,(2011年)·Zbl 1397.92245
[61] Zhu,H.;Bilgin,M.;Bangham,R.;Hall,D.;Casamayor,A.;Bertone,P.;Lan,N.;Jansen,R.;Bidlingmaier,S.;Houfek,T.;Mitchell,T.;Miller,P.;Dean,R.A.;Gerstein,M.;Snyder,M.,《使用蛋白质组芯片对蛋白质活性的全球分析》,Science,1932101-2105,(2001)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。