×

分段主成分分析-肽QSAR研究的回归方法。 (英语) Zbl 1397.92193号

摘要:作为定量构效关系(QSAR)的一种新方法,我们采用分段主成分分析和回归来定义新的氨基酸指数。首先将描述符分为不同的组(基于它们所拥有的信息内容的相似性),然后分别对每组进行主成分分析(PCA)。从每组描述子数据矩阵中提取的主成分(PC)可以被视为氨基酸指数的新来源。这些指标被用作两个二肽数据集(58个血管紧张素转换酶(ACE)抑制剂活性和48个苦味阈值(BTT)活性)的QSAR研究的输入变量。利用分段主成分回归(SPCR)和分段偏最小二乘(SPLS)方法实现了指标与生物活性之间的建模。这两种方法都产生了可靠的QSAR模型。与传统的主成分回归(PCR)和偏最小二乘(PLS)相比,分段回归得到了更多的预测模型。此外,对于相同的数据集,所开发的模型相对于先前报道的模型表现出更好的性能。可以得出这样的结论:通过对变量进行分割,将信息划分为信息部分和冗余部分,可以丢弃变量的冗余部分,从而获得更合适的模型。

MSC公司:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
62页第10页 统计学在生物学和医学中的应用;元分析
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bellmann-Sickert,K。;Beck-Sickinger,A.G.,靶向G蛋白偶联受体的肽类药物趋势-药理学,《科学》,31,434-441,(2010)
[2] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性。蛋白质:结构、功能和遗传学(勘误表:同上,44(2001)60)43(2001)246-255。;Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性。蛋白质:结构、功能和遗传学(勘误表:同上,44(2001)60)43(2001)246-255。
[3] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),理论。生物学,273236-247,(2011)·Zbl 1405.92212号
[4] 周,K.C。;Shen,H.B。;周,K.C。;Shen,H.B.,Cell-ploc:一个用于预测各种生物体内蛋白质亚细胞定位的网络服务器包(更新版本:Cell-ploc 2.0:一个改进的网络服务器软件包,用于预测各种有机体中蛋白质的亚细胞定位,Nat.sci.,Nat.protoc.,3,153-162,(2008)
[5] 周,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。微生物。,30, 275-349, (1995)
[6] 周,K.C。;吴振聪。;Xiao,X。;iLoc-Euk,A.,预测单复合体和多复合体真核蛋白亚细胞定位的多标签分类器,Plos one,6,e18258,(2011)
[7] De Benedetti,P.G。;Fanelli,F.,机械QSAR中的计算量子化学和自适应配体建模,今日药物发现,15,859-866,(2010)
[8] Dea-Ayuela,文学硕士。;佩雷兹·卡斯蒂略,Y。;Meneses-Marcel,A。;乌贝拉,F.M。;Bolas-Fernandez,F。;周,K.C。;Gonzalez-Diaz,H.,动力蛋白的HP-晶格QSAR:实验蛋白质组学(2D-电泳,质谱)和婴儿利什曼原虫序列的理论研究,生物有机化学。,16770-7776,(2008年)
[9] Deeb,O。;Hemmateenejad,B.,药物与人血清白蛋白结合的ANN-QSAR模型,化学。生物药品说明书。,70, 19-29, (2007)
[10] Doytchinova,I.A。;沃尔什,V。;借方,P。;Flower,D.R.,《走向肽-HLA-A 0201结合亲和力的化学计量学分离:局部和全局QSAR模型的比较》,J.comput-辅助模具。,19, 203-212, (2005)
[11] 杜氏。,Q.S。;梅西,P.G。;Chou,K.C.,启发式分子亲脂性势(HMLP):吡唑及其衍生物分子家族LADH的2D-QSAR研究,J.comput。化学。,26, 461-470, (2005)
[12] 杜氏。,Q.S。;黄,R.B。;魏玉涛。;杜立群。;Chou,K.C.,多场三维定量结构-活性关系(MF-3D-QSAR),J.comput。化学。,29, 211-219, (2008)
[13] 杜氏。,Q.S。;黄。,钢筋混凝土。;周。,K.C.,《综述:QSAR及其在预测药物设计中化学分子、肽和蛋白质活性方面的应用的最新进展》,Curr。保护。佩普。科学。,9, 248-259, (2008)
[14] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,利用Chou伪氨基酸组成的概念预测人乳头瘤病毒的风险类型,J.理论。生物学,263203-209,(2010)·Zbl 1406.92455号
[15] Fjell,C.D。;汉考克,R.E.W。;Jenssen,H.,抗微生物肽的计算机辅助设计,Curr。法医肛门。,6, 66-75, (2010)
[16] Golbraikh,A。;Tropsha,A.,小心q2!,J.mol.图形模型。,20, 269-276, (2002)
[17] Hemmatee Nejad,B。;Elyasi,M.,《分段主成分分析-定量结构回归方法-活性关系建模》,Ana。烟囱。《学报》,646,30-38,(2009)
[18] Hemmatee Nejad,B。;Karimi,S.,使用无监督分段主成分回归构建稳定的多元校正模型,J.chemom。,25, 139-150, (2011)
[19] Hemmatee Nejad,B。;Sanchooli,M.,《快速QSAR/QSPR的取代电子描述符》,J.chemom。,21, 96-107, (2007)
[20] Hemmateenejad,B..大麻。;米里·R。;Edraki,N。;Khoshneviszadeh,M。;Shafiee,A.,一些4,5-二氯咪唑-1,4-DHP-基钙通道阻滞剂的分子建模和QSAR分析,J.伊朗。化学。《社会学杂志》,第4期,第182-193页,(2007年)
[21] Hemmatee Nejad,B。;Yousefinejad,S。;Mehdipour,A.R.,基于量子拓扑分子相似性的新型氨基酸指数及其在肽QSAR研究中的应用,氨基酸,401169-1183,(2011)
[22] Hu,L.L。;黄,T。;蔡,Y.D。;Chou,K.C.,基于蛋白质相互作用网络的蛋白质分泌入体液预测,Plos one,6,e22989,(2011)
[23] 黄,R.B。;杜,Q.S。;魏玉涛。;庞,Z.W。;魏,H。;Chou,K.C.,预测肽和蛋白质生物活性的物理和化学驱动人工神经网络及其设计,J.theor。生物,256428-435,(2009)·Zbl 1400.92188号
[24] 黄,T。;Chen,L。;蔡,Y.D。;Chou,K.C.,利用图形特性、生物化学和物理化学特性以及功能特性对调控途径进行分类和分析,Plos one,6,e25297,(2011)
[25] Jenssen,H.,抗菌肽描述符,专家意见。药物发现,6171-184,(2011)
[26] Jokela,J。;赫芬达尔,L。;Wahlsten,M。;Permi,P。;塞尔海姆,F。;瓦康塞洛斯,V。;Doskeland,S.O.公司。;Sivonen,K.,《一种新型蓝细菌鼻环肽是一种有效的抗微囊藻毒素的抗毒素》,《化学生物化学》,11,1594-1599,(2010)
[27] Kandaswamy,K.K。;周,K.C。;马丁内茨,T。;莫勒,S。;Suganthan,P.N。;Sridharan,S。;Pugalenthi,G.,AFP-pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.theor。生物,270,56-62,(2011)
[28] 川岛,S。;Pokarowski,P。;波卡罗夫斯卡,M。;科林斯基,A。;Katayama,T。;Kanehisa,M.,Aaindex:氨基酸指数数据库,进展报告,核酸研究,36,2008,D202-D205,(2008)
[29] 纳普,D。;Piantavigna,S。;Hansen,A。;Mechler,A。;比纳斯,A。;诺尔特,O。;马丁,L.L。;Hoffmann,R.,Oncocin(VDKPPYLPRPPRRIYNR-NH2):一种针对革兰氏阴性人类病原体优化的新型抗菌肽,医学化学杂志。,53, 5240-5247, (2010)
[30] 李,Y。;魏德清。;高,W.N。;高,H。;刘,B.N。;黄,C.J。;Xu,W.R。;Liu,D.K。;陈,H.F。;Chou,K.C.,作为抗菌剂的恶唑烷酮药物设计的计算方法,医药化学。,3, 576-582, (2007)
[31] 梁国忠。;周,P。;周,Y。;张,Q.X。;Li,Z.L.,氨基酸新描述符及其在肽定量结构-活性关系中的应用,化学学报。辛尼卡,64,393-396,(2006)
[32] 梁国忠。;Yang,L。;陈,Z.C。;梅,H。;舒,M。;Li,Z.L.,一组用于预测MHC I类结合肽的新氨基酸描述符,《欧洲医学杂志》。,44, 1144-1154, (2009)
[33] 林,Z.H。;长,H.X。;波,Z。;王勇强。;Wu,Y.Z.,氨基酸新描述符及其在肽QSAR研究中的应用,肽,291798-1805,(2008)
[34] 刘,S.S。;尹,C.S。;Cai,S.X。;Li,Z.L.,用于二肽QSAR研究的新型MHDV描述符,J.chin。化学。社会科学委员会,48253-260,(2001)
[35] 马吉奥拉,G.M。;Zhang,C.T.,K.C.C,D.W.elrod,《定量构效关系和药物设计中的神经网络》,()
[36] Malinowski,E.R.,《化学中的因子分析》(2002),威利纽约·Zbl 0825.62520号
[37] Malinowski,E.R.,《通过增加来确定等级》(DRAUG,J.chemom.,25,323-328,(2011)
[38] Mason,J.M.,作为治疗干预拮抗剂的肽和肽模拟物的设计和开发,未来医学化学。,2, 1813-1822, (2010)
[39] Mauri,A。;巴拉比奥,D。;Consonni,V。;马纳加纳罗,A。;Todeschini,R.,使用基于分子描述符的方法进行肽多元表征,MATCH common。数学。计算。化学。,60, 671-690, (2008) ·Zbl 1189.92034号
[40] 梅,H。;Liao,Z.H。;周,Y。;Li,S.Z.,一组新的氨基酸描述符及其在肽qsars中的应用,生物聚合物,80,775-786,(2005)
[41] 莫哈巴特卡尔,H。;穆罕默德·贝吉,M。;Esmaeili,A.,使用Chou的伪氨基酸组成和支持向量机概念预测GABA(A)受体蛋白,J.theor。生物学,281,18-23,(2011)·兹比尔1397.92215
[42] 莫罗·G。;博纳蒂,L。;布鲁西,M。;美国科森蒂诺。;De Gioia,L。;宾夕法尼亚州范图奇。;潘迪尼,A。;Papaleo,E。;Pitea,D。;萨拉西诺,G.A.A。;Zampella,G.,《阐明生物过程中分子机制的计算方法》,Theor。化学。根据,117723-741,(2007)
[43] 罗伊·P。;Roy,K.,关于偏最小二乘回归模型变量选择的某些方面,QSAR梳。科学。,27, 302-313, (2008)
[44] 田,F.F。;周,P。;Lv,F.L。;宋,R。;Li,Z.L.,原子相互作用场的三维全息矢量(3D-hovaif):一种新的旋转平移不变量三维结构描述符及其在肽中的应用,J.pept。科学。,13, 549-566, (2007)
[45] Tong,J。;刘,S。;周,P。;吴,B。;Li,Z.,氨基酸的新描述符及其在肽QSAR中的应用,J.theor。生物学,25390-97,(2008)
[46] Tropsha,A。;格拉马提亚,P。;Gombar,V.K.,认真的重要性:验证是成功应用和解释QSPR模型的绝对必要条件,QSAR梳。科学。,22, 69-77, (2003)
[47] Y.Tyunina。;Badelin,V.G.,用于评估肽的物理化学参数和生物活性的氨基酸分子描述符,Russ.J.bioorg.chem。,35, 453-460, (2009)
[48] 乌马桑卡拉,M。;麦克法登,K。;Zentner,I。;Schon,A。;拉贾戈帕尔,S。;Tuzer,F.等人。;Kuriakose,S.A。;康塔里诺,M。;拉隆德,J。;弗雷尔,E。;Chaiken,I.,HIV-1 gp120三唑肽双重拮抗剂的活性核心,Chemmedchem,51871-1879,(2010)
[49] Yu,L。;郭毅。;李,Y。;李·G。;李,M。;罗,J。;熊,W。;Qin,W.,Secretp:通过将新特征融合到Chou的伪氨基酸成分中来识别细菌分泌的蛋白质,J.theor。生物学,267,1-6,(2010)·Zbl 1410.92040号
[50] Zakeri,P。;Moshiri,B。;Sadeghi,M.,基于序列各种特征的数据融合预测蛋白质亚线粒体位置,J.theor。生物学,269208-216,(2011)·Zbl 1307.92094号
[51] 周,P。;周,Y。;吴,S.R。;李,B。;田,F.F。;Li,Z.L.,基于原子相互作用场三维矢量的氨基酸新描述符,Chin。科学。公牛。,51, 524-529, (2006)
[52] X.A.周。;李,Z.C。;戴,Z。;Zou,X.Y.,通过将支持向量机与粒子群优化算法和遗传算法相结合对肽生物活性进行QSAR建模,J.mol.graphics modell。,29, 188-196, (2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。