×

数学ZBZ-数学第一资源

MFSC:采用Chou's PseAAC组分的一般形式进行高尔基蛋白分类的多投票特征选择。(英语) Zbl 1406.92167
摘要:蛋白质亚细胞定位的自动识别在过去的几十年里得到了广泛的应用。亚细胞疾病的诊断在不同的药物开发过程中也是有用的。高尔基体(Golgi)是一种重要的蛋白质类型,它为其它几种蛋白质提供运输途径,目的地是溶酶体、质膜和分泌物等。高尔基蛋白功能失调可能导致不同类型的疾病,尤其是遗传性和神经退行性疾病。
由于高尔基蛋白的重要性,正确鉴定高尔基蛋白是必不可少的。本文提出了一种新的高通量计算模型,可以精确识别高尔基体下蛋白质。采用离散和进化的特征提取方法,可以从蛋白质序列中获取所有显著的、无噪声的和相关的信息。不幸的是,公开的基准数据集是相当不平衡的,跨高尔基序列占整个数据集的72%,反映了偏见、冗余和缺乏假设泛化。在综合数据集的实例数不平衡的情况下,利用少数抽样技术来覆盖不同类数的不平衡。另外,将11种不同的特征选择技术的高阶特征融合,形成一个浓缩的特征空间。通过多数投票算法选择高阶特征,使特征空间减少85%。实验结果表明,结合混合特征空间,kNN分类器取得了很好的效果。在刀形交叉验证中的准确率为98%,独立数据的准确率为94%,10倍交叉验证的准确率为96%。结果表明,所提出的模型是可靠的、一致的,是研究界的一个有价值的工具。
理学硕士:
92C40型 生物化学、分子生物学
92D20 蛋白质序列,DNA序列
68T05型 人工智能中的学习与自适应系统
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 《智能冗余系统的第十一届国际会议记录》(第十一届,国际标准化的系统冗余度准则,第61M-ADS),和《基于最大冗余度的国际电子工程师协会会议记录》(第十一届)
[2] Afridi,T.H.;Khan,A.;Lee,Y.S.,Mito GSAAC:使用遗传集成分类器和分割氨基酸组成进行线粒体预测,氨基酸,421443-1454,(2012)
[3] Akbar,S.;Hayat,M.;Iqbal,M.;Jan,M.A.,iACP GAEnsC:基于进化遗传算法的抗癌肽集成分类,利用杂交特征空间,人工合成。因特尔。2017年,医学院,第70-79页
[4] Altman,D.G.;Bland,J.M.,诊断测试。1: 敏感性和特异性,BMJ:Br。医学。J、 ,3081552,(1994年)
[5] 《核与最近邻非参数回归导论》,美国。Stat.,46175-185,(1992年)
[6] Altschul,S.F.;Madden,T.L.;Schäffer,A.A.;Zhang,J.;Zhang,Z.;Miller,W.;Lipman,D.J.《间隙爆破和PSI-BLAST:新一代蛋白质数据库搜索程序》,核酸研究,253389-3402,(1997)
[7] Araki,E.;Oyadomari,S.;Mori,M.,《内质网应激途径对胰腺β细胞和糖尿病的影响》,实验生物学。医学,2281213-1217,(2003年)
[8] Arif,M.;Hayat,M.;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到Chou的伪氨基酸组成中来识别膜蛋白及其类型的两级模型,J.Theor。Biol,442,11-21,(2018年)·Zbl 1397.92180
[9] Bhasin,M.;Raghava,G.P.,《基于氨基酸组成和二肽组成的核受体分类》,生物学杂志。《化学》,2792326-23266,(2004年)
[10] Bock,J.;Klumperman,J.;Davanger,S.;Scheller,R.,《Syntaxin 6在跨高尔基体网络中的功能囊泡贩运》,分子生物学。细胞,81261-1271,(1997年)
[11] Bradley,P.S.;Mangasarian,O.L.,《通过凹面最小化和支持向量机进行特征选择》,(ICML论文集,98,(1998)),82-90
[12] Brettschneider,J.;Del Tredici,K.;Lee,V.M.-Y.;Trojanowski,J.Q.,《神经退行性疾病中病理学的传播:对人类研究的关注》,Nat。版次。Neurosci.,16,109-120,(2015年)
[13] Cai,D.;Zhang,C.;He,X.,《多聚类数据的无监督特征选择》,(第十六届ACM-SIGGDD国际知识发现与数据挖掘会议论文集》(2010),ACM),333-342
[14] Cai,L.;Huang,T.;Su,J.;Zhang,X.;Chen,W.;Zhang,F.;He,L.;Chou,K.-C.《精神分裂症中新发现的大脑eQTL基因及其相互作用者的意义》,分子疗法。核酸,12433-442,(2018年)
[15] 蔡英德;刘晓杰;徐晓波;周国庆。用支持向量机预测蛋白质结构类别,计算机。《化学》,26293-296,(2002年)
[16] Cao,D.-S.;Xu,Q.-S.;Liang,Y.-Z.,Propy:一个生成周氏PseAAC各种模式的工具,生物信息学,29960-962,(2013)
[17] Chawla,N.V.;Bowyer,K.W.;Hall,L.O.;Kegelmeyer,W.P.,《SMOTE:合成少数民族过采样技术》,J.Artf。因特尔。第16221-357号决议(2002年)·Zbl 0994.68128
[18] Chen,W.;Feng,P.-M.;Lin,H.;Chou,K.-C.,iRSpot PseDNC:识别带有伪二核苷酸成分的重组点,《核酸研究》,41,6,e68,(2013年)
[19] Chen,W.;Tang,H.;Ye,J.;Lin,H.;Chou,K.-C.,iRNA PseU:识别RNA假尿苷位点,分子疗法。核酸,e332,2016年)
[20] Chen,W.;Feng,P.;Ding,H.;Lin,H.;Chou,K.-C.,使用变形能分析基因组中的核小体定位,基因组学,107,69-75,(2016)
[21] Chen,W.;Ding,H.;Feng,P.;Lin,H.;Chou,K.-C.,iACP:识别抗癌肽的基于序列的工具,OnTarget,716895,(2016)
[22] Chen,W.;Ding,H.;Zhou,X.;Lin,H.;Chou,K.-C.,iRNA(m6A)-PseDNC:使用伪二核苷酸组成鉴定N6甲基腺苷位点,分析。生物化学,561,59-65,(2018年)
[23] Chen,W.;Feng,P.;Yang,H.;Ding,H.;Lin,H.;Chou,K.-C.,iRNA AI:识别RNA序列中的腺苷到肌苷编辑位点,OnTarget,84208,(2017)
[24] Chen,W.;Feng,P.;Yang,H.;Ding,H.;Lin,H.;Chou,K.-C.,iRNA-3typeA:识别RNA腺苷位点的三种类型的修饰,分子疗法。核酸,11468-474,(2018年)
[25] Chen,X.-X.;Tang,H.;Li,W.-C.;Wu,H.;Chen,W.;Ding,H.;Lin,H.《通过伪氨基酸组成鉴定细菌细胞壁裂解酶》,BioMed Res.Int.,2016,(2016年)
[26] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc mVirus:通过将最佳GO信息整合到通用PseAAC中,预测多位置病毒蛋白质的亚细胞定位,Gene,628,315-321,(2017)
[27] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc-mPlant:通过将最佳GO信息纳入通用PseAAC,Mol.BioSyst.,131722-1727,(2017),预测多位置植物蛋白质的亚细胞定位
[28] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,1,9,(2017)
[29] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中,预测多标记真核蛋白质的亚细胞定位,基因组学,110,1,50-58,(2017)
[30] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,(2017)
[31] Cheng,X.;Xiao,X.;Chou,K.-C.,pLoc逖bal-mGneg:通过准平衡训练数据集和通用PseAAC,J.Theor预测革兰氏阴性细菌蛋白质的亚细胞定位。生物,458,92-102,(2018年)
[32] Cheng,X.;Zhao,S.-G.;Xiao,X.;Chou,K.-C.,iATC mISF:用于预测解剖治疗化学品类别的多标签分类器,生物信息学,33341-346,(2016)
[33] Cheng,X.;Zhao,S.-G.;Lin,W.-Z.;Xiao,X.;Chou,K.-C.,pLoc mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,333524-3531,(2017)
[34] Cheng,X.;Lin,W.-Z.;Xiao,X.;Chou,K.-C.;Hancock,J.,pLoc逖bal-mAnimal:通过平衡训练数据集和PseAAC预测动物蛋白质的亚细胞定位,生物信息学,(2018)
[35] 周国庆,蛋白质属性预测与伪氨基酸组成之探讨,理论。《生物学》,273236-247,(2011年)·Zbl 1405.92212
[36] 周国强,分子生物系统中多标记属性预测的一些评论,分子生物学,91092-1100,(2013)
[37] 周国庆;张春堂,蛋白质结构类预测,标准。版次。生物化学。《分子生物学》,30275-349,(1995年)
[38] Chou,K.-C.;Cai,Y-D.,一种通过结合基因本体论和生物化学来预测蛋白质亚细胞定位的新杂交方法。生物物理。公社,311743-747,(2003年)
[39] 周国庆;沈海斌,Hum-PLoc:一种用于预测人类蛋白质亚细胞定位的新型集成分类器,生物化学。生物物理。公社,347150-157,(2006)
[40] 周国庆,沈海波,蛋白质亚细胞定位预测的最新进展。生物化学,370,1-16,(2007年)
[41] Chou,K.-C.;Shen,H.-B.,MemType-2L:通过Pse PSSM和Biochem整合进化信息来预测膜蛋白及其类型的网络服务器。生物物理。公共资源,360339-345,(2007年)
[42] 周,K.-C.;Shen,H.-B.,《细胞PLoc:一个用于预测蛋白质在各种生物体中亚细胞定位的网络服务器包》,Nat。协议,3153,(2008年)
[43] 周,K.-C.;Shen,H.-B.,《开发用于预测蛋白质属性的web服务器的最新进展》,Nat。科学,1,63,(2009)
[44] 周国庆;沈海斌,《细胞PLoc 2.0:一种用于预测不同生物体蛋白质亚细胞定位的改进网络服务器包》,发展,1091091,(2010)
[45] Chou,K.-C.;Cheng,X.;Xiao,X.,pLocüu bal-mHum:通过PseAAC和准平衡训练数据集预测人类蛋白质的亚细胞定位,基因组学,(2018)
[46] Chou,K.C.,用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。生物信息,43246-255,(2001)
[47] Culvenor,J.G.;Maher,F.;Evin,G.;Malchiodi‐Albedi,F.;Cappai,R.;Underwood,J.R.;Davis,J.B.;Karran,E.H.;Roberts,G.W.;Beyreuther,K.《神经元细胞中阿尔茨海默病相关的早老素1:定位到内质网-高尔基中间室的证据》,J.Neurosci。第49719-731号决议(1997年)
[48] Day,K.J.;Staehelin,L.A.;Glick,B.S.,高尔基体结构和功能的三阶段模型,组织化学。《细胞生物学》,140239-249,(2013年)
[49] Dehzangi,A.;López,Y.;Lal,S.P.;Taherzadeh,G.;Michaelson,J.;Sattar,A.;Tsunoda,T.;Sharma,A.,PSSM Suc:使用位置特异性评分矩阵精确预测琥珀酰化,用于特征提取,J.Theor。生物学,42597-102,(2017年)·邮编:13802.ZB9201
[50] Ding,H.;Liu,L.;Guo,F.-B.;Huang,J.;Lin,H.,用改进的马氏体判别算法和伪氨基酸组成,蛋白质Pept识别高尔基蛋白类型。Lett.,18,58-63,(2011年)
[51] Ding,H.;Guo,S.-H.;Deng,E.-Z.;Yuan,L.-F.;Guo,F.-B.;Huang,J.;Rao,N.;Chen,W.;Lin,H.《利用特征选择技术预测高尔基体驻留蛋白类型》,Chemomet。因特尔。实验室系统,1249-13,(2013)
[52] Du,P.;Gu,S.;Jiao,Y.,PseAAC General:为大规模蛋白质数据集快速构建周氏伪氨基酸组成的各种通用形式模式,《国际分子科学杂志》,15,3495-3506,(2014)
[53] Du,P.;Wang,X.;Xu,C.;Gao,Y.,PseAAC Builder:一个跨平台的独立程序,用于生成各种特殊的周氏伪氨基酸组成,Anal。生物化学,425117-119,(2012年)
[54] Duda,R.O.;Hart,P.E.;Stork,D.G.,模式分类(2012年),John Wiley&Sons
[55] Ehsan,A.;Mahmood,K.;Khan,Y.D.;Khan,S.A.;Chou,K.-C.《信号肽分类的数学生物学新模型》,Sci。众议员,81039,(2018年)
[56] Fan,G.-L.;Li,Q.-Z.,通过将不同的描述符组合成Chou的伪氨基酸组成的一般形式来预测蛋白质亚软骨的位置,氨基酸,43545-555,(2012)
[57] Farquhar,M.G.;Palade,G.E.,《高尔基装置(复杂)—(1954-1981)——《从人工制品到中心阶段》,细胞生物学杂志,9177s-103s,(1981)
[58] Feng,P.;Ding,H.;Yang,H.;Chen,W.;Lin,H.;Chou,K.-C.,iRNA PseColl:通过将核苷酸的集体效应整合到PseKNC,Mol.Ther.中来识别不同RNA修饰的发生位置。核酸,7155-163,(2017年)
[59] Feng,P.;Yang,H.;Ding,H.;Lin,H.;Chen,W.;Chou,K.-C.,iDNA6mA-PseKNC:通过将核苷酸物理化学性质纳入PseKNC,基因组学,识别DNA N6甲基腺苷位点(2018年)
[60] Fujita,Y.;Okamoto,K.,肌萎缩性侧索硬化症患者和小鼠肌萎缩侧索硬化症模型中运动神经元的高尔基体,神经病理学,25388-394,(2005)
[61] Fujita,Y.;Ohama,E.;Takatama,M.;Al-Sarraj,S.;Okamoto,K.,《帕金森病患者黑质神经元高尔基体的碎片化》,神经病学学报,112,261-265,(2006)
[62] Gonatas,N.;Gonatas,J.O.;Stieber,A.《高尔基体参与肌萎缩性侧索硬化症、阿尔茨海默病和蓖麻毒素中毒发病机制的研究》,组织化学。《细胞生物学》,109591-600,(1998)
[63] Gromiha,M.M.;Suwa,M.,《识别外膜蛋白的简单统计方法》,生物信息学,21961-968,(2005)
[64] Gu,Q.,Li,Z.,和Han,J.,2012年。特征选择的广义fisher评分,UAI'11第二十七届人工智能不确定性会议论文集,第266-273页。
〔65〕 郭,J.X.;Rao,N.N.,二肽组成对蛋白质折叠速率的影响,高级材料研究,反式。技术出版物,378157-160,(2012)
[66] Guyon,I.;Weston,J.;Barnhill,S.;Vapnik,V.《使用支持向量机进行癌症分类的基因选择》,Mach。学习,46389-422,(2002)·Zbl 0998.68111
[67] 霍尔,文学硕士,2000年。离散和数值类机器学习的基于相关的特征选择,第十七届机器学习国际会议论文集,第359-366页。
[68] Hayat,M.;Khan,A.,通过将复合蛋白质序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,10-17,(2011年)·Zbl 1405.92217
[69] Hayat,M.;Khan,A.,MemHyb:通过杂交SAAC和PSSM预测膜蛋白类型,J.Theor。《生物学》,29292993-102,(2012年)·Zbl 1307.92308号
[70] He,X.,Cai,D.和Niyogi,P.,特征选择的拉普拉斯评分,神经信息处理系统进展,2005年,NIPS第18届国际神经信息处理系统会议论文集,第507-514页。
[71] Hu,Z.;Zeng,L.;Xie,L.;Lu,W.;Zhang,J.;Li,T.;Wang,X.《短暂前脑缺血后沙土鼠高尔基体的形态学改变和转化生长因子β1在高尔基体中的亚细胞区隔化》,神经化学。第32期,1927-1931年,(2007年)
[72] Huang,C.;Yuan,J.-Q.,通过三种不同的周氏氨基酸组成模式预测蛋白质亚叶绿体的位置,J.Theor。生物,335,205-212,(2013年)·Zbl 1397.92195
[73] Javed,F.;Hayat,M.,通过将序列特征纳入周的PseAAC,基因组学(2018年),预测多标记蛋白质的亚细胞定位
[74] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质之间的相互作用。生物,377,47-56,(2015年)
[75] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.《通过将物理化学性质和平稳小波变换合并到伪氨基酸组成中来识别蛋白质-蛋白质结合位点》,J.Biomol。结构。戴恩,341946-1961,(2016)
[76] Jia,J.;Zhang,L.;Liu,Z.;Xiao,X.;Chou,K.-C.,pSumo CD:通过将序列耦合效应纳入通用PseAAC,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141,(2016)
[77] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,iPPBS Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集识别蛋白质-蛋白质结合位点,分子,21,95,(2016)
[78] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,iSuc PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Anal。生物化学,497,48-56,(2016年)
[79] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,iCar PseCp:通过蒙特卡罗抽样和将序列耦合效应纳入通用PseAAC,OnTarget,734558,(2016年)确定蛋白质中的羰基化位点
[80] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,pSuc-Lys:用PseAAC和集合随机森林方法预测蛋白质中赖氨酸琥珀酰化位点,J.Theor。生物,394223-230,(2016年)·Zbl 1343.92153
[81] 焦永山;杜培芳,周氏伪氨基酸组成的一般形式预测高尔基体蛋白质类型:最小冗余最大相关特征选择方法,理论与实践。生物学,402,38-44,(2016年)·Zbl 1343.92378
[82] Jiao,Y.-S.;Du,P.-F.,使用伪氨基酸组成预测高尔基体驻留蛋白质类型:位置特异性物理化学性质的方法,J.Theor。生物,391,35-42,(2016年)·Zbl 1343.92154
[83] Kabir,M.;Hayat,M.,iRSpot GAEnsC:通过集成分类器识别重组点,并扩展周氏PseAAC的概念以形成DNA样本,分子遗传学。Genom.,291,285-296,(2016年)
[84] Krishnan,S.M.,使用周的通用PseAAC分析受体相关蛋白(RAP)与蛋白质结构域的各种折叠模式的进化关系,J.Theor。生物学,44562-74,(2018年)
[85] Kumar,M.;Verma,R.;Raghava,G.P.《使用支持向量机和隐马尔可夫模型预测线粒体蛋白质》,J.Biol。《化学》,2815357-5363,(2006年)
[86] Lin,H.;Chen,W.;Ding,H.,《AcalPred:一种基于序列的区分酸性和碱性酶的工具》,PloS One,8,e75726,(2013年)
[87] Ling,C.X.;Li,C.,《直接营销的数据挖掘:问题与解决方案》,《第四届知识发现与数据挖掘国际会议论文集》,98,(1998年),73-79
[88] Liu,B.;Long,R.;Chou,K.-C.,iDHS-EL:通过将三种不同的伪核苷酸组成模式融合到一个集成学习框架中来识别DNA酶I超敏感位点,生物信息学,32,2411-2418,(2016)
[89] Liu,B.;Yang,F.;Chou,K.-C.,2L-piRNA:识别piwi相互作用RNA及其功能的两层集成分类器,分子理论。核酸,7267-277,(2017年)
[90] Liu,B.;Wu,H.;Chou,K.-C.,Pse in One 2.0:一个改进的web服务器包,用于生成DNA、RNA和蛋白质序列的各种模式的伪组件,Nat。Sci,9,67,(2017年)
[91] Liu,B.;Wang,S.;Long,R.;Chou,K.-C.,iRSpot EL:用集成学习方法识别重组点,生物信息学,33,35-41,(2016)
[92] Liu,B.;Yang,F.;Huang,D.-S.;Chou,K.-C.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的两层预测因子,生物信息学,34,33-40,(2017)
[93] Liu,B.;Weng,F.;Huang,D.-S.;Chou,K.-C.,iRO-3wPseKNC:通过基于三个窗口的PseKNC识别DNA复制来源,生物信息学,1,8,(2018)
[94] Liu,B.;Fang,L.;Long,R.;Lan,X.;Chou,K.-C.,iEnhancer-2L:通过伪K-元组核苷酸组成识别增强子及其强度的两层预测因子,生物信息学,32,362-369,(2015)
[95] Liu,B.;Liu,F.;Wang,X.;Chen,J.;Fang,L.;Chou,K.-C.,Pse-in-One:一个用于生成DNA、RNA和蛋白质序列的各种模式伪组件的web服务器,《核酸研究》,43,W65-W71,(2015)
[96] Liu,B.;Fang,L.;Liu,F.;Wang,X.;Chen,J.;Chou,K.-C.《用伪结构状态组成方法识别真microRNA前体》,PloS One,10,(2015)
[97] Liu,G.-H.;Shen,H.-B.;Yu,D.-J.,基于机器学习的数据清洗和后过滤程序预测蛋白质-蛋白质相互作用位点,J.Membr。生物,249,141-153,(2016年)
[98] Liu,H.;Motoda,H.,特征选择的计算方法,(2007),CRC出版社·Zbl 1130.62118
[99] Liu,L.-M.;Xu,K.-C.,iPGK-PseAAC:通过将四个不同层次的氨基酸成对耦合信息整合到通用PseAAC,Med中,来识别蛋白质中赖氨酸磷酸甘油化位点。《化学》,13552-559,(2017年)
[100] Liu,T.;Zheng,X.;Wang,J.,使用支持向量机和PSI-BLAST剖面预测低相似性序列的蛋白质结构类别,生物芯片,921330-1334,(2010)
[101] Liu,Z.;Xiao,X.;Qu,W.-R.;Chou,K.-C.,iDNA-甲基化:通过伪三核苷酸组成鉴定DNA甲基化位点。生物化学,474,69-77,(2015年)
[102] Liu,Z.;Xiao,X.;Yu,D.-J.;Jia,J.;Qu,W.-R.;Chou,K.-C.,pRNAm PC:通过物理化学性质预测RNA序列中的N6甲基腺苷位点。生物化学,497,60-67,(2016年)
[103] Munro,S.,蛋白质在高尔基体中的定位,趋势细胞生物学,8,11-15,(1998)
[104] Opat,A.S.;van Vliet,C.;Gleeson,P.A.,《住院高尔基糖基化酶的贩运和定位》,Biochimie,83763-773,(2001年)
[105] Pazzani,M.;Merz,C.;Murphy,P.;Ali,K.;Hume,T.;Brunk,C.,《减少误分类成本》,《第十一届机器学习国际会议论文集》(1994年),217-225
[106] Powers,D.M.,《评估:从精确性、召回率和F-测量到ROC,信息性,标记性和相关性》,机器学习技术杂志,2,1,37-63,(2011)
[107号] 邱,W.-R.;Sun,B.-Q.;Xiao,X.;Xu,Z.-C.;Chou,K.-C.,iHyd-PseCp:通过将序列耦合效应整合到通用PseAAC中来识别蛋白质中的羟脯氨酸和羟赖氨酸,OnTarget,7,44310,(2016)
[108] 邱,W.-R.;Jiang,S-Y.;Xu,Z.-C.;Xiao,X.;Chou,K.-C.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸成分来识别RNA 5-甲基胞嘧啶位点,OnTarget,84178,(2017)
[109号] 邱,W.-R.;Jiang,S.-Y.;Sun,B.-Q.;Xiao,X.;Cheng,X.;Chou,K.-C.,iRNA-2methyl:通过将序列耦合效应纳入通用PseKNC和系综分类器(Med),识别RNA 2′-O-甲基化位点。《化学》,13734-743,(2017年)
[110] 邱,W.-R.;Sun,B.-Q.;Xiao,X.;Xu,Z.-C.;Jia,J.-H.;Chou,K.-C.,iKcr-PseEns:用伪组分和集成分类器识别组蛋白中赖氨酸巴豆酰化位点,基因组学,110,5,239-246,(2017)
[111] 邱,W.-R.;Sun,B.-Q.;Xiao,X.;Xu,Z.-C.;Jia,J.-H.;Chou,K.-C.,iKcr-PseEns:用伪组分和集成分类器识别组蛋白中赖氨酸巴豆酰化位点,基因组学,110,239-246,(2018)
[112] Roffo,G.;Melzi,S.;Cristani,M.,《无限特征选择》,(IEEE国际计算机视觉会议论文集,(2015年)),4202-4210
[113] Satiat‐Jeunemaitre,B.;Cole,L.;Bourett,T.;Howard,R.;Hawes,C.,Brefeldin A对植物和真菌细胞的影响:关于囊泡运输的新发现?,J.Microsc.,181162-177,(1996年)
[114] Schäffer,A.A.;Aravind,L.;Madden,T.L.;Shavirin,S.;Pougge,J.L.;Wolf,Y.I.;Koonin,E.V.;Altschul,S.F.,《利用基于成分的统计和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,《核酸研究》,29292994-3005,(2001)
[115] Shen,H.-B.;Chou,K.-C.,PseAAC:一个用于生成各种蛋白质伪氨基酸组成的灵活web服务器,Anal。生物化学,373386-388,(2008年)
[116] Song,J.;Wang,Y.;Li,F.;Akutsu,T.;Rawlings,N.D.;Webb,G.I.;Chou,K.-C.,iProt Sub:一个用于精确绘制和预测蛋白酶特异性底物和裂解位点的综合包,简要介绍。生物信息(2018)
[117] Song,J.;Li,F.;Takemoto,K.;Haffari,G.;Akutsu,T.;Chou,K.-C.;Webb,G.I.,Previous,在机器学习框架中使用序列、结构和网络特征推断催化残留物的综合方法,J.Theor。生物,443125-137,(2018年)
[118] Su,Z.-D.;Huang,Y.;Zhang,Z.-Y.;Zhao,Y.-W.;Wang,D.;Chen,W.;Chou,K.-C.;Lin,H.;Hancock,J.,iLoc lncRNA:通过将八聚体组成纳入通用PseKNC,预测lncRNAs的亚细胞位置,生物信息学,34,24,4196-4204,(2018)
[119] Tahir,M.;Hayat,M.;Kabir,M.,《通过应用Chou's trinucleotide composition的一般形式识别增强子及其类型的基于序列的预测因子》,Compute。方法。《生物医学》,第146期,第69-75页,(2017年)
[120] Ungar,D.,高尔基连接蛋白糖基化和相关疾病,Semin。《细胞发育生物学》,20762-769,(2009年)
〔121〕 Verma,R.;Varshney,G.C.;Raghava,G.,《使用分裂氨基酸组成和PSSM剖面预测疟原虫线粒体蛋白质》,氨基酸,39101-110,(2010)
[122号] Waris,M.;Ahmad,K.;Kabir,M.;Hayat,M.,《利用进化轮廓识别DNA结合蛋白位置特异性评分矩阵》,神经计算,199154-162,(2016年)
[123号] Xiao,X.;Cheng,X.;Su,S.;Mao,Q.;Chou,K.-C.,pLoc mGpos:将关键基因本体信息整合到通用PseAAC中,用于预测革兰氏阳性细菌蛋白质的亚细胞定位。科学,9330,(2017年)
[124] Xiao,X.;Cheng,X.;Chen,G.;Mao,Q.;Chou,K.-C.,pLocüu bal-mGpos:通过准平衡训练数据集和PseAAC,基因组学预测革兰氏阳性细菌蛋白质的亚细胞定位(2018年)
[125] Xiao,X.;Min,J.-L.;Lin,W.-Z.;Liu,Z.;Cheng,X.;Chou,K.-C.,iDrug靶点:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。戴恩,332221-2233,(2015年)
[126] Xu,Y.;Wang,Z.;Li,C.;Chou,K.-C.,iPreny-PseAAC:通过将两层序列耦合整合到PseAAC,Med中,识别蛋白质中的C-末端半胱氨酸预酸化位点。《化学》,13544-551,(2017年)
[127号] Xuao,X.;Cheng,X.;Chen,G.;Mao,Q.,pLocüu bal-mGpos:通过准平衡训练数据集和PseAAC,基因组学预测革兰氏阳性细菌蛋白质的亚细胞定位(2018)
[128] Yang,H.;Qu,W.-R.;Liu,G.;Guo,F.-B.;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分并入通用PseKNC,国际生物学杂志,识别酿酒酵母中的重组点。Sci,14,883-891,(2018年)
[129] Yang,H.;Qiu,W.-R.;Liu,G.;Guo,F.-B.;Chen,W.;Chou,K.-C.;Lin,H.,iRSpot-Pse6NC:通过将六聚体组分纳入general PseKNC,Int.J.Biol.来识别酿酒酵母中的重组点。Sci,14883,(2018年)
[130] Yang,R.;Zhang,C.;Gao,R.;Zhang,L.,一种基于特征选择的新特征提取方法,用于从不平衡数据中识别高尔基体驻留蛋白质类型,国际分子科学杂志,17,218,(2016)
[131号] Yu,D.;Wu,X.;Shen,H.;Yang,J.;Tang,Z.;Qi,Y.;Yang,J.,《通过多视图特征并行融合增强膜蛋白亚细胞定位预测》,IEEE Trans。Nanobiosci.,11375-385,(2012年)
[132] Zaffalon,M.;Hutter,M.,《基于相互信息分布的鲁棒特征选择》,《第十八届人工智能不确定性会议论文集》(2002年),摩根考夫曼出版社,577-584
[133] Zhang,Y.;Xie,R.;Wang,J.;Leier,A.;Marquez-Lago,T.T.;Akutsu,T.;Webb,G.I.;Chou,K.-C.;Song,J.《通过在综合机器学习框架中利用信息特征对赖氨酸丙二酸化位点进行计算分析和预测》,简介。生物信息,5,(2018年)
[134号] Zhou,G.P.;Doctor,K.,《凋亡蛋白质的亚细胞定位预测》,蛋白质结构。功能。生物信息,50,44-48,(2003)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。尽可能准确地反映出原文中所列参考文献的精确性。