×

MFSC:采用Chou的PseAAC组分的一般形式,基于多投票的高尔基体蛋白分类特征选择。 (英语) Zbl 1406.92167号

摘要:近几十年来,蛋白质亚细胞定位的自动识别得到了广泛的应用。亚细胞定位在不同疾病的诊断以及药物开发过程中都很有用。高尔基体是一种重要的蛋白质类型,它为其他几种蛋白质提供运输途径,这些蛋白质用于溶酶体、质膜和分泌物等。顺-高尔基体和反-高尔基是高尔基体蛋白质的两端,用于接收和传递各种物质。高尔基体蛋白的功能障碍可能导致不同类型的疾病,尤其是遗传性和神经变性问题。
由于高尔基蛋白的重要性,正确鉴定高尔基蛋白是必不可少的。本文提出了一种新的高通量计算模型,能够准确识别高尔基亚蛋白。应用离散和进化特征提取方案,从蛋白质序列中捕获所有显著的、无噪声的和相关的信息。不幸的是,公开可用的基准数据集非常不平衡,其中trans-Golgi序列占整个数据集的72%,反映了偏见、冗余和缺乏假设泛化。为了弥补不平衡数据的局限性,使用了合成少数过采样技术来平衡数据集中不同类别的实例数。此外,通过融合11种不同特征选择技术的高阶特征,形成了一个浓缩的特征空间。通过多数投票算法选择高阶特征;因此,特征空间减少了85%。实验结果表明,kNN分类器与混合特征空间相结合,取得了良好的效果。它在折刀交叉验证中的准确率为98%,在独立数据中为94%,在10倍交叉验证测试中为96%。结果表明,所提出的模型是可靠的、一致的,为研究界提供了一个有价值的工具。

MSC公司:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
68T05年 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 酸,S。;De Campos,L.M。;Fernández,M.,最小冗余最大相关性与基于分数的马尔可夫边界学习方法,(第十一届智能系统设计与应用国际会议论文集(2011),IEEE),619-623
[2] Afridi,T.H。;Khan,A。;Lee,Y.S.,Mito-GSAAC:使用遗传集成分类器和分裂氨基酸组成预测线粒体,《氨基酸》,42,1443-1454(2012)
[3] 阿克巴,S。;海亚特,M。;伊克巴尔,M。;Jan,M.A.,iACP-GAEnsC:利用杂交特征空间基于进化遗传算法的抗癌肽集成分类,Artif。智力。医学,79,62-70(2017)
[4] 奥特曼·D·G。;Bland,J.M.,《诊断测试》。1:敏感性和特异性,英国医学杂志:英国医学杂志,3081552(1994)
[5] Altman,N.S.,《核和最近邻非参数回归简介》,《美国统计》,46,175-185(1992)
[6] Altschul,S.F。;Madden,T.L。;Schäffer,A.A。;张,J。;张,Z。;米勒,W。;Lipman,D.J.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[7] 荒木,E。;Oyadomari,S。;Mori,M.,内质网应激途径对胰腺β细胞和糖尿病的影响,实验生物学。医学,2281213-1217(2003)
[8] Arif,M。;海亚特,M。;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到Chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。《生物》,442,11-21(2018)·Zbl 1397.92180号
[9] 巴辛,M。;Raghava,G.P.,《基于氨基酸组成和二肽组成的核受体分类》,J.Biol。化学。,279, 23262-23266 (2004)
[10] Bock,J。;Klumperman,J。;Davanger,S。;Scheller,R.,Syntaxin 6在反高尔基网络囊泡运输中的作用,分子生物学。细胞,81261-1271(1997)
[11] 布拉德利,P.S。;Mangasarian,O.L.,通过凹最小化和支持向量机进行特征选择,(ICML论文集,98(1998)),82-90
[12] Brettschneider,J。;Del Tredici,K。;李,V.M.-Y。;Trojanowski,J.Q.,《神经退行性疾病中病理学的传播:人类研究的重点》,《神经科学自然评论》。,16, 109-120 (2015)
[13] 蔡,D。;张,C。;He,X.,多集群数据的无监督特征选择,(第十六届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2010),ACM),333-342
[14] 蔡,L。;黄,T。;苏,J。;张,X。;Chen,W。;张,F。;He,L。;Chou,K.-C.,新鉴定的脑eQTL基因及其相互作用因子在精神分裂症中的意义,Mol.Ther。核酸,12433-442(2018)
[15] 蔡永德。;刘晓杰。;徐,X.-b。;Chou,K.-C.,用支持向量机预测蛋白质结构类,计算。化学。,26, 293-296 (2002)
[16] 曹,D.-S。;徐Q-S。;Liang,Y.-Z.,Propy:生成周氏PseAAC各种模式的工具,生物信息学,29960-962(2013)
[17] 查拉,N.V。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P.,SMOTE:合成少数人过采样技术,J.Artif。智力。第16号决议,第321-357页(2002年)·Zbl 0994.68128号
[18] Chen,W。;冯,P.-M。;Lin,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,6,e68(2013)
[19] Chen,W。;Tang,H。;Ye,J。;Lin,H。;Chou,K.-C.,iRNA-PseU:识别RNA假尿苷位点,分子疗法。核酸,5,e332(2016)
[20] Chen,W。;冯·P。;丁·H。;Lin,H。;Chou,K.-C.,使用变形能量分析基因组中的核小体定位,基因组学,107,69-75(2016)
[21] Chen,W。;丁·H。;冯·P。;Lin,H。;Chou,K.-C.,iACP:一种基于序列的抗癌肽识别工具,Oncotarget,716895(2016)
[22] Chen,W。;丁·H。;周,X。;Lin,H。;Chou,K.-C.,iRNA(m6A)-PseDNC:使用伪二核苷酸成分识别N6-甲基腺苷位点,分析。生物化学。,561, 59-65 (2018)
[23] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208(2017)
[24] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C.,iRNA-3typeA:识别RNA腺苷位点的三种修饰类型,分子疗法。核酸,11468-474(2018)
[25] 陈,X.-X。;Tang,H。;李,W.C。;Wu,H。;Chen,W。;丁·H。;Lin,H.,通过伪氨基酸组成鉴定细菌细胞壁裂解酶,生物医药研究国际,2016(2016)
[26] 程,X。;Xiao,X。;Chou,K.-C,pLoc-mVirus:通过将最佳GO信息整合到一般PseAAC中来预测多位置病毒蛋白的亚细胞定位,Gene,628315-321(2017)
[27] 程,X。;Xiao,X。;Chou,K.-C.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.BioSyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[28] 程,X。;Xiao,X。;Chou,K.-C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,1,9(2017)
[29] 程,X。;Xiao,X。;Chou,K.-C,pLoc-mEuk:通过将关键GO信息提取到一般PseAAC中来预测多标记真核蛋白的亚细胞定位,基因组学,110,1,50-58(2017)
[30] 程,X。;Xiao,X。;Chou,K.-C.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学(2017)
[31] 程,X。;Xiao,X。;Chou,K.-C.,pLoc_bal-mGneg:通过准平衡训练数据集和通用PseAAC,J.Theor预测革兰氏阴性细菌蛋白质的亚细胞定位。生物学,45892-102(2018)·Zbl 1406.92173号
[32] 程,X。;赵,S.-G。;Xiao,X。;Chou,K.-C.,iATC mISF:一种用于预测解剖治疗化学物质类别的多标签分类器,生物信息学,33141-346(2016)
[33] 程,X。;赵,S.-G。;林,W.-Z。;Xiao,X。;Chou,K.-C.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[34] 程,X。;林,W.-Z。;Xiao,X。;周,K.-C。;Hancock,J.,pLoc_bal-mAnimal:通过平衡训练数据集和PseAAC预测动物蛋白质的亚细胞定位,生物信息学(2018)·Zbl 1406.92173号
[35] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[36] Chou,K.-C.,关于预测分子生物系统中多标签属性的一些评论,分子生物系统。,9, 1092-1100 (2013)
[37] 周,K.-C。;Zhang,C.-T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349 (1995)
[38] 周,K.-C。;Cai,Y.-D.,一种通过结合基因本体论预测蛋白质亚细胞定位的新混合方法,Biochem。生物物理学。Res.Commun.公司。,311, 743-747 (2003)
[39] 周,K.-C。;Shen,H.-B.,Hum PLoc:一种用于预测人类蛋白质亚细胞定位的新型集成分类器,Biochem。生物物理学。Res.Commun.公司。,347、150-157(2006年)
[40] 周,K.-C。;沈海波,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16 (2007)
[41] 周,K.-C。;Shen,H.-B.,MemType-2L:通过Pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理学。Res.Commun.公司。,360, 339-345 (2007)
[42] 周,K.-C。;Shen,H.-B.,Cell-PLoc:一个用于预测各种生物体中蛋白质亚细胞定位的Web服务器包,《自然协议》。,3, 153 (2008)
[43] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1,63(2009年)
[44] 周,K.-C。;Shen,H.-B.,Cell-PLoc 2.0:一个改进的网络服务器包,用于预测各种生物体中蛋白质的亚细胞定位,Development,1091091(2010)
[45] 周,K.-C。;程,X。;Xiao,X.,pLoc_bal-mHum:利用PseAAC和准平衡训练数据集预测人类蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[46] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。《生物信息》,43,246-255(2001)
[47] Culvenor,J.G。;马希尔,F。;Evin,G。;Malchiodi‐Albedi,F。;卡帕伊,R。;安德伍德,J.R。;Davis,J.B。;Karran,E.H。;罗伯茨,G.W。;Beyruther,K.,《神经元细胞中阿尔茨海默病相关的早老蛋白1:内质网高尔基中间室定位的证据》,《神经学杂志》。决议,49,719-731(1997)
[48] 戴,K.J。;斯塔赫林,洛杉矶。;格利克,B.S.,高尔基体结构和功能的三阶段模型,《组织化学》。细胞生物学。,140, 239-249 (2013)
[49] Dehzangi,A。;López,Y。;Lal,S.P。;Taherzadeh,G。;迈克尔森,J。;萨塔尔,A。;Tsunoda,T。;Sharma,A.,PSSM-Suc:使用位置特定的评分矩阵准确预测琥珀酰化,以二元结构进行特征提取,J.Theor。生物学,42597-102(2017)·Zbl 1381.92002年
[50] 丁·H。;刘,L。;郭,F.-B。;黄,J。;Lin,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,第18页,第58-63页(2011年)
[51] 丁·H。;Guo,S.-H。;邓永中。;袁,L.-F。;郭,F.-B。;黄,J。;Rao,N。;Chen,W。;Lin,H.,利用特征选择技术预测高尔基滞留蛋白类型,化学计量学。智力。实验室系统。,124, 9-13 (2013)
[52] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[53] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[54] 共和国杜达。;哈特,体育。;Stork,D.G.,《模式分类》(2012),John Wiley&Sons
[55] Ehsan,A。;Mahmood,K。;Y.D.Khan。;汗,S.A。;Chou,K.-C.,《信号肽分类的数学生物学新模型》,《科学》。代表,81039(2018)
[56] 风扇,G.-L。;Li,Q.-Z.,通过将不同描述符组合成Chou伪氨基酸组成的一般形式来预测蛋白质亚线粒体的位置,氨基酸,43,545-555(2012)
[57] 法夸尔,M.G。;Palade,G.E.,高尔基体(复杂)-(1954-1981)-从人工制品到中心阶段,《细胞生物学杂志》。,91、77s-103(1981)
[58] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.-C.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,识别不同RNA修饰的发生位点。核酸,7155-163(2017)
[59] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W。;Chou,K.-C.,iDNA6mA-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC-来识别DNA N6-甲基腺苷位点,基因组学(2018)
[60] Y.Fujita。;Okamoto,K.,肌萎缩侧索硬化症患者和肌萎缩侧索硬化小鼠模型中运动神经元的高尔基体,《神经病理学》,25,388-394(2005)
[61] Y.Fujita。;Ohama,E。;高田,M。;Al-Sarraj,S。;Okamoto,K.,帕金森病患者黑质神经元高尔基体与α-同核蛋白阳性内含物的断裂,神经病理学学报。,112, 261-265 (2006)
[62] Gonatas,N。;戈纳塔斯,J.O。;Stieber,A.,《高尔基体在肌萎缩性侧索硬化、阿尔茨海默病和蓖麻毒素中毒发病机制中的作用》,《组织化学》。细胞生物学。,109, 591-600 (1998)
[63] 格罗米哈,M.M。;Suwa,M.,《一种识别外膜蛋白的简单统计方法,具有更好的准确性》,生物信息学,21961-968(2005)
[64] 顾奇、李忠和韩杰,2012年。特征选择的广义fisher评分,UAI’11第二十七届人工智能不确定性会议论文集,第266-273页。;Gu,Q.,Li,Z.和Han,J.,2012年。特征选择的广义fisher评分,UAI’11《第二十七届人工智能不确定性会议论文集》,第266-273页。
[65] 郭建新。;Rao,N.N.,二肽组成对蛋白质折叠速率的影响,高级材料研究,Trans。技术出版物。,378, 157-160 (2012)
[66] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,Mach。学习。,46, 389-422 (2002) ·Zbl 0998.68111号
[67] 霍尔,文学硕士,2000年。离散类和数值类机器学习的基于相关性的特征选择,ICML'00《第十七届机器学习国际会议论文集》,Pp:359-366。;霍尔,文学硕士,2000年。离散类和数值类机器学习的基于相关性的特征选择,ICML'00《第十七届机器学习国际会议论文集》,Pp:359-366。
[68] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,10-17(2011)·Zbl 1405.92217号
[69] 海亚特,M。;Khan,A.,MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102(2012)·Zbl 1307.92308号
[70] He,X.,Cai,D.,and Niyogi,P.,特征选择的拉普拉斯评分,神经信息处理系统进展,2005,NIPS’05第18届神经信息处理体系国际会议论文集,Pp:507-514。;He,X.,Cai,D.和Niyogi,P.,特征选择的拉普拉斯分数,神经信息处理系统的进展,2005,NIPS’05第18届神经信息处理体系国际会议论文集,Pp:507-514。
[71] 胡,Z。;曾磊。;谢林。;卢·W。;张,J。;李·T。;Wang,X.,沙土鼠短暂前脑缺血后高尔基体的形态学改变和高尔基体中TGF-β1的亚细胞分区,神经化学。1927-1931年第32号决议(2007年)
[72] 黄,C。;Yuan,J.-Q.,通过三种不同的周氏假氨基酸组成模式预测单位点和多位点蛋白质亚叶绿体位置,J.Theor。生物,335205-212(2013)·Zbl 1397.92195号
[73] 贾维德,F。;Hayat,M.,通过将序列特征纳入Chou的PseAAC预测多标签蛋白质的亚细胞定位,基因组学(2018)
[74] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[75] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,通过将物理化学性质和固定小波变换结合到伪氨基酸组成中来鉴定蛋白质-蛋白质结合位点,J.Biomol。结构。动态。,34, 1946-1961 (2016)
[76] 贾,J。;张,L。;刘,Z。;Xiao,X。;Chou,K.-C.,pSumo-CD:通过将序列耦合效应纳入一般PseAAC,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141(2016)
[77] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPBS-Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21,95(2016)
[78] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[79] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iCar-PseCp:通过蒙特卡罗采样确定蛋白质中的羰基化位点,并将序列耦合效应纳入一般PseAAC,Oncotarget,734558(2016)
[80] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[81] Jiao,Y.-S。;Du,P.-F.,使用Chou伪氨基酸组成的一般形式预测Golgi-resident蛋白质类型:最小冗余最大相关特征选择方法,J.Theor。生物学,402,38-44(2016)·兹比尔1343.92378
[82] Jiao,Y.-S。;Du,P.-F.,《使用伪氨基酸成分预测高尔基-寄居蛋白类型:具有位置特异性物理化学性质的方法》,J.Theor。生物学,391,35-42(2016)·Zbl 1343.92154号
[83] 卡比尔,M。;Hayat,M.,iRSpot-GAEnsC:通过集成分类器识别重组点,并将Chou的PseAAC概念扩展到DNA样本Mol.Genet。基因组。,291, 285-296 (2016)
[84] Krishnan,S.M.,使用Chou的通用PseAAC分析受体相关蛋白(RAP)与蛋白质结构域的各种折叠模式的进化关系,J.Theor。生物学,44562-74(2018)
[85] 库马尔,M。;维玛,R。;Raghava,G.P.,使用支持向量机和隐马尔可夫模型预测线粒体蛋白质,J.Biol。化学。,281, 5357-5363 (2006)
[86] Lin,H。;Chen,W。;Ding,H.,AcalPred:一种基于序列的工具,用于区分酸性和碱性酶,PloS One,8,e75726(2013)
[87] Ling,C.X。;Li,C.,《直接营销的数据挖掘:问题与解决方案》,(第四届知识发现与数据挖掘国际会议论文集,98(1998)),73-79
[88] 刘,B。;朗·R。;Chou,K.-C.,iDHS-EL:通过将三种不同模式的伪核苷酸组成融合到集成学习框架中来识别DNase I超敏位点,生物信息学,32,2411-2418(2016)
[89] 刘,B。;杨,F。;Chou,K.-C.,2L-piRNA:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277(2017)
[90] 刘,B。;Wu,H。;Chou,K.-C.,《Pse-in-One 2.0:用于生成DNA、RNA和蛋白质序列的各种伪成分模式的改进网络服务器包》,《自然科学》,9,67(2017)
[91] 刘,B。;王,S。;朗·R。;Chou,K.-C.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2016)
[92] 刘,B。;杨,F。;黄,D.-S。;Chou,K.-C.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2017)
[93] 刘,B。;翁,F。;黄,D.-S。;Chou,K.-C.,iRO-3wPseKNC:通过基于三个窗口的PseKNC识别DNA复制起源,生物信息学,1,8(2018)
[94] 刘,B。;方,L。;朗·R。;兰,X。;Chou,K.-C.,iEnhancer-2L:通过伪K元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学,32,362-369(2015)
[95] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[96] 刘,B。;方,L。;刘,F。;王,X。;陈,J。;Chou,K.-C.,用伪结构状态组成方法识别真实的microRNA前体,PloS One,10,文章e0121501 pp.(2015)
[97] 刘,G.-H。;沈海波。;Yu,D.-J.,用基于机器学习的数据清洗和后过滤程序预测蛋白质相互作用位点,J.Membr。生物学,249,141-153(2016)
[98] 刘,H。;Motoda,H.,《特征选择的计算方法》(2007),CRC出版社·Zbl 1130.62118号
[99] 刘,L.-M。;Xu,Y。;Chou,K.-C.,iPGK-PseAAC:通过将四个不同层次的氨基酸成对偶联信息合并到一般PseAAC-,Med.Chem。,13, 552-559 (2017)
[100] 刘,T。;郑,X。;Wang,J.,使用支持向量机和PSI-BLAST图谱预测低相似性序列的蛋白质结构类别,Biochimie,921330-1334(2010)
[101] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.-C.,iDNA-Methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[102] 刘,Z。;Xiao,X。;Yu,D.-J。;贾,J。;邱伟荣。;Chou,K.-C.,pRNAm-PC:通过物理化学性质预测RNA序列中的N6-甲基腺苷位点,分析。生物化学。,497, 60-67 (2016)
[103] Munro,S.,蛋白质在高尔基体中的定位,趋势细胞生物学。,8, 11-15 (1998)
[104] Opat,A.S。;范弗利特,C。;Gleeson,P.A.,固有高尔基糖基化酶的贩运和定位,Biochimie,83763-773(2001)
[105] 巴扎尼,M。;Merz,C。;墨菲,P。;Ali,K。;休谟,T。;Brunk,C.,《减少误分类成本》(第十一届机器学习国际会议论文集(1994)),217-225
[106] Powers,D.M.,《评估:从精确性、召回和F-measure到ROC、信息性、标记性和相关性》,《机器学习技术杂志》,2011年第2期,第137-63页
[107] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iHyd-PseCp:通过将序列偶联效应纳入一般PseAAC来识别蛋白质中的羟脯氨酸和羟赖氨酸,Oncotarget,744310(2016)
[108] 邱伟荣。;蒋S.-Y。;徐,Z.C。;Xiao,X。;Chou,K.-C.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178(2017)
[109] 邱伟荣。;蒋S.-Y。;孙碧琴。;Xiao,X。;程,X。;Chou,K.-C.,iRNA-2methyl:通过将序列耦合效应纳入一般PseKNC和集成分类器,Med.Chem.,识别RNA 2′-O-甲基化位点。,13, 734-743 (2017)
[110] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;贾俊华。;Chou,K.-C.,iKcr-PseEns:使用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酰化位点,基因组学,110,5,239-246(2017)
[111] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;贾俊华。;Chou,K.C.,iKcr-PseEns:使用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酰化位点,基因组学,110,239-246(2018)
[112] Roffo,G。;梅尔齐,S。;Cristani,M.,无限特征选择,(IEEE计算机视觉国际会议论文集(2015)),4202-4210
[113] Satiat‐Jeunemaitre,B。;科尔,L。;Bourett,T。;霍华德·R。;Hawes,C.,Brefeldin A在植物和真菌细胞中的作用:囊泡运输的新情况?,《微生物学杂志》。,181, 162-177 (1996)
[114] Schäffer,A.A。;Aravind,L。;Madden,T.L。;沙维林,S。;斯普格,J.L。;Wolf,Y.I。;Koonin,E.V。;Altschul,S.F.,《利用基于成分的统计数据和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,《核酸研究》,29,2994-3005(2001)
[115] 沈海波。;Chou,K.-C,PseAAC:一个用于生成各种蛋白质伪氨基酸组成的灵活网络服务器,分析。生物化学。,373, 386-388 (2008)
[116] 宋,J。;Wang,Y。;李,F。;Akutsu,T。;罗林斯,N.D。;韦伯,G.I。;Chou,K.-C.,iProt-Sub:一个用于准确绘制和预测蛋白酶特异性底物和裂解位点的综合软件包,简介。生物信息(2018)
[117] 宋,J。;李,F。;Takemoto,K。;哈法里,G。;Akutsu,T。;周,K.-C。;Webb,G.I.,PREvaIL,一种在机器学习框架中使用序列、结构和网络特征推断催化残基的综合方法,J.Theor。生物学,443125-137(2018)
[118] Su,Z.-D。;黄,Y。;张志勇。;赵永伟。;王,D。;Chen,W。;周,K.-C。;Lin,H。;Hancock,J.,iLoc-lncRNA:通过将八聚体成分纳入一般PseKNC来预测lncRNA的亚细胞位置,生物信息学,34,24,4196-4204(2018)
[119] 塔希尔,M。;海亚特,M。;Kabir,M.,通过应用Chou三核苷酸组成的一般形式区分增强子及其类型的基于序列的预测,计算。方法进展。生物识别。,146, 69-75 (2017)
[120] Ungar,D.,高尔基体相关蛋白糖基化和相关疾病,Semin。细胞发育生物学。,20, 762-769 (2009)
[121] 维玛,R。;瓦什尼,G.C。;Raghava,G.,使用分裂氨基酸组成和PSSM谱预测疟疾寄生虫的线粒体蛋白质,氨基酸,39,101-110(2010)
[122] Waris,M。;Ahmad,K。;卡比尔,M。;Hayat,M.,使用进化剖面位置特异性评分矩阵识别DNA结合蛋白,神经计算,199154-162(2016)
[123] Xiao,X。;程,X。;苏,S。;毛泽东,Q。;Chou,K.-C.,pLoc-mGpos:将关键基因本体信息合并到通用PseAAC中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,9, 330 (2017)
[124] Xiao,X。;程,X。;陈,G。;毛泽东,Q。;Chou,K.-C.,pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[125] Xiao,X。;Min,J.-L。;林,W.-Z。;刘,Z。;程,X。;Chou,K.C.,iDrug-Target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。动态。,33, 2221-2233 (2015)
[126] Xu,Y。;王,Z。;李,C。;Chou,K.-C.,iPreny-PseAAC:通过将两层序列偶联纳入PseAAC,Med.Chem。,13, 544-551 (2017)
[127] Xuao,X。;程,X。;陈,G。;Mao,Q.,pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[128] Yang,H。;邱伟荣。;刘,G。;郭,F.-B。;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学,14,8,883-891(2018)
[129] Yang,H。;邱伟荣。;刘,G。;郭,F.-B。;Chen,W。;周,K.-C。;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学,14883(2018)
[130] Yang,R。;张,C。;高,R。;Zhang,L.,一种基于特征选择的新特征提取方法,用于从不平衡数据中识别高尔基滞留蛋白类型,国际分子科学杂志。,17, 218 (2016)
[131] Yu,D。;吴,X。;沈,H。;Yang,J.等人。;唐,Z。;齐,Y。;Yang,J.,通过多视图特征的并行融合增强膜蛋白亚细胞定位预测,IEEE Trans。纳米生物学。,11, 375-385 (2012)
[132] 扎法隆,M。;Hutter,M.,通过互信息分布进行鲁棒特征选择,(第十八届人工智能不确定性会议论文集(2002年),Morgan Kaufmann Publishers Inc),577-584
[133] Zhang,Y。;谢,R。;Wang,J。;Leier,A。;马尔克斯·拉戈,T.T。;Akutsu,T。;韦伯,G.I。;周,K.-C。;Song,J.,通过在综合机器学习框架中利用信息特征对赖氨酸丙二酰化位点进行计算分析和预测,Brief。生物信息。,5 (2018)
[134] 周国平。;K.博士,凋亡蛋白的亚细胞定位预测,蛋白质结构。功能。生物信息。,50, 44-48 (2003)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。