欧盟MPOC
Euk-mPLoc:融合多个位点的大规模真核蛋白质亚细胞定位预测融合分类器。预测蛋白质亚细胞定位的关键挑战之一是如何处理多个定位位点的情况。不幸的是,到目前为止,除了只关注芽殖酵母中的蛋白质外,还没有人在这方面做出任何努力。对于大多数现有的预测因子,多位点蛋白要么被排除在考虑范围之外,要么被假定甚至不存在。实际上,蛋白质可能同时存在于两个或多个不同的亚细胞位置,或在两个或多个不同的亚细胞位置之间移动。例如,根据瑞士Prot数据库(版本50.7,发布于2006年9月19日),在已经实验性地观察到亚细胞定位注释的33925个真核蛋白质条目中,2715个具有多个定位位点,这意味着大约8%具有多重定位特征。这种具有多个位置或动态特征的蛋白质特别有趣,因为它们可能具有一些非常特殊的生物学功能,这对基础研究和药物发现的研究者都很感兴趣。同时,根据同一个瑞士Prot数据库,真核生物蛋白质条目的总数(除了那些注有“片段”或少于50个氨基酸的)为90909,这意味着有一个空白(90909-33925)=56984个条目,没有关于它们的亚细胞位置的知识。虽然人们可以使用计算方法来预测空白的期望信息,但是到目前为止,所有现有的预测真核蛋白质亚细胞定位的方法都局限于单个定位位点的情况。为了克服这一障碍,我们开发了一种新的集成分类器Euk-mPLoc,它也可以用来处理多个位置站点的情况。公众可以通过http://202.120.37.186/bioinf/Euk-multi作为Web服务器免费访问Euk-mPLoc。同时,为了支持相关领域的工作人员,Euk-mPLoc被用于识别瑞士Prot数据库中没有亚细胞位置标注或注释为不确定的所有真核蛋白质条目。由此获得的大规模结果已通过一个用Microsoft Excel编制的可下载文件存放在同一个网站上,文件名为“Tab_Euk-mPLoc.xls”。此外,为了纳入真核生物蛋白质的新条目,在覆盖范围和预测精度上反映Euk mPLoc的持续发展,我们将及时更新可下载文件和预测因子,并通过在期刊上发表短文和在网页上发布公告的方式随时通知用户。
此软件的关键字