多点2

MultiLoc2:结合系统发育学和基因本体论术语,改进亚细胞蛋白质定位预测。背景:蛋白质的亚细胞定位是蛋白质组学、药物靶向发现和系统生物学的关键,因为蛋白质的亚细胞定位与生物功能高度相关。近年来,发展了许多计算预测方法。然而,仍然需要显示出更强的鲁棒性和更高精度的预测方法。结果:我们扩展了我们先前的多点预测因子,加入了系统发育概况和基因本体论术语。使用两个不同的数据集对系统进行训练,产生了两个版本的高精度预测方法。其中一个版本是专门针对球状蛋白的,可以预测多达5个定位点,而第二个版本则涵盖了所有11个主要的真核亚细胞定位。在一项有五个定位的基准研究中,MultiLoc2在动植物蛋白质和真菌蛋白质方面的表现比其他方法好得多。此外,当使用第二个数据集时,MultiLoc2的表现明显更好,该数据集将基准研究扩展到所有11个主要的真核亚细胞定位。结论:MultiLoc2是一种广泛、高效的亚细胞蛋白质定位预测系统。通过结合系统发育概况和基因本体论术语,MultiLoc2产生了比以前版本更高的精确度。此外,在两个基准研究中,它优于其他预测系统。MultiLoc2提供用户友好的免费网络服务,网址:http://www-bs.informatik.uni-tuebingen.de/Services/MultiLoc2。