占上风

previous,一种在机器学习框架中使用序列、结构和网络特征推断催化残留物的综合方法。确定一种酶的催化残基对于我们理解蛋白质序列、结构、功能之间的关系以及提高我们设计新的酶及其抑制剂的能力至关重要。虽然许多酶已经被测序,并确定了它们的一级和三级结构,但酶功能表征的实验方法却落后。由于用于识别催化残基的实验方法是资源密集型和劳动密集型的,因此计算方法具有相当大的价值,并且非常适合用于补充识别催化残留物的实验研究,并有助于弥合序列结构-功能鸿沟。在这项研究中,我们描述了一种新的计算方法,称为预测酶催化残留物。该方法是在一个随机森林机器学习框架中,利用从多个层次(包括序列、结构和剩余接触网络)中提取的一整套信息特征来开发的。基于10倍交叉验证和独立测试,对8个不同数据集进行了广泛的对标实验,并与七种基于序列和结构的现代方法进行了并排性能比较,结果表明,Previal取得了具有竞争力的预测性能,接收器工作特性曲线下的面积和精确召回曲线下的面积分别为0.896~0.973和0.294~0.523。我们证明,这种方法能够捕捉到来自不同水平的有用信号,利用这些不同但有用的特征类型,使我们能够显著提高催化残留预测的性能。我们相信这一新的方法可以作为一个有价值的工具,既可以理解蛋白质复杂的序列结构-功能关系,也可以促进缺乏功能注释的新酶的特征描述。


zbMATH中的参考文献(参考文献10条)

显示第1到第10个结果,共10个。
按年份排序(引用)

  1. 艾哈迈德,贾迈勒;Hayat,Maqsood:MFSC:采用Chou's PseAAC成分的一般形式对高尔基蛋白进行分类的基于多投票的特征选择(2019年)
  2. 陈国栋;曹操,伙计;俞佳琳;郭新云;施少平:周氏通用PseAAC结合六种特征对原核生物赖氨酸乙酰化位点的预测与功能分析(2019)
  3. 侯赛因,瓦卡尔;汗,亚瑟·达尼尔;拉苏尔,努曼;可汗,谢尔·阿夫扎尔;周国琛:Sprenlc PseAAC:基于序列的模型,通过Chou的5步规则和通用PseAAC来识别蛋白质中的s-prenylization位点(2019年)
  4. 贾建华;李小燕;邱,王仁;晓萱;周国臣:iPPI PseAAC(CGR):通过将混沌博弈表示纳入PseAAC(2019年),识别蛋白质-蛋白质相互作用
  5. 潘毅;王世元;张琪;陆谦子;苏东青;左永春;杨磊:周氏不同伪成分和还原氨基酸组成对动物毒素的分析与预测(2019)
  6. 程、香;晓萱;Chou,Kuo Chen:pLoc逯bal-mGneg:通过准平衡训练数据集和通用PseAAC预测革兰氏阴性细菌蛋白质的亚细胞定位(2018)
  7. 贾、仓植;杨青;邹全:NucPosPred:general PseKNC的四种不同模式预测物种特异性基因组核小体定位(2018)
  8. 梅,娟;傅易;赵,季:用特征选择和周的一般伪氨基酸组成分析和预测离子通道抑制剂(2018)
  9. 萨博,M.法兹利;伊克巴尔、纳迪姆;可汗,穆赫塔吉;可汗,穆斯林;Maqbool,H.F.:利用复合编码特征识别RNA序列中的5-甲基胞嘧啶位点到周氏PseKNC中(2018)
  10. 桑卡里,湿婆;Manimgalai,D.:通过将一个新的特征集整合到周的通用PseAAC中来预测膜蛋白类型(2018)