Cd命中

Cd-hit:一个用于聚类和比较大量蛋白质或核苷酸序列的快速程序。《描述蛋白质序列的动机》(BioFast)和《生物信息学》杂志,2001年出版的《生物序列283》,第18期,第77期。该程序可以有效地将一个包含数百万序列的庞大蛋白质数据库进行聚类。然而,该算法的应用并不仅仅局限于蛋白质序列的聚类,这里我们提出了几个新的程序,包括cd-hit-2d、cd-hit-est和cd-hit-est-2d;cd-hit-est聚类一个DNA/RNA序列数据库,cd-hit-est-2d比较两个核苷酸数据集。所有这些程序都可以处理数百万个序列的巨大数据集,比基于流行序列比较和数据库搜索工具(如BLAST)的方法快数百倍。可用性:http://cd-hit.org


zbMATH参考文献(46篇文章引用)

显示第46至第20个结果。
按年份排序(引用)
  1. 陈国栋,曹,满,俞佳林,郭新云,史少平:周氏通用PseAAC中六种特征对原核生物赖氨酸乙酰化位点的预测与功能分析(2019)
  2. Ge,Li;Liu,Jiagou;Zhang,Yusen;Dehmer,Matthias:使用广义混沌博弈表示法识别抗癌肽(2019)
  3. Monod,Anthea;Kališnik,Sara;Patiño-Galindo,JuanÁngel;Crawford,Lorin:持续同源性的充分热带统计(2019年)
  4. 潘奕;王世元;张琦;陆倩子;苏东青;左永春;杨磊:周氏各种伪成分和还原氨基酸组成对动物毒素的分析与预测(2019)
  5. Sahlin,Kristofer;Medvedev,Paul:\textitDenovo使用贪婪的基于质量值的算法对长读转录组数据进行聚类(2019年)
  6. Srivastava,Abhishikha;Kumar,Ravindra;Kumar,Manish:BlaPred:通过Chou的general PseAAC使用三层预测系统预测和分类(\β-内酰胺酶)(2018年)
  7. Brubach,Brian;Ghurye,Jay;Pop,Mihai;Srinivasan,Aravind:更好的贪婪序列聚类与快速带对齐(2017)
  8. Dezhangi,Abdollah;López,Yosvany;Lal,Sunil Pranit;Taherzadeh,Ghazaleh;Michaelson,Jacob;Sattar,Abdul;Tsunoda,Tatsuhiko;Sharma,Alok:PSSM Suc:使用位置特定的评分矩阵精确预测琥珀酰化,并将其应用到bigram中进行特征提取(2017)
  9. 基思,乔纳森M.(编辑):生物信息学。第一卷:数据、序列分析和进化(2017)
  10. Pai,Priyadarshini P.;Dash,Tirtharaj;Mondal,Sukanta:使用概率方法对蛋白质RNA相互作用残基的序列识别(2017年)
  11. Carugo,Oliviero(编辑);Eisenhaber,Frank(编辑):生命科学的数据挖掘技术(2016)
  12. Ali,Farman;Hayat,Maqsood:结合Chou的伪氨基酸组成,使用投票特征区间对膜蛋白类型进行分类(2015)
  13. Arango Argoty,G.A.;Jaramillo Garzón,J.A.;Castellanos Domínguez,G.:用于预测革兰氏阴性细菌蛋白质亚细胞定位的统计接触电位和小波变换的特征提取(2015)
  14. Kumar,Ravindra;Srivastava,Abhishikha;Kumari,Bandana;Kumar,Manish:用Chou的伪氨基酸组成和支持向量机预测(\β)-内酰胺酶及其类别(2015)
  15. 赵晓伟;宁,乔;柴,海婷;马志强:用迭代半监督学习技术精确识别蛋白质琥珀酸化位点(2015)
  16. Bakhtiarizadeh,Mohammad Reza;Moradi Shahrbaak,Mohammad;Ebrahimi,Mansour;Ebrahimie,Esmaeil:神经网络和支持向量机分类器准确预测脂质结合蛋白,不考虑序列同源性(2014)
  17. 牛晓辉;胡雪海;石峰;夏景波:基于混合分形特征的支持向量机预测DNA结合蛋白(2014)
  18. 蛋白质相互作用;蛋白质相互作用;王志平,网络;王志平,李志平;2014
  19. 陈延宽;李国斌:通过将蛋白质拓扑结构、结构域、信号肽和物理化学性质纳入周氏伪氨基酸组成的一般形式来预测膜蛋白类型(2013)
  20. 冯鹏棉;丁辉;陈伟;林浩:用特征选择识别噬菌体病毒蛋白的朴素贝叶斯分类器(2013)