×

遗传序列分类及其在跨物种同源性检测中的应用。 (英语) Zbl 1042.68658号

摘要:尽管世界各地正在进行遗传序列数据的大规模分类研究,但很少有研究比较不同的分类方法,例如在无监督和监督的情况下,在分类准确性和计算复杂性等客观标准方面。在本文中,我们研究了对相对较大的序列数据集进行无监督分类和监督分类的这种准则。无监督方法包括使用不同的序列比对算法(例如,Smith-Waterman、FASTA和BLAST),然后使用Maximin算法进行聚类。监督方法使用合适的数字编码(核苷酸元组的相对频率,然后进行主成分分析),将其输入多层反向传播神经网络。在IBM-SP并行计算机上进行的分类实验表明,在所有方法中,使用无监督Maximin的FASTA能够在准确性和速度之间取得最佳平衡,其次是监督神经网络。最后,将不同的分类器应用于跨物种同源性检测问题。

MSC公司:

68T05年 人工智能中的学习和自适应系统
68单位99 计算方法和应用
PDF格式BibTeX公司 XML格式引用
全文: DOI程序