×

生物序列分类技术评估。 (英语) Zbl 1048.68733号

Chen,Ming-Syan(编辑)等,《知识发现和数据挖掘的进展》。第六届亚太会议,2002年PAKDD,2002年5月6日至8日,台湾台北。诉讼程序。柏林:施普林格出版社(ISBN 3-540-43704-5)。莱克特。注释计算。科学。2336, 417-431 (2002).
摘要:近年来,我们目睹了公共数据库中可用的生物信息量(DNA或蛋白质序列)呈指数级增长。随之而来的是,人们对开发计算技术越来越感兴趣,以将这些大量的序列数据自动分类为各种类别,这些类别对应于它们在染色体中的作用、它们的结构和/或它们的功能。在本文中,我们评估了一些广泛使用的序列分类算法,并开发了一个以某种方式对序列建模的框架,以便可以轻松应用传统的机器学习算法,例如支持向量机。我们的详细实验评估表明,与基于马尔可夫模型的技术和基于(K)-最近邻的方法等更传统的序列分类算法相比,基于SVM的方法能够实现更高的分类精度。
关于整个系列,请参见[Zbl 0992.68521号].

MSC公司:

68单位99 计算方法和应用
第68页,共15页 数据库理论
68第20页 信息存储和数据检索
92D20型 蛋白质序列,DNA序列

软件:

PlanMine公司
PDF格式BibTeX公司 XML格式引用
全文: 链接