穆昆德·德什潘德;乔治·卡里皮斯 生物序列分类技术评估。 (英语) Zbl 1048.68733号 Chen,Ming-Syan(编辑)等,《知识发现和数据挖掘的进展》。第六届亚太会议,2002年PAKDD,2002年5月6日至8日,台湾台北。诉讼程序。柏林:施普林格出版社(ISBN 3-540-43704-5)。莱克特。注释计算。科学。2336, 417-431 (2002). 摘要:近年来,我们目睹了公共数据库中可用的生物信息量(DNA或蛋白质序列)呈指数级增长。随之而来的是,人们对开发计算技术越来越感兴趣,以将这些大量的序列数据自动分类为各种类别,这些类别对应于它们在染色体中的作用、它们的结构和/或它们的功能。在本文中,我们评估了一些广泛使用的序列分类算法,并开发了一个以某种方式对序列建模的框架,以便可以轻松应用传统的机器学习算法,例如支持向量机。我们的详细实验评估表明,与基于马尔可夫模型的技术和基于(K)-最近邻的方法等更传统的序列分类算法相比,基于SVM的方法能够实现更高的分类精度。关于整个系列,请参见[Zbl 0992.68521号]. 引用于4文件 MSC公司: 68单位99 计算方法和应用 第68页,共15页 数据库理论 68第20页 信息存储和数据检索 92D20型 蛋白质序列,DNA序列 软件:PlanMine公司 PDF格式BibTeX公司 XML格式引用 \textit{M.Deshpande}和\textit{G.Karypis},莱克特。注释计算。科学。23361417-431(2002年;兹bl 1048.68733) 全文: 链接