×

基于小波功率谱的多类数据集分类。 (英语) Zbl 1132.68353号

摘要:数据挖掘技术广泛应用于许多领域。数据挖掘在生物信息学领域的应用之一是组织样本的分类。在本工作中,提出了一种基于小波功率谱的方法来进行多类数据集的特征选择和成功分类。该方法应用于SRBCT和乳腺癌数据集,这些数据集是多类癌症数据集。所选特征几乎是以前作品中所选的特征。该方法能够产生几乎100%的准确分类结果。该方法简单,对噪声具有鲁棒性。无需进行大量预处理。与原始作品中使用的特征相比,使用的特征数量相对较少。由于在其他方法中通常使用阈值对数据进行初始修剪,因此不会丢失任何信息。该方法在执行各种任务时利用数据的固有性质。因此,该方法可以用于广泛的数据。

MSC公司:

68第05页 数据结构
68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abramovich F、Bailey T、Sapatinas T(2000年)。小波分析及其统计应用。JRSSD 48比1–30·数字对象标识代码:10.1111/1467-9884.00216
[2] Aldrubi A,Unser M(eds)(1996)《医学和生物学中的小波》。博卡拉顿CRC出版社·Zbl 0840.00056号
[3] Antonescu C,Peterson C,Meltzer P(2001),使用基因表达谱和人工神经网络对癌症进行分类和诊断预测。《国家医学杂志》7:673–679·数字对象标识代码:10.1038/89044
[4] Azuaje F(2001)支持发现基因功能和癌症类别的计算神经方法。IEEE Trans生物医学工程48:332–339·数字对象标识代码:10.1109/10.914796
[5] Azuaje F(2002)基于微阵列的疾病分类和基因功能发现的电子方法。医学年鉴34(4):299–305·doi:10.1080/078538902320322565
[6] Bittner M、Meltzer P、Trent J(1999)《数据分析与步骤和箭头的整合》。《自然遗传学》22:213–215·doi:10.1038/10265
[7] Chui CK(1992)小波导论。波士顿学术出版社·Zbl 0925.42016号
[8] Daubechies I(1992)关于小波的十次讲座。佛蒙特州蒙彼利埃首都出版社·兹比尔0776.42018
[9] Dietterich TG(2000):构建决策树集合的三种方法的实验比较:装袋、增强和随机化。马赫学习40:139–157·Zbl 02181356号 ·doi:10.1023/A:1007607513941
[10] Dougherty ER(2001)基于微阵列分类的小样本问题。Comp Funct Genom 2(1):28–34·doi:10.1002/cfg.62
[11] Eisen MB,Spellman PT,Brown PO,Botstein D(1998),全基因组表达模式的聚类分析和显示。美国国家科学院院刊95:14863–4868·doi:10.1073/pnas.95.25.14863
[12] Golub TR等人(1999)《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》286:531–53·doi:10.1126/science.286.5439.531
[13] Han J,Kamber M(2001)数据挖掘:概念和技术。摩根考夫曼出版社,美国旧金山,121·Zbl 1230.68018号
[14] Ian HW,Frank E(2005)《数据挖掘:实用机器学习工具和技术》。第2版。Morgan Kaufmann,旧金山·Zbl 1076.68555号
[15] Kaplan I(2001)《小波变换的光谱分析和滤波》。(http://www.bearcave.com/misl/misl_tech/wavelets/freq/index.html)
[16] Khan J、Wei J、Ringner M、Saal L、Ladanii M、Westermann F、Berthold F、Schwab M、Antonescu C、Peterson C、Meltzer P(2001)《利用基因表达谱和人工神经网络进行癌症分类和诊断预测》。Nat Medi 7:673–679自然医学杂志·数字对象标识代码:10.1038/89044
[17] Lio P(2003)《生物信息学和计算生物学中的小波:现状和展望》。生物信息学19:2–9·doi:10.1093/生物信息学/19.1.2
[18] Li T等人(2002)小波在数据挖掘中的应用调查。SIGKDD探索4(2):49–68·Zbl 05442828号 ·doi:10.1145/772862.772870
[19] Lobenhofer EK等人(2001)DNA微阵列应用进展。环境健康展望109(9):881–889·doi:10.1289/ehp.01109881
[20] Mallat S(1998)信号处理的小波之旅。圣地亚哥学术出版社·Zbl 0937.94001号
[21] Perou CM等人(2000年),人类乳腺肿瘤的分子肖像。自然17:406(6797):747–752
[22] Rifkin R、Mukherjee S、Tamayo P、Ramaswamy S、Yeang CH、Angelo M、Reich M、Poggio T、Lander ES、Golub TR、Mesirov JP(2003)《多类分子癌症分类的分析方法》。SIAM版本45:706–723·Zbl 1030.92017年 ·doi:10.1137/S0036144502411986
[23] Southern E(1975)通过凝胶电泳分离的DNA片段中特定序列的检测。分子生物学杂志98:503–517·doi:10.1016/S0022-2836(75)80083-0
[24] Strang G(1989)小波与膨胀方程:简介。SIAM版本31(4):614–627·Zbl 0683.42030号 ·doi:10.1137/1031128
[25] Tan AC,Gilbert D(2003)癌症分类中基因表达数据的集成机器学习。应用生物信息2:S75–S83
[26] Tamayo P,Slonim D,Mesirov J,Zhu Q,Kitareewan S,Dmitrovsky E,Lander ES,Golub TR(1999)用自组织图解释基因表达模式:造血分化的方法和应用。美国国家科学院院刊96(6):2907–2912·doi:10.1073/pnas.96.6.2907
[27] Thomas JG,Olson JM,Tapscott S,Zhao LP(2001)使用基因组表达谱发现差异表达基因的一种有效而稳健的统计建模方法。基因组研究11:1227–1236·doi:10.1101/gr.165101
[28] Zhou X,Wang X,Dougherty ER(2004a)非线性probit基因选择和分类的贝叶斯方法。J Franklin Instit富兰克林学院341:137–156·Zbl 1095.62130号 ·doi:10.1016/j.jfranklin.2003.12.010
[29] Zhou X,Wang X,Doughety ER,Russ D,Suh E(2004b)基于互信息的基因聚类。计算机生物学杂志11(1):147–161·doi:10.1089/106652704773416939
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。