普拉巴卡兰,S。;拉金德拉·萨胡;塞克尔·维尔马 基于小波功率谱的多类数据集分类。 (英语) Zbl 1132.68353号 最小已知数据。迪斯科。 15,第3号,297-319(2007). 摘要:数据挖掘技术广泛应用于许多领域。数据挖掘在生物信息学领域的应用之一是组织样本的分类。在本工作中,提出了一种基于小波功率谱的方法,用于多类数据集的特征选择和成功分类。该方法应用于SRBCT和乳腺癌数据集,这些数据集是多类癌症数据集。所选特征几乎是以前作品中所选的特征。该方法能够产生几乎100%的准确分类结果。该方法简单,对噪声具有鲁棒性。无需进行大量预处理。与原始作品中使用的特征相比,使用的特征数量相对较少。由于在其他方法中通常使用阈值对数据进行初始修剪,因此不会丢失任何信息。该方法在执行各种任务时利用数据的固有性质。因此,该方法可以用于广泛的数据。 MSC公司: 68第05页 数据结构 68T05型 人工智能中的学习和自适应系统 68吨10 模式识别、语音识别 关键词:多类别;小波功率谱;特征选择;RPV公司 PDF格式BibTeX公司 XML格式引用 \textit{S.Prabakaran}等人,《数据最小知识》。发现。15,第3号,297--319(2007;Zbl 1132.68353) 全文: 内政部 参考文献: [1] Abramovich F、Bailey T、Sapatinas T(2000年)。小波分析及其统计应用。JRSSD 48比1–30·doi:10.111/1467-9884.00216 [2] Aldroubi A,Unser M(编辑)(1996)医学和生物学中的小波。博卡拉顿CRC出版社·Zbl 0840.00056号 [3] Antonescu C,Peterson C,Meltzer P(2001),使用基因表达谱和人工神经网络对癌症进行分类和诊断预测。《国家医学杂志》7:673–679·数字对象标识代码:10.1038/89044 [4] Azuaje F(2001)支持发现基因功能和癌症类别的计算神经方法。IEEE Trans生物医学工程48:332–339·数字对象标识代码:10.1109/10.914796 [5] Azuaje F(2002)基于微阵列的疾病分类和基因功能发现的电子方法。医学年鉴34(4):299–305·doi:10.1080/078538902320322565 [6] Bittner M、Meltzer P、Trent J(1999)《数据分析与步骤和箭头的整合》。《自然遗传学》22:213–215·doi:10.1038/10265 [7] Chui CK(1992)小波简介。波士顿学术出版社·Zbl 0925.42016号 [8] Daubechies I(1992)关于小波的十次讲座。佛蒙特州蒙彼利埃首都出版社·Zbl 0776.42018号 [9] Dietterich TG(2000):构建决策树集合的三种方法的实验比较:装袋、增强和随机化。马赫学习40:139–157·Zbl 02181356号 ·doi:10.1023/A:1007607513941 [10] Dougherty ER(2001)基于微阵列分类的小样本问题。Comp Funct Genom 2(1):28–34·doi:10.1002/cfg.62 [11] Eisen MB,Spellman PT,Brown PO,Botstein D(1998),全基因组表达模式的聚类分析和显示。美国国家科学院院刊95:14863–4868·doi:10.1073/pnas.95.25.14863 [12] Golub TR等人(1999)《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》286:531–53·doi:10.1126/science.286.5439.531 [13] Han J,Kamber M(2001)《数据挖掘:概念和技术》。摩根考夫曼出版社,美国旧金山,121·Zbl 1230.68018号 [14] Ian HW,Frank E(2005)《数据挖掘:实用机器学习工具和技术》。第2版。Morgan Kaufmann,旧金山·兹比尔1076.68555 [15] Kaplan I(2001)《小波变换的光谱分析和滤波》。(http://www.bearcave.com/misl/misl_tech/wavelets/freq/index.html) [16] Khan J,Wei J,Ringner M,Saal L,Ladanyi M,Westermann F,Berthold F,Schwab M,Antonescu C,Peterson C,Meltzer P(2001)使用基因表达谱和人工神经网络对癌症进行分类和诊断预测。自然医学7:673–679·文件编号:10.1038/89044 [17] Lio P(2003)《生物信息学和计算生物学中的小波:现状和展望》。生物信息学19:2–9·doi:10.1093/生物信息学/19.1.2 [18] Li T等人(2002)小波在数据挖掘中的应用调查。SIGKDD探索4(2):49–68·Zbl 05442828号 ·doi:10.1145/772862.772870 [19] Lobenhofer EK等人(2001)DNA微阵列应用进展。环境健康展望109(9):881–889·doi:10.1289/ehp.01109881 [20] Mallat S(1998)信号处理的小波巡视。圣地亚哥学术出版社·Zbl 0937.94001号 [21] Perou CM等人(2000年),人类乳腺肿瘤的分子肖像。自然17:406(6797):747–752 [22] Rifkin R、Mukherjee S、Tamayo P、Ramaswamy S、Yeang CH、Angelo M、Reich M、Poggio T、Lander ES、Golub TR、Mesirov JP(2003)《多类分子癌症分类的分析方法》。SIAM版本45:706–723·Zbl 1030.92017年 ·doi:10.1137/S0036144502411986 [23] Southern E(1975)通过凝胶电泳分离的DNA片段中特定序列的检测。分子生物学杂志98:503–517·doi:10.1016/S0022-2836(75)80083-0 [24] Strang G(1989)小波与膨胀方程:简介。SIAM版本31(4):614–627·Zbl 0683.42030号 ·doi:10.1137/1031128 [25] Tan AC,Gilbert D(2003)癌症分类中基因表达数据的集成机器学习。应用生物信息2:S75–S83 [26] Tamayo P,Slonim D,Mesirov J,Zhu Q,Kitareewan S,Dmitrovsky E,Lander ES,Golub TR(1999)用自组织图解释基因表达模式:造血分化的方法和应用。美国国家科学院院刊96(6):2907–2912·doi:10.1073/pnas.96.6.2907 [27] Thomas JG,Olson JM,Tapscott S,Zhao LP(2001)使用基因组表达谱发现差异表达基因的有效且稳健的统计建模方法。基因组研究11:1227–1236·doi:10.1101/gr.165101 [28] Zhou X,Wang X,Dougherty ER(2004a)非线性probit基因选择和分类的贝叶斯方法。J Franklin Instit富兰克林学院341:137–156·Zbl 1095.62130号 ·doi:10.1016/j.jfranklin.2003.12.010 [29] Zhou X,Wang X,Doughety ER,Russ D,Suh E(2004b)基于互信息的基因聚类。计算机生物学杂志11(1):147–161·doi:10.1089/106652704773416939 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。