HykGene公司 swMATH ID: 23981 软件作者: Wang,Y。;马克登,F。;福特,J。;J·皮尔曼。 描述: HykGene:一种使用微阵列基因表达数据选择表型分类标记基因的混合方法。动机:最近的研究表明,微阵列基因表达数据有助于许多疾病的表型分类。这种分类中的一个主要问题是特征(基因)的数量大大超过实例(组织样本)的数量。研究表明,选择少量信息基因可以提高分类精度。针对这个基因选择问题,人们提出了许多方法。以前的大多数基因排序方法通常选择50-200个排名靠前的基因,这些基因往往高度相关。我们的目标是选择一小组与分类任务最相关的非冗余标记基因。结果:为了实现这一目标,我们开发了一种结合基因排序和聚类分析的新型混合方法。在这种方法中,我们首先应用特征过滤算法来选择一组排名靠前的基因,然后对这些基因应用层次聚类来生成树状图。最后,通过扫描线算法对树状图进行分析,并通过折叠密集聚类来选择标记基因。使用三个公共数据集的实证研究表明,与直接使用排名靠前的基因进行分类的方法相比,我们的方法能够选择相对较少的标记基因,同时提供相同或更好的省去交叉验证准确性。可用性:HykGene软件可在以下网站免费获得:http://www.cs.dartmouth.edu/wyh/software.htm软件 主页: https://www.ncbi.nlm.nih.gov/pubmed/155585531网址 相关软件: ACO采样;PCP公司;减压阀F;RankGene公司;4.5条;DistAl公司;GALib公司;促进;插补 引用于: 7文件 全部的 前5名24位作者引用 1 赵成贝 1 方耀伟 1 Gu,Jason J。 1 洪金玉 1 苏珊·C·胡。 1 黄建华 1 孔伟 1 赖永耀 1 李德成 1 李军 1 刘菲 1 刘嘉峰 1 罗,紫嫣 1 齐晓梅 1 沈琦 1 史伟民 1 孙德芬 1 Tang,祥龙 1 Toh,Kim Chuan 1 王,Y。 1 王莹 1 秀、奈华 1 Yang、Tae Young 1 张成金 全部的 前5名6篇连载文章中引用 2 模式识别 1 信息科学 1 计算统计与数据分析 1 机器学习研究杂志(JMLR) 1 计算生物学和化学 1 控制科学与工程杂志 在5个字段中引用 三 统计学(62-XX) 三 计算机科学(68至XX) 2 生物学和其他自然科学(92-XX) 1 总体主题;集合(00-XX) 1 系统论;控制(93至XX) 按年份列出的引文