引导备用意味着 swMATH ID: 38238 软件作者: 孟玲松、阿夫拉姆、曾荫权、霍志光 描述: 通过整合表型数据和高维转录组数据发现疾病亚型的结果导向稀疏K均值。疾病亚型的发现是发展精确医学的重要步骤,通过组学数据进行疾病亚型划分已成为一种流行的方法。虽然前景看好,但从当前方法获得的亚型并不一定与临床结果相关。随着现代流行病学队列中丰富的临床数据和组学数据,迫切需要开发一种结果引导的聚类算法,将表型数据与高维组学数据充分集成。因此,我们将稀疏K均值方法扩展为结果引导的稀疏K均值(GuidedSparseKmeans)方法,该方法结合了临床数据集的表型变量,以指导从高维组学数据中进行基因选择。在模拟和应用乳腺癌和阿尔茨海默病的高维转录组数据时,与现有的聚类方法相比,我们证明了GuidedSparseKmeans的优越性能。我们的算法已经实现到一个R包中,该包在GitHub上公开可用https://github.com/LingsongMeng/GuidedSparseKmeans网站 主页: https://arxiv.org/abs/2103.09974 源代码: https://github.com/LingsongMeng/GuidedSparseKmeans网站 依赖项: R(右) 关键词: arXiv_q-bio.QM;基因组学;arXiv_q-bio.GN;arXiv_状态.AP;R包;R(右);结果导向型集群;稀疏K均值;疾病亚型;表型数据;转录组数据 相关软件: github;R(右) 引用于: 0个文档 标准条款 1出版物描述软件 年份 通过整合表型数据和高维转录组数据发现疾病亚型的结果导向稀疏K均值arXiv公司孟玲松、阿夫拉姆、曾荫权、霍志光 2021