×

使用高维数据和有序响应增强临床预测的统计方法。 (英语) Zbl 1332.92004号

哥廷根:哥廷根大学(Diss.)。xi,第114页。(2015).
摘要:先进的技术使我们能够研究单个细胞或整个组织样本的分子构型。分子生物学以不断降低的成本产生大量的高维组学数据,因此分子筛越来越常用于临床应用。基于高通量组学数据的临床治疗结果的个性化诊断或预测是机器学习技术在临床问题中的现代应用。在实践中,临床参数,如患者健康状况或对治疗的毒性反应,通常按顺序进行测量(例如良好、一般、较差)。序数端点的预测通常被视为一个简单的多类分类问题,而忽略了响应中包含的排序信息。但是,不考虑响应顺序的分类器可能会降低预测准确性,甚至可能产生出乎意料的混乱预测。直接建模有序响应的经典方法,包括例如累积logit模型,通常不适用于高维数据。我们提出了层次二分法(hi2),一种将高维数据分类为有序类别的算法。hi2结合了易于理解的二进制分类和顺序响应预测的能力。提供了hi2的开源实现。对现实数据和模拟数据的几种有序分类方法进行了比较,结果表明,专门用于处理有序类别的现有分类算法无法改进最新的非有序分类算法。通常,算法的分类性能取决于其处理高维数据的能力。我们证明,我们的算法hi2显示出一贯的强大性能,在许多情况下都优于其竞争对手。

MSC公司:

92-02 与生物学有关的研究博览会(专著、调查文章)
92 C50 医疗应用(一般)
92B15号机组 普通生物统计学
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 链接 链接