×

拉索逻辑回归、GSoft和循环坐标下降算法:在基因表达数据中的应用。 (英语) Zbl 1304.92087号

摘要:生成稀疏模型的统计方法在基因表达领域具有重要价值,其中研究的协变量(基因)数量约为数千个,而样本量很少达到100个个体。对于表型分类,我们提出了不同的lasso logistic回归方法,并对每个基因进行了具体惩罚。这些方法基于广义软阈值(GSoft)估计器。我们还表明,最近的凸优化算法,即循环坐标下降(CCD)算法,提供了一种比其他竞争方法更快地解决优化问题的方法。将GSoft视为一个迭代阈值过程,可以让我们直接获得结果估计的渐近性质。得到了模拟数据和实际数据的结果。白血病和结肠数据集通常用于评估新的统计方法,因此它们有助于与类似方法进行比较。此外,从白血病结果中提取了生物学意义,并与以前的研究进行了比较。总之,这里提出的方法产生了稀疏、可解释的模型,与该领域开发的类似方法相比具有竞争力。

MSC公司:

92D10型 遗传学和表观遗传学
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动性、学习理论、工业过程等)上的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部