曼努埃尔·加西亚·马加里尼奥斯;安妮斯蒂斯·安东尼亚迪斯;曹里卡多;文塞斯劳González-Manteiga 拉索逻辑回归、GSoft和循环坐标下降算法:在基因表达数据中的应用。 (英语) Zbl 1304.92087号 统计应用程序。遗传学。分子生物学。 9,第1号,第30条,28页(2010年). 摘要:生成稀疏模型的统计方法在基因表达领域具有重要价值,其中研究的协变量(基因)数量约为数千个,而样本量很少达到100个个体。对于表型分类,我们提出了不同的lasso logistic回归方法,并对每个基因进行了具体惩罚。这些方法基于广义软阈值(GSoft)估计器。我们还表明,最近的凸优化算法,即循环坐标下降(CCD)算法,提供了一种比其他竞争方法更快地解决优化问题的方法。将GSoft视为一个迭代阈值过程,可以让我们直接获得结果估计的渐近性质。得到了模拟数据和实际数据的结果。白血病和结肠数据集通常用于评估新的统计方法,因此它们有助于与类似方法进行比较。此外,从白血病结果中提取了生物学意义,并与以前的研究进行了比较。总之,这里提出的方法产生了稀疏、可解释的模型,与该领域开发的类似方法相比具有竞争力。 引用于2文件 MSC公司: 92D10型 遗传学和表观遗传学 60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动性、学习理论、工业过程等)上的应用 关键词:惩罚回归;逻辑回归;GSoft公司;CCD算法;优化;基因表达 PDF格式BibTeX公司 XML格式引用 \textit{M.Garcia-Magariños}等人,《统计应用》。遗传学。分子生物学。9,第1号,第30条,第28页(2010年;兹bl 1304.92087) 全文: 内政部