变量选择的Mnet方法

@第{条黄2016THEMM,title={变量选择的Mnet方法},author={黄健(Jian Huang)、布莱尼(Patrick J.Breheny)、李桑根(Sangin Lee)、马双鸽(Shuange Ma)和张存辉(Cun-Hui Zhang)},journal={统计Sinica},年份={2016年},体积={26},页数={903-923},网址={https://api.semanticscholar.org/CorpusID:12684354}}
作者:JIAN HUANG,美国爱荷华州爱荷华市谢弗霍尔221号爱荷华大学统计、精算科学和生物统计系,邮编:52242。jian-huang@uiowa.edu肯塔基大学统计系和生物统计学系,817 Patterson Office Tower,Lexington,KY 40506,美国。patrick.breenny@uky.edu美国康涅狄格州纽黑文市耶鲁大学双马公共卫生学院,邮编:06520。双ge.ma@yale.edu张存辉,罗格斯大学统计系

本文图表

竞争风险回归中的惩罚变量选择

提出了一种通用的惩罚变量选择策略,该策略同时处理PSH模型中的变量选择和参数估计,并严格地建立了所提出的惩罚估计量的渐近性质。

惩罚回归模型中错误包含率的估计

这项工作将假包含定义为一个与结果无关的变量,而不管其他变量是否有条件,这允许直接估计假包含的数量。

hdnom:用高维生存数据构建惩罚Cox模型的诺模图

我们开发了hdnom,一个用于高维数据生存建模的R包。该软件包是第一个免费且开源的软件包,简化了被处罚者的工作流程

惩罚回归模型的边际错误发现率。

对惩罚回归方法的边际错误发现率(mFDR)进行分析,可以直接估计可能仅凭偶然发生的选择数量,因此可以提供选择可靠性的有用总结。

竞争风险数据高维稀疏子分布风险模型的正则加权非参数似然方法

在高维竞争风险数据的次分布风险模型下,将基于加权似然惩罚的方法推广用于直接变量选择,使用所有方法识别出CDC20、NCF2、SMARCAD1、RTN4、ETFDH和SON的6个基因,并与次分布显著相关。

基于弹性网的层次结构协变量模型选择

结果表明,所提出的估计方法具有层次分组特性,即在层次树中相互接近的两个高度相关的协变量比远离的协变量更有可能一起包含或排除在模型中。

使用惩罚函数对“经济学”数据进行综合分析

除了“标准”惩罚选择之外,本次审查还审查了对比惩罚和拉普拉斯惩罚,这两种惩罚适应了更精细的数据结构,并得出了可能的限制和扩展。

不可表示条件失败时的半标准偏协方差变量选择

所提出的半标准偏协方差(SPAC)方法可以有效地选择对响应变量有直接影响的协变量,同时消除与响应无关但与相关预测因子高度相关的预测因子。

基于似然的惩罚回归模型的边际错误发现率控制

本文导出了一种控制边缘错误发现率的通用方法,该方法可应用于任何基于惩罚似然模型(如logistic回归和Cox回归),并表明它通常比现有方法提供更多选择因果重要特征的能力。

基于似然的惩罚回归模型的边缘错误发现率控制

一种控制边际错误发现率的通用方法,可应用于任何基于惩罚似然的模型,如逻辑回归和Cox回归,并表明它通常比现有方法提供更多选择因果重要特征的能力。
...

高维线性回归中拉索选择的稀疏性和偏差

证明了在给定条件下,平均响应的误差平方和和回归系数的lα-损失以最佳可能速率收敛,并且对于某些随机相关设计,变量数的对数可以与样本大小具有相同的阶数。

惩罚回归:桥梁与套索

结果表明,与套索回归和岭回归相比,桥接回归表现良好,并通过对前列腺癌数据的分析证明了这一点。

拉索模型选择的一致性

证明了当样本量n变大时,Lasso在经典的固定p设置和大p设置中选择真实模型的唯一条件,即不可呈现条件,几乎是必要和充分的。

通过套索进行回归收缩和选择

提出了一种新的线性模型估计方法,称为套索,它使系数绝对值之和小于常数时的剩余平方和最小。

基于非冲突惩罚似然的变量选择及其Oracle性质

本文提出了惩罚似然方法来处理变量选择问题,并证明了新提出的估计量在变量选择中的表现与预言过程一样好;也就是说,如果知道正确的子模型,它们也能工作。

参数个数不同的自适应弹性网。

本文提出了结合二次正则化和自适应加权拉索收缩的自适应弹性网,并在弱正则条件下建立了自适应弹性网的预言性。

套索惩罚回归的坐标下降算法

本文测试了两种具有套索惩罚的极快回归系数估计算法,并证明了l2算法的贪婪形式收敛于目标函数的最小值。

变量选择

结果表明,弹性网的表现往往优于套索,但具有相似的稀疏性,提出了一种名为LARS‐EN的算法,用于高效计算弹性网正则化路径,与LARS算法对套索的处理非常相似。

极小极大凹惩罚下的几乎无偏变量选择

证明了在普适惩罚水平下,MC+在不假设LASSO所要求的强不可表示条件的情况下,具有很高的匹配未知符号的概率,从而实现了正确的选择。

p>>n时弹性网的模型选择一致性

研究了弹性网的模型选择特性。在经典设置中,当p(预测器数量)和q(真线性非零系数预测器的数量