SuRF.vs:子抽样排名正向选择(SuRF)
基于子采样执行变量选择,排名正向选择。该方法的详细信息发表在Lihui Liu,Hong Gu,Johan Van Limbergen,Toby Kenney(2020)SuRF:稀疏变量选择的新方法,在微生物组数据分析中的应用医学统计学40 897-919<doi:10.1002/sim.8809>. Xo是预测变量矩阵。y是响应变量。目前仅支持使用逻辑回归的二进制响应。X是额外预测因子的矩阵,在分析之前,应将其缩放为总和1。fold是用于交叉验证的折叠数。Alpha是子采样过程中使用的弹性网方法的参数:默认值1对应于LASSO。prop是每个子样本中要删除的变量的比例。权重表示观察值是否应按班级规模加权。当班级规模不平衡时,加权观察可以改善结果。B是用于对变量进行排序的子样本数。C是用于估计零分布的临界值的排列的数量。如果安装了“doParallel”包,则可以通过将ncores设置为要使用的线程数来并行运行该函数。如果使用默认值1,或者如果未安装“doParallel”包,则函数不会并行运行。display.progress指示函数是否应显示指示其进度的消息。family是glm()管件的族变量。请注意,“glmnet”包不允许使用非标准链接函数,因此将始终使用默认链接函数。然而,glm()配件将使用指定的链接。默认值是带有逻辑回归的二项式,因为这是一个常见的用例。pval是模型中包含变量的p值。在零情况下,误报的数量将以几何分布作为成功概率,因此如果此参数设置为p,则预期的误报数量应为p/(1-p)。
文档:
下载内容:
链接:
请使用规范形式https://CRAN.R-project.org/package=SuRF.vs链接到此页面。