主页

论文

提交的资料

新闻

编辑委员会

开源软件

程序(PMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

超高维单指数分位数回归

张元坤、恒联、严宇; 21(224):1−25, 2020.

摘要

我们考虑一个灵活的半参数单指数分位数回归模型,其中协变量的数量可能是超高维的,并且相关协变量的数目可能是发散的。该方法特别适合于揭示高维数据中的复杂异质性,包括非线性和潜在交互作用,避免维数灾难,并允许在不同分位数级别包含不同的变量。我们通过多项式样条非参数估计未知函数,并采用非凸罚函数来识别稀疏变量集。我们进一步将其推广到部分线性单指数分位数模型,其中非参数项中的单指数分量和部分线性分量都可以是超高维的。然而,在发展理论和计算方面出现了一些重大挑战:(a)模型在单指数系数中高度非线性,因为高维单指数协变量嵌入未知柔性函数中。(b) 数据是超高维的,其中单指数协变量($p_n$)的维数是发散的,甚至是样本大小$n$的指数级。(c) 分位数回归的目标函数是非光滑的。(d) 正则化采用SCAD等非凸变量选择。(e) 扩展的部分线性单指数分位数模型可以包括超高维($p_n$)单指数协变量和超高维的($q_n$)部分线性协变量。我们开发了一种新的方法,使用经验过程技术来建立部分线性单指数分位数模型的非凸惩罚估计量的理论性质,并表明这些估计量在超高维环境中确实具有预言性质。我们提出了一种有效的算法来规避计算挑战。蒙特卡罗模拟的结果以及对基因表达数据的应用证明了所提出的模型和估计方法的有效性。

[腹肌][pdf格式][围兜]      
©JMLR公司2020(编辑,贝塔)