开放式访问
2023 流数据下高维广义线性模型的在线推理
兰洛韩瑞剑林媛媛黄健
作者关联+
电子。J.统计。 17(2): 3443-3471 (2023). DOI:10.1214/23-EJS2182

摘要

本文针对具有流数据的高维广义线性模型开发了一种在线统计推断方法,用于实时估计和推断。我们提出了一种在线debiased lasso方法,该方法与流数据的数据采集方案相一致。在线失效套索与离线失效套索有两个重要的区别。首先,它仅使用历史数据的汇总统计数据更新回归系数的组件式置信区间。其次,在线衰减套索增加了一个附加项,以纠正在线更新过程中累积的近似误差。我们证明了我们在广义线性模型中提出的在线debiased估计是渐近正态的。该结果为利用流数据进行实时中期统计推断提供了理论依据。我们进行了大量的数值实验,以评估我们提出的在线衰减套索方法的性能。这些实验证明了我们算法的有效性,并支持理论结果。此外,我们用一个高维文本数据集说明了我们的方法的应用。

资金筹措表

Luo得到了国立卫生研究院老龄问题研究所(R21AG083364)和罗格斯公共卫生学院启动基金的支持。韩得到了香港研究资助委员会、大学资助委员会(14301821)和香港理工大学(P0044617,P0045351)的支持。林获得香港研究资助委员会(1430621914306620)、中国国家自然科学基金会(11961028)和香港中文大学直接研究资助。黄先生由香港理工大学资助(P0042888,A0045417,A0045931)。

致谢

我们感谢编辑、副主编和审稿人的评论,他们的评论使原稿有了实质性的改进。

引用

下载引文

蓝洛。 韩瑞剑。 林媛媛。 黄健。 “使用流数据在高维广义线性模型中进行在线推理。” 电子。J.统计。 17 (2) 3443 - 3471, 2023 https://doi.org/10.1214/23-EJS2182

信息

收到日期:2022年9月1日;发布日期:2023年
首次在欧几里得项目中提供:2023年11月28日

数字对象标识符:10.1214/23-EJS2182

学科:
主要用户:62J07型
次要:62层2562年12月

关键词:置信区间广义线性模型高维数据在线脱脂套索

第17卷•第2期•2023
返回页首