摘要
针对稀疏多元回归和条件高斯图形模型,在非平衡分裂设置下,提出了一种分布式估计和推理框架。当来自不同来源的数据集无法在一台机器上聚合时,或者当可用机器具有不同的能力时,就会出现这种类型的数据拆分。在本文中,协变量、响应和机器的数量随着样本量的增加而增加,同时还引入了稀疏性。在每台机器上提出了系数矩阵和精度矩阵的递减估计,并提供了理论保证。此外,还提出了新的聚合估计器,该估计器使用伪对数似然函数跨机器汇集信息。结果表明,随着机器数量随样本大小的增加,它们具有效率和渐近正态性。通过仿真研究和实际数据示例,研究了这些估计器的性能。经验表明,这些估计量的性能接近于使用整个数据集的非分布估计量。
资金筹措表
计算资源由计算密集型设备联合会(CéCI)提供,由比利时科学基金会(F.R.S.-FNRS)根据第2.5020.11号拨款和瓦隆地区资助。
引用
下载引文
恩西耶·内扎卡蒂。
尤根·皮尔卡拉贝鲁(Eugen Pircalabelu)。
“非平衡分布设置下稀疏多元回归和条件高斯图形模型中的估计和推断。”
电子。J.统计学家。
18
(1)
599 - 652,
2024
https://doi.org/10.1214/23-EJS2193
问询处
收到日期:2023年3月1日;发布日期:2024年
欧几里德项目首次提供:2024年2月22日
数字对象标识符:10.1214/23-EJS2193
学科:
主要用户:62甲12,62H22个
次要:62J07型
关键词:条件高斯图形模型,亏损估计,多元回归模型,精度矩阵,稀疏度,不平衡分布设置