半监督广义线性模型的分布估计
屠济源、刘卫东、毛晓军; 25(76):1−41, 2024.
摘要
半监督学习致力于使用未标记数据来提高机器学习算法的性能。本文研究了分布式环境下的半监督广义线性模型(GLM)。在单台或多台机器包含未标记数据的情况下,我们提出了两种基于分布式近似牛顿法的分布式半监督算法。当标记的局部样本较小时,我们的算法仍然给出了一致的估计,而完全监督的方法无法收敛。此外,我们从理论上证明了当存在足够的未标记数据时,收敛速度大大提高。因此,与完全监督的方法相比,所提出的方法需要更少的通信来实现最优速率。在线性模型的情况下,我们证明了一轮通信后的速率下限,这表明速率改进是必不可少的。最后,通过仿真分析和实际数据研究,验证了该方法的有效性。
[腹肌]
[pdf格式][围兜]