On Convergence of Distributed Approximate Newton Methods: Globalization, Sharper Bounds and Beyond

Xiao-Tong Yuan; Ping Li

DANE算法是一种广泛用于通信效率高的分布式机器学习的近似牛顿方法。对DANE感兴趣的原因包括可扩展性和效率。然而，DANE的融合可能很棘手；其吸引人的收敛速度仅对二次目标函数严格，对于更一般的凸函数，其已知结果并不比经典的一阶方法强。为了弥补这些缺点，我们在本文中提出了一些更适合分析的DANE的新替代方案。我们首先介绍了一种带有回溯线搜索的DANE的简单变体，对于二次和非二次强凸函数，可以证明其全局渐近收敛性和更尖锐的局部非渐近收敛性保证。然后，我们提出了一种加速DANE收敛的重锤方法，表明对于强凸函数，可以建立近紧局部收敛速度，并且对相同结果的算法进行适当修改后，可以全局应用于线性预测模型。数值证据证实了我们方法的理论和实践优势。

分布式近似牛顿方法的收敛性：全球化、更尖锐的界限及超越

摘要