基于协方差估计的受限Boltzmann机器的有效学习
Vidyadhar Upadhya,P S Sastry公司
第十一届亚洲机器学习会议记录,PMLR 101:836-8512019年。
摘要
使用CD(k)等标准算法学习RBM涉及负对数似然的梯度下降。梯度中的一个项涉及对模型分布的期望,这是很难处理的,它是通过MCMC估计获得的。在这项工作中,我们表明对数似然的Hessian可以用隐藏单位和可见单位的协方差来表示,因此,Hessian的所有元素也可以使用相同的MCMC样本来估计,并且额外的计算成本很小。由于反演Hessian可能需要大量计算,因此我们提出了一种使用Hessian对角近似逆的算法。与标准方法相比,这在本质上为梯度下降过程带来了参数特定的自适应学习率,并提高了RBM的学习效率。特别地,我们证明了在随机DC(凸函数差分)程序方法中使用Hessian的对角近似逆可以非常有效地学习RBM。
引用本文
相关材料