带噪声标签的线性距离度量学习
Meysam Alishahi、Anna Little、Jeff M.Phillips; 25(121):1−53, 2024.
摘要
在线性距离度量学习中,我们在一个欧几里德度量空间中给定数据,目标是找到一个到另一个欧氏度量空间的适当线性映射,该映射尽可能地遵守一定的距离条件。本文形式化了一种简单而优雅的方法,将其归结为一个一般的连续凸损失优化问题,并针对不同的噪声模型推导了相应的损失函数。我们表明,即使数据是有噪声的,只要能够访问足够的样本,就可以以任何精度学习基本事实线性度量,并且我们提供了相应的样本复杂度边界。此外,我们提出了一种有效的方法,将学习到的模型截断为一个低阶模型,该模型可以证明地保持损失函数和参数的准确性,这是此类结果中的第一个。对合成数据集和实际数据集的一些实验观察支持并告知了我们的理论结果。
[腹肌]
[pdf格式][围兜] [代码]