×

大幅度最近邻分类的距离度量学习。 (英语) Zbl 1235.68204号

摘要:(k)-最近邻(k)NN)分类的准确性在很大程度上取决于用于计算不同示例之间距离的度量。在本文中,我们展示了如何从标记示例中学习用于(k)NN分类的马氏距离度量。马氏度量可以等效地看作是输入空间的全局线性变换,它先于使用欧氏距离的(k)NN分类。在我们的方法中,度量的训练目标是:(k)-最近邻总是属于同一类,而不同类的示例之间有很大的差距。与支持向量机(SVM)一样,边缘准则导致基于铰链损失的凸优化。然而,与SVM中的学习不同,我们的方法不需要对多路(与二进制相反)分类中的问题进行修改或扩展。在我们的框架中,获得了马氏距离度量作为半定规划的解。在几个不同大小和难度的数据集上,我们发现以这种方式训练的度量可以显著改进神经网络分类。有时,通过对训练示例进行聚类并在每个聚类中学习单个指标,可以进一步改进这些结果。我们将展示如何以全球一体化的方式学习和组合这些本地指标。

MSC公司:

68T05型 人工智能中的学习和自适应系统
90C25型 凸面编程

软件:

;LMNN公司
PDF格式BibTeX公司 XML格式引用
全文: 链接