稀疏标记体制下多标签分类的遗憾界

的一部分神经信息处理系统进展35(NeurIPS 2022)主要会议轨道

Biptex公司 纸张 补充的

作者

Róbert Busa-Fekete、Heejin Choi、Krzysztof Dembczynski、Claudio Gentile、Henry Reeve、Balazs Szorenyi

摘要

多标签分类(MLC)具有广泛的实际意义,但对其统计性质的理论理解仍然有限。为了填补这一空白,我们深入研究了两个典型MLC性能度量指标(Hamming loss和Precision@$\kappa$)的后悔上限和下限。我们考虑了两种不同的统计和算法设置,一种是由插入式分类器处理的非参数设置,另一种是由基于代理损失函数的经验风险最小化处理的参数设置。对于这两种情况,我们分析了二进制分类中广泛研究的低噪声假设的自然MLC变体与标签稀疏性之间的相互作用,后者是大规模MLC问题的自然属性。我们表明,这些条件对改善边界至关重要,但它们的缠结方式并不明显,而且在两种设置中也有所不同。