F-测度最大化的精确算法

的一部分神经信息处理系统的进展24(NIPS 2011)

Biptex公司 元数据 纸类

作者

Krzysztof Dembczynski、Willem Waegeman、Weiwei Cheng、Eyke Hüllermier

摘要

最初引入信息检索的F度量现在通常用作二进制分类、多标签分类和结构化输出预测等问题的性能度量。优化这个度量仍然是一个具有统计和计算挑战性的问题,因为不存在封闭形式的最大化。当前的算法是近似的,通常依赖于有关二进制响应变量统计分布的附加假设。在本文中,我们提出了一种算法,它不仅计算效率高,而且精确,与底层分布无关。该算法只需要联合分布参数的二次数量(相对于二进制响应的数量)。我们通过多标签分类的实验结果来说明它的实际性能。