• 语料库ID:173990356

概率标记树算法的计算复杂性

@文章{BusaFekete2019OnTC,title={关于概率标记树算法的计算复杂性},author={R{\'o}贝特·伊斯特万·布萨·费科特(bert Istvan Busa-Fekete)、克尔兹托夫·德姆布钦斯基(Krzysztof Dembczynski)、亚历山大·戈洛夫涅夫(Alexander Golovenv)、卡利娜·贾辛斯卡(Kalina Jasinska)、米哈伊尔·库兹涅佐夫(Mikh,日志={ArXiv},年份={2019},体积={abs/1906.00294},网址={https://api.semanticscholar.org/CorpusID:173990356}}
研究表明,找到一棵具有最优训练代价的树是NP完全的,但存在一些可处理的特殊情况,这些特殊情况可以在线性时间内根据标签数获得完美逼近或精确解,并证明了期望预测代价的上界。

本文中的数字

极值多标签分类的概率标签树

本文深入研究了概率标签树(PLT),它可以被视为多标签问题的层次softmax的推广,并证明了PLT在广泛的性能指标下的一致性。

在极端分类中实现标签树的效率-精度权衡

这项工作提出了一种受信息论启发的高效算法,用于构建中间操作点,从而在延迟和统计性能之间进行权衡,这在以前是不可能的。

在线概率标签树

我们引入了在线概率标签树(OPLT),这是一种以完全在线的方式训练标签树分类器的算法,无需事先知道训练实例的数量,

分层softmax对极端多标签分类的一种无梯度推广

结果表明,当精度@$k$用作模型评估指标时,PLT是HSM的无回归多标签泛化,并且证明了选择标签启发式——一种通常与HSM一起使用的从多标签到多类的约简技术——通常是不一致的。

FastXML:用于极端多标签学习的快速、准确和稳定的树分类器

本文的目标是开发一种极端多标签分类器,与最新的多标签随机森林算法和子线性排序的标签划分算法相比,该分类器训练速度更快,预测精度更高。

条件概率树估计分析与算法

这项工作提出了第一个在线算法,该算法在标签集上可证明地构建对数深度树,以解决估计标签在时间O(logn)中的条件概率的问题,其中n是可能标签的数量。

极端分类和密度估计的树和表示的同时学习

这项工作提供了一种新的算法来同时对输入数据进行表示学习和分层预测器的学习,并从理论上分析了这一目标,表明它产生了一个boosting风格特性和一个分类误差界。

一致的多标签分类

这项工作表明,对于构建为实例、微观和宏观平均值的多标签度量,基于每个标签的边际实例条件分布,人口最优分类器可以分解为二元分类器,标签之间通过阈值具有弱关联。

使用稀疏概率估计的极限F测度最大化

这项工作考虑了极端多标签分类(XMLC)环境下的(宏观)F-测度最大化问题,并建议通过有效传递稀疏概率估计(SPE)的分类器来解决该问题,即概率估计限制在最可能的标签上。

基于概率分类器链的贝叶斯最优多标签分类

本文在概率设置下对MLC进行了形式化和分析,并提出了一种新的MLC方法,该方法推广了另一种方法,即最近在文献中引入的分类器链,并具有更好的性能。

分层概率神经网络语言模型

引入了条件概率的层次分解,在训练和识别过程中,条件概率的加速率约为200,并受到从WordNet语义层次提取的先验知识的约束。

词和短语的分布式表示及其构成

本文提出了一种在文本中查找短语的简单方法,并说明了学习数百万个短语的良好向量表示是可能的,并且描述了一种称为负采样的分层softmax的简单替代方法。