×

梅德达

swMATH ID: 11723
软件作者: 朱军;阿穆尔·艾哈迈德;Eric P.邢。
描述: Medlda:最大限度监督主题模型。监督主题模型可以使用与文档或图像关联的评级或标签等附带信息来发现数据的更具预测性的低维主题表示。然而,现有的监督主题模型主要使用相似驱动的目标函数进行学习和推理,使得流行且潜在强大的最大边缘原则无法用于寻求数据的预测表示和语料库更具区分性的主题库。在本文中,我们提出了最大熵鉴别潜在Dirichlet分配(MedLDA)模型,该模型在统一的约束优化框架下,将最大边际预测模型(如SVM)背后的机制与分层贝叶斯主题模型(如LDA)背后的机制相结合,并产生更具区分性且更适合于文档分类或回归等预测任务的潜在主题表示。MedLDA形式主义的基本原理非常普遍,当监督辅助信息可用时,可以应用于有向或无向主题模型的联合最大裕度和最大似然学习。导出了用于后验推断和参数估计的有效变分方法,并对几个实际数据集进行了广泛的实证研究。我们的实验结果定性和定量地证明了MedLDA可以:1)发现稀疏且高度区分的主题表征;2) 实现最先进的预测性能;和3)比现有的监督主题模型更有效,特别是在分类方面。
主页: http://www.jmlr.org/papers/v13/zhu12a.html
关键词: 监督主题模型;MAX-边缘学习;最大熵判别;隐含狄利克雷分布;支持向量机
相关软件: PRMLT公司;LIBLINEAR银行;UCI-毫升;吉布斯LDA++;L-BFGS公司;马术;标记器;全国大学;达奇;t-SNE公司;伦敦银行同业拆借利率;ProDiGe公司;OHSUMED公司;MULAN公司;RCV1型
引用于: 13文件

按年份列出的引文