梅德达 swMATH ID: 11723 软件作者: 朱军;阿穆尔·艾哈迈德;Eric P.邢。 描述: Medlda:最大限度监督主题模型。监督主题模型可以使用与文档或图像关联的评级或标签等附带信息来发现数据的更具预测性的低维主题表示。然而,现有的监督主题模型主要使用相似驱动的目标函数进行学习和推理,使得流行且潜在强大的最大边缘原则无法用于寻求数据的预测表示和语料库更具区分性的主题库。在本文中,我们提出了最大熵鉴别潜在Dirichlet分配(MedLDA)模型,该模型在统一的约束优化框架下,将最大边际预测模型(如SVM)背后的机制与分层贝叶斯主题模型(如LDA)背后的机制相结合,并产生更具区分性且更适合于文档分类或回归等预测任务的潜在主题表示。MedLDA形式主义的基本原理非常普遍,当监督辅助信息可用时,可以应用于有向或无向主题模型的联合最大裕度和最大似然学习。导出了用于后验推断和参数估计的有效变分方法,并对几个实际数据集进行了广泛的实证研究。我们的实验结果定性和定量地证明了MedLDA可以:1)发现稀疏且高度区分的主题表征;2) 实现最先进的预测性能;和3)比现有的监督主题模型更有效,特别是在分类方面。 主页: http://www.jmlr.org/papers/v13/zhu12a.html 关键词: 监督主题模型;MAX-边缘学习;最大熵判别;隐含狄利克雷分布;支持向量机 相关软件: PRMLT公司;LIBLINEAR银行;UCI-毫升;吉布斯LDA++;L-BFGS公司;马术;标记器;全国大学;达奇;t-SNE公司;伦敦银行同业拆借利率;ProDiGe公司;OHSUMED公司;MULAN公司;RCV1型 引用于: 13文件 全部的 前5名50位作者引用 2 陈波 2 朱军 1 阿穆尔·艾哈迈德 1 钱伯斯,美国 1 陈宁 1 陈耀森 1 聪、于来 1 邓、柯 1 杜长英 1 冯波 1 乔伊迪普·戈什 1 郭炳 1 何佳 1 何青 1 史蒂芬·C·H·海。 1 金、陶 1 莱夫·琼森 1 金东宇 1 奥卢瓦桑米·科耶霍 1 Lee,Cheng先生 1 李宜超 1 刘成浩 1 刘洪伟 1 刘军S。 1 龙国平 1 鲁杰 1 马格努森 1 哦,爱丽丝 1 休·珀金斯 1 蒂莫西·鲁宾。 1 沈燕 1 帕德拉伊克·斯迈思 1 马克·斯泰弗斯 1 孙建玲 1 新华社所 1 马蒂亚斯·维拉尼 1 王菲菲 1 王伟 1 Eric P.邢。 1 宣俊宇 1 杨,韩 1 尹、辛 1 张波 1 张广全 1 张俊妮L。 1 张雪峰 1 赵培林 1 周明远 1 庄福珍 1 左、雷 5篇连载文章中引用 6 机器学习 4 机器学习研究杂志(JMLR) 1 人工智能 1 计算统计学 1 模式识别 在3个字段中引用 11 计算机科学(68至XX) 9 统计学(62-XX) 1 概率论与随机过程(60-XX) 按年份列出的引文