×

动态线性主题模型的贝叶斯分析。 (英语) Zbl 1409.62059号

摘要:从带有时间戳的文本集合中发现主题的时间演变是一个具有挑战性的统计学习问题。动态主题模型提供了一个概率建模框架,用于将文本文档语料库分解为“主题”,即词汇术语的概率分布,同时学习这些主题相对流行的时间动态。我们扩展了动态主题模型D.M.Blei博士J.D.拉弗蒂[“动态主题模型”,摘自:第23届机器学习国际会议论文集,ICML'06。纽约州纽约市:计算机机械协会(ACM)。113–120 (2006;doi:10.1145/1143844.1143859)]通过将其关于主题的多项因素模型与考虑主题流行率的时间趋势和季节性的动态线性模型相融合。提出了一种利用Pólya-Gamma数据增强的马尔可夫链蒙特卡罗(MCMC)算法用于后验采样。模型和采样中的条件独立性是明确的,我们的MCMC算法在可能的情况下是并行的,以允许在大型语料库中进行推理。通过多个合成示例验证了我们的模型和推理算法,并考虑了建模趋势在住宅网站Zillow房地产上市中的应用问题。我们在合成示例中证明,跨文档共享信息对于准确估计文档特定主题比例至关重要。对Zillow语料库的分析表明,该方法能够学习主题流行的季节模式和局部线性趋势。

MSC公司:

2015年1月62日 贝叶斯推断
62第20页 统计学在经济学中的应用
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anandkumar,A.、Foster,D.P.、Hsu,D.J.、Kakade,S.M.和Liu,Y.-K.(2012)。“潜在狄利克雷分配的谱算法”,《神经信息处理系统进展》,917-925·Zbl 1311.68130号 ·doi:10.1007/s00453-014-9909-1
[2] Anandkumar,A.、Hsu,D.J.、Janzamin,M.和Kakade,S.M.(2013)。“什么时候可以识别超完备主题模型?具有结构稀疏性的张量-塔克分解的唯一性。”《神经信息处理系统进展》,1986年至1994年·Zbl 1351.68202号
[3] Arora,S.、Ge,R.、Halpern,Y.、Mimno,D.、Moitra,A.、Sontag,D.、Wu,Y.和Zhu,M.(2013)。“具有可证明保证的主题建模实用算法”,《国际机器学习会议》,280-288。
[4] Blei,D.M.和Lafferty,J.D.(2006年)。“动态主题模型”,摘自《第23届机器学习国际会议论文集》,ICML'06113-120。美国纽约州纽约市:ACM。统一资源定位地址http://doi.acm.org/10.1145/1143844.1143859
[5] Blei,D.M.、Ng,A.Y.和Jordan,M.I.(2003年)。“潜在的Dirichlet分配”,《机器学习研究杂志》,3:993-1022。统一资源定位地址http://dl.acm.org/citation.cfm?id=944919.944937 ·Zbl 1112.68379号
[6] Carter,C.K.和Kohn,R.(1994年)。状态空间模型的吉布斯抽样〉,《生物特征》,81(3):541-553·兹比尔0809.62087 ·doi:10.1093/biomet/81.3.541
[7] Chen,J.、Zhu,J.,Wang,Z.、Zheng,X.和Zhang,B.(2013)。“逻辑正常主题模型的可缩放推理”,收录于Burges,C.J.C.、Bottou,L.、Welling,M.、Ghahramani,Z.和Weinberger,K.Q.(编辑),《神经信息处理系统进展》26,2445-2453。Curran Associates公司。
[8] Chib,S.(1996)。“在马尔可夫混合模型中计算后验分布和模态估计”,《计量经济学杂志》,75:79-97·Zbl 0864.62010 ·doi:10.1016/0304-4076(95)01770-4
[9] Devroye,L.(2009)。“关于雅可比θ函数相关分布的精确模拟算法”,《统计与概率快报》,79(21):2251-2259。统一资源定位地址http://www.sciencedirect.com/science/article/pii/S0167715209002867 ·Zbl 1177.65014号 ·doi:10.1016/j.spl.2009.07.028
[10] Donoho,D.和Stodden,V.(2004)。“非负矩阵因式分解何时能正确分解为多个部分?”见Thrun,S.,Saul,L.K.和Schölkopf,B.(编辑),《神经信息处理系统进展》1611141-1148。麻省理工学院出版社。
[11] Frühwirth-Schnatter,S.(1994)。“数据增强和动态线性模型”,《时间序列分析杂志》,15(2):183-202·Zbl 0815.62065号
[12] Gelman,A.和Rubin,D.B.(1992年)。“使用多序列的迭代模拟推断”,《统计科学》,7(4):457-472。统一资源定位地址http://dx.doi.org/10.1214/ss/1177011136 ·Zbl 1386.65060号 ·doi:10.1214/ss/117701136
[13] Gerrish,S.和Blei,D.(2011年)。“DTM。”https://github.com/blei-lab/dtm。
[14] Gilks,W.R.和Wild,P.(1992年)。“吉布斯抽样的自适应拒绝抽样”,《应用统计》,337-348·Zbl 0825.62407号
[15] Gillis,N.(2013)。“Hottopixx的稳健性分析,分解非负矩阵的线性规划模型”,SIAM矩阵分析与应用杂志,34(3):1189-1212·Zbl 1286.15016号 ·doi:10.1137/120900629
[16] Gillis,N.(2014)。“稳健非负盲源分离的连续非负投影算法”,SIAM成像科学杂志,7(2):1420-1450·Zbl 1296.65065号 ·数字对象标识代码:10.1137/130946782
[17] Gillis,N.和Vavasis,S.A.(2014年)。“可分离非负矩阵分解的快速稳健递归算法”,IEEE模式分析与机器智能汇刊,36(4):698-714。
[18] Glynn,C.、Tokdar,S.T.、Howard,B.和Banks,D.L.(2019年)。“动态线性主题模型的贝叶斯分析”的补充贝叶斯分析·Zbl 1409.62059号 ·doi:10.1214/18-BA1100
[19] Griffiths,T.L.和Steyvers,M.(2004)。《寻找科学主题》,《国家科学院学报》,101(增刊1):5228-5235。
[20] Hoffman,M.、Bach,F.R.和Blei,D.M.(2010年)。“潜在dirichlet分配的在线学习”,《神经信息处理系统进展》,856-864。
[21] Holmes,C.C.和Held,L.(2006)。“二元和多项式回归的贝叶斯辅助变量模型”,《贝叶斯分析》,1:145-168·Zbl 1331.62142号 ·doi:10.1214/06-BA105
[22] Huang,K.、Fu,X.和Sidiropoulos,N.D.(2016)。“无锚相关主题建模:可识别性和算法”,《神经信息处理系统进展》,1786-1794年。
[23] Kumar,A.、Sindhwani,V.和Kambadur,P.(2013年)。“用于近可分离非负矩阵分解的快速圆锥壳算法”,《第30届国际机器学习会议论文集》(ICML-13),231-239。
[24] Linderman,S.、Johnson,M.和Adams,R.P.(2015)。“相依多项式模型变得容易了:随着Pólya-Gamma的增加而打破僵局。”《神经信息处理系统进展》,3456-3464。
[25] Liu,Y.-K.、Anandkumar,A.、Foster,D.P.、Hsu,D.和Kakade,S.M.(2012)。“两个SVD的充分性:用于概率主题建模的谱分解和潜在Dirichlet分配”,摘自《神经信息处理系统》(NIPS)。
[26] Polson,N.G.、Scott,J.G.和Windle,J.(2013)。“使用Polya-Gamma潜变量的逻辑模型的贝叶斯推断”,《美国统计协会杂志》,108(504):1339-1349·Zbl 1283.62055号 ·doi:10.1080/01621459.2013.829001
[27] Recht,B.、Re,C.、Tropp,J.和Bittorf,V.(2012年)。“用线性程序分解非负矩阵”,《神经信息处理系统进展》,1214-1222。
[28] Teh,Y.W.、Jordan,M.I.、Beal,M.J.和Blei,D.M.(2006)。“等级迪里克莱过程”,《美国统计协会杂志》,101(476):1566-1581·Zbl 1171.62349号 ·doi:10.1198/016214500000302
[29] Teh,Y.W.、Newman,D.和Welling,M.(2007年)。“用于潜在Dirichlet分配的折叠变分贝叶斯推理算法”,《神经信息处理系统进展》,1353-1360。
[30] Turner,R.E.和Sahani,M.(2011年)。“时间序列模型的变分期望最大化的两个问题”,摘自Barber,D.、Cemgil,T.和Chiappa,S.(eds.),贝叶斯时间序列模型,第5章,109-130。剑桥大学出版社。
[31] Wallach,H.M.、Mimno,D.M.和McCallum,A.(2009年)。“重新思考LDA:为什么先验很重要”,摘自《神经信息处理系统进展》第22期,1973-1981年。Curran Associates,Inc.网址http://papers.nips.cc/paper/3854-rethinking-lda-why-priors-matter.pdf
[32] 渡边,S.(2013)。“一种广泛适用的贝叶斯信息准则”,《机器学习研究杂志》,14(3月):867-897·Zbl 1320.62058号
[33] West,M.和Harrison,J.(1997年)。贝叶斯预测和动态建模。纽约州纽约市:Springer-Verlag,第二版·Zbl 0871.62026号
[34] Windle,J.、Carvalho,C.M.、Scott,J.G.和Sun,L.(2013)。“二进制和计数数据动态模型中的高效数据增强。”ArXiv电子打印。
[35] Windle,J.、Polson,N.G.和Scott,J.G.(2014)。“Polya-Gamma随机变量抽样:替代和近似技术。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。