×

通过(f\)-GAN改进桥梁估计器。 (英语) Zbl 1496.62024号

小结:桥式采样是一种强大的蒙特卡罗方法,用于估计归一化常数的比率。为了提高效率,引入了各种方法。这些方法的目的是通过对密度应用适当的变换来增加密度之间的重叠,而不改变其归一化常数。本文首先通过等价估计两个密度之间的散度,给出了最优Bridge估计量的渐近相对均方误差(RMSE)的一个新估计。然后,我们利用这个框架,提出了基于双射变换的(f)-GAN桥估计(f)-GB),该双射变换将一个密度映射到另一个密度,并最小化最优桥估计相对于密度的渐近RMSE。通过最小化密度之间的特定散度来选择此转换。我们证明了在任何给定的候选变换集内,(f)-GB估计量可以渐近地获得低于或等于基于任何其他变换密度的Bridge估计量所获得的RMSE的意义上,(f”-GB是最优的。数值实验表明,在模拟和实际例子中,(f)-GB优于现有方法。此外,我们讨论了(f)-散度估计问题是如何自然产生Bridge估计的。

MSC公司:

62-08 统计问题的计算方法
62英尺15英寸 贝叶斯推断
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 山猫阿里;Silvey,SD,一种分布与另一种分布的一般散度系数,J.R.Stat.Soc.:Ser。B(Methodol.),28,1,131-142(1966)·Zbl 0203.19902号
[2] Arjovsky,M.,Bottou,L.:训练生成对抗性网络的原则性方法。arXiv预印arXiv:1701.04862(2017)
[3] Bennett,CH,《蒙特卡罗数据自由能差异的有效估计》,J.Compute。物理。,22, 2, 245-268 (1976) ·doi:10.1016/0021-9991(76)90078-4
[4] 布里奇斯,M。;费罗兹,F。;霍布森,M。;Lasenby,A.,《原始功率谱的贝叶斯最优重建》,Mon。不是。R.天文学家。Soc.,400,2,1075-1084(2009年)·文件编号:10.1111/j.1365-2966.2009.15525.x
[5] Burda,Y.,Grosse,R.,Salakhutdinov,R.:使用反向退火对MRF对数似然进行准确保守的估计。摘自:《人工智能与统计》,第102-110页。PMLR(2015)
[6] Chen,M.-H.,Shao,Q.-M.:估算不同尺寸密度的归一化常数之比。《中国统计》607-630(1997)·Zbl 0885.62029号
[7] 克雷斯韦尔,A。;怀特,T。;杜穆林,V。;阿鲁库马兰,K。;Sengupta,B。;巴拉斯,AA,《生成性对抗网络:概述》,IEEE信号处理。Mag.,35,1,53-65(2018)·doi:10.1109/MSP.2017.2765202
[8] Dinh,L.,Sohl-Dickstein,J.,Bengio,S.:使用实际NVP进行密度估计。arXiv预印arXiv:1605.08803(2016)
[9] Durkan,C.,Bekasov,A.,Murray,I.,Papamakaris,G.:神经样条流。arXiv预印arXiv:1906.04032(2019)
[10] 菲茨默里,GM;Laird,NM,分析纵向二进制响应的一种似然方法,Biometrika,80,1,141-151(1993)·Zbl 0775.62296号 ·doi:10.1093/biomet/80.1.141
[11] 福门,M。;马吉,AF;惠登,C。;舱底,A。;马森,FA IV;Minin,VN,19种计算系统发育树拓扑的边际可能性的可疑方法,Syst。生物,69,2,209-220(2020)·doi:10.1093/sysbio/syz046
[12] 弗里尔,N。;Wyse,J.,《评估证据——综述》,Stat.Neerl。,66, 3, 288-308 (2012) ·文件编号:10.1111/j.1467-9574.2011.00515.x
[13] Frühwirth-Schnatter,S.,使用桥式抽样技术估计混合和马尔可夫切换模型的边际可能性,《计量经济学》。J.,7,1,143-167(2004)·Zbl 1053.62087号 ·doi:10.1111/j.1368-423X.2004.00125.x
[14] Gelman,A.,Meng,X.-L.:模拟规范化常数:从重要性采样到桥接采样再到路径采样。统计科学。163-185 (1998) ·Zbl 0966.65004号
[15] Geweke,J.,《贝叶斯计量经济模型的模拟方法:推理、发展和沟通》,《计量经济学》。第18、1、1-73版(1999年)·Zbl 0930.62105号 ·doi:10.1080/07474939908800428
[16] Geyer,C.J.:估算归一化常数和重新称量混合物。明尼苏达大学统计学院技术报告568(1994)
[17] Goodfellow,I.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.、Courville,A.、Bengio,Y.:生成性对抗网。摘自:《神经信息处理系统进展》,第2672-2680页(2014年)
[18] Grover,A.,Dhar,M.,Ermon,S.:流动式学习:在生成模型中结合最大可能性和对抗性学习(2018)。arXiv:1705.08868[cs.LG]
[19] Gutmann,M.,Hyvärinen,A.:噪声控制估计:非正规统计模型的新估计原理。载:《第十三届国际人工智能与统计会议论文集》,第297-304页(2010年)
[20] Jennrich,RI,非线性最小二乘估计量的渐近性质,《数学年鉴》。Stat.,40,2,633-643(1969)·Zbl 0193.47201号 ·doi:10.1214/aoms/1177697731
[21] Jia,H.,Seljak,U.:用高斯化桥式抽样对常数估计进行归一化。摘自:近似贝叶斯推断进展研讨会,第1-14页。PMLR(2020年)
[22] Kingma,民主党人;Salimans,T。;Jozefowicz,R。;陈,X。;Sutskever,I。;Welling,M.,用逆自回归流改进变分推理,高级神经网络。信息处理。系统。,29, 4743-4751 (2016)
[23] A.孔。;McCullagh,P。;孟,X-L;尼古拉,D。;Tan,Z.,蒙特卡洛积分的统计模型理论,J.R.Stat.Soc.Seri。B(Stat.Methodol.),65,3,585-604(2003)·Zbl 1067.62054号 ·doi:10.1111/1467-9868.00404
[24] Lartillot,N。;Philippe,H.,使用热力学积分计算贝叶斯因子,系统。生物学,55,2,195-207(2006)·doi:10.1080/10635150500433722
[25] Le Cam,L.M.:无症状统计。蒙特勒大学出版社(1969)·Zbl 0203.51601号
[26] Lin,J.,基于香农熵的散度测量,IEEE Trans。Inf.理论,37,1,145-151(1991)·Zbl 0712.94004号 ·数字对象标识代码:10.1109/18.61115
[27] DJ Lunn;托马斯。;贝斯特,N。;Spiegelhalter,D.,WinBUGS——贝叶斯建模框架:概念、结构和可扩展性,统计计算。,10, 4, 325-337 (2000) ·doi:10.1023/A:1008929526011
[28] Meng,X.-L.,Wong,W.H.:通过简单恒等式模拟归一化常数的比率:理论探索。中国统计局831-860(1996)·Zbl 0857.62017号
[29] 孟,X-L;Schilling,S.,《全信息项目因子模型拟合与桥梁抽样实证研究》,美国统计协会,91,435,1254-1267(1996)·兹伯利0925.62220 ·doi:10.1080/01621459.1996.10476995
[30] 孟,X-L;Schilling,S.,《曲桥采样》,J.Compute。图表。统计,11,3,552-586(2002)·doi:10.1198/106186002457
[31] Metz,L.、Poole,B.、Pfau,D.、Sohl-Dickstein,J.:未轧制的生成性对抗网络。参加:第五届国际学习代表大会,ICLR,法国土伦(2017)
[32] 纽伊,WK;McFadden,D.,大样本估计和假设检验,Handb。经济。,4, 2111-2245 (1994)
[33] Nguyen,X。;温赖特,MJ;Jordan,MI,通过凸风险最小化估计发散函数和似然比,IEEE Trans。《信息论》,56,11,5847-5861(2010)·Zbl 1366.62071号 ·doi:10.10109/TIT.2010.2068870
[34] Nowozin,S.,Cseke,B.,Tomioka,R.:f-gan:使用变分散度最小化训练生成性神经采样器。摘自:《神经信息处理系统进展》,第271-279页(2016年)
[35] NVIDIA、Vingelmann、P.、Fitzek、F.H.P.:CUDA,发布日期:10.2.89。https://developer.nvidia.com/cuda-toolkit网站 (2020)
[36] 超长,AM;Forster,JJ,广义线性混合模型的默认贝叶斯模型确定方法,计算。统计数据分析。,54, 12, 3269-3288 (2010) ·Zbl 1284.62462号 ·doi:10.1016/j.csda.2010.03.008
[37] Papamakarios,G.、Pavlakou,T.、Murray,I.:用于密度估计的掩蔽自回归流。摘自:《神经信息处理系统进展》,第2338-2347页(2017年)
[38] Paszke,A.、Gross,S.、Chintala,S.,Chanan,G.、Yang,E.、DeVito,Z.、Lin,Z.,Desmaison,A.、Antiga,L.、Lerer,A.:pytorch中的自动区分。In:NIPS 2017 Autodiff研讨会(2017)
[39] Pinsker,M.S.:随机变量和过程的信息和信息稳定性。霍尔顿日(1964)·Zbl 0125.09202号
[40] Ranganath,R.,Gerrish,S.,Blei,D.:黑箱变分推理。摘自:《人工智能与统计》,第814-822页。PMLR(2014)
[41] Rezende,D.J.,Mohamed,S.:规范化流的变分推理。arXiv预印arXiv:1505.05770(2015)
[42] Skilling,J.等人:用于一般贝叶斯计算的嵌套采样。贝叶斯分析。1(4), 833-859 (2006) ·Zbl 1332.62374号
[43] Sturtz,S.、Ligges,U.、Gelman,A.E.:R2WinBUGS:R(2005)中运行WinBUGS的包
[44] Tran,D.、Vafa,K.、Agrawal,K.,Dinh,L.、Poole,B.:离散流:离散数据的可逆生成模型。摘自:《神经信息处理系统的进展》,第14719-14728页(2019年)
[45] Uehara,M.、Sato,I.、Suzuki,M.,Nakayama,K.、Matsuo,Y.:从密度比估计角度来看的生成对抗网。arXiv预印arXiv:1610.02920(2016)
[46] Voter,AF,确定自由能差和过渡态理论速率常数的蒙特卡罗方法,化学杂志。物理。,82, 4, 1890-1899 (1985) ·doi:10.1063/1.448373
[47] Wang,L.,Jones,D.E.,Meng,X.-L.:曲桥采样:下一代。J.Am.Stat.Assoc.(公认)1-31(2020)
[48] Wong,J.S.、Forster,J.J.、Smith,P.W.:桥式取样器的特性,重点在于分离MCMC样品。统计计算。1-18 (2020) ·Zbl 1447.62014年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。