关联数据
摘要
1.简介
1.1. 背景
1.2. 动机和贡献
我们提出了连续变量变分推理的黎曼几何框架 d日 -基于所有配备非参数FR度量的PDF流形的固有几何的维数密度。 近似家庭 包含全部 d日 -具有独立边缘的参数空间上的维数密度。 我们从理论和数值上表明,所提出的方法使用 α -与基于KLD的VB方法相比,散度损失函数导致边缘密度的下限更紧。 我们的方法还能够提供边缘的上界,这是用标准的基于KLD的VB无法获得的。 我们利用PDF空间的几何特性定义了一种基于Fréchet导数的梯度上升算法来解决变分问题。 我们还指定了一种基于新的一阶泰勒近似参数有效逼近梯度函数的技术。
2.Fisher–PDF的Rao黎曼几何
3.基于 α -分歧
3.1. 雷尼 α -分歧
3.2. 问题公式化
3.3. 边际密度的界限
这导致边际密度的下限比KLD更紧。 它导致了边际密度的上限,这在KLD下是不可能的。
对于 即D α 提供了比KLD更严格的边缘下限。 对于 即D α 提供了边界的上限。
4.通过梯度上升进行优化
![保存图片、插图等的外部文件。对象名为nihms-1572322-f0001.jpg 保存图片、插图等的外部文件。对象名为nihms-1572322-f0001.jpg](/pmc/articles/PMC7540671/bin/nihms-1572322-f0001.jpg)
4.1. 步长的选择和梯度的近似
5.仿真和实际数据示例
5.1. 低维仿真研究
表1:
5.2. 贝叶斯线性回归
表2:
表3:
5.3. 贝叶斯密度估计
5.4. 实际数据应用中的贝叶斯逻辑回归
5.4.1. 电离层数据
表4:
5.4.2. 签名验证应用
表5:
6.讨论
6.1. 非场内设置的扩展
鸣谢:
脚注
工具书类
Amari S(1998年)。 自然梯度在学习中有效 . 神经计算 10 ( 2 ), 251–276. [ 谷歌学者 ] Barber D和Wiegerinck W(1999年)。 图形模型逼近的可追踪变分结构 .英寸 神经信息处理系统 ,第183-189页。 [ 谷歌学者 ] Bauer M、Joshi S和Modin K(2015年)。 基于最优信息传输的差分密度匹配 . SIAM成像科学杂志 8 ( 三 ), 1718–1751. [ 谷歌学者 ] Bauer M、Joshi S和Modin K(2017年)。 基于最优信息传输的差分随机抽样 .英寸 信息几何科学 第135–142页。 [ 谷歌学者 ] Beal MJ(2003)。 近似贝叶斯推理的变分算法 .大学学院博士论文; 伦敦。 [ 谷歌学者 ] 巴塔查里亚A(1943)。 由人口分布定义的两个统计总体之间的分歧度量 . 加尔各答数学学会公报 35 , 99–109. [ 谷歌学者 ] 主教CM(2006)。 模式识别与机器学习 纽约州施普林格。 [ 谷歌学者 ] Blei DM、Kucukelbir A和McAuliffe JD(2017年)。 变分推理:统计学家综述 . 美国统计协会杂志 112 ( 518 ), 859–877. [ 谷歌学者 ] Broderick T、Boyd N、Wibisono A、Wilson AC和Jordan MI(2013年)。 流式变分贝叶斯 .英寸 神经信息处理系统 第1727-1735页。 [ 谷歌学者 ] Carlin BP和Louis TA(2008年)。 数据分析的贝叶斯方法 CRC出版社。 [ 谷歌学者 ] Cencov NN(2000)。 统计决策规则与最优推理 .编号 53 美国数学学会。 [ 谷歌学者 ] Chen T,Streets J和Shahbaba B(2015年)。 后验近似的几何视图 . arXiv:1510.00861 [ 谷歌学者 ] Cowles MK和Carlin BP(1996年)。 马尔可夫链蒙特卡罗收敛诊断:比较综述 . 美国统计协会杂志 91 ( 434 ), 883–904. [ 谷歌学者 ] Dheeru D和Karra Taniskidou E(2017年)。 UCI机器学习库 . Ghahramani Z和Beal MJ(1999)。 因子分析器贝叶斯混合的变分推理 .英寸 神经信息处理系统 ,音量 12 第449-455页。 [ 谷歌学者 ] Girolma M和Calderhead B(2011年)。 黎曼流形Langevin和Hamilton蒙特卡罗方法 . 英国皇家统计学会杂志B辑 73 ( 2 ), 123–214. [ 谷歌学者 ] Hernández-Lobato J、Li Y、Rowland M、Bui T、Hernandez-Labato D和Turner R(2016)。 黑匣子 α -发散最小化 《机器学习国际会议》,第1511-1520页。 [ 谷歌学者 ] 霍夫曼M和布莱D(2015)。 随机结构变分推理 .英寸 人工智能与统计 第361-369页。 [ 谷歌学者 ] Hoffman医学博士、Blei DM、Wang C和Paisley JW(2013年)。 随机变分推理 . 机器学习研究杂志 14 ( 1 ), 1303–1347. [ 谷歌学者 ] Jaakkola T和Jordan MI(1997年)。 贝叶斯逻辑回归模型的变分方法及其推广 .英寸 人工智能和统计国际讲习班 ,音量 82 . [ 谷歌学者 ] Kass RE和Vos PW(2011年)。 渐近推理的几何基础 ,音量 908 约翰·威利父子公司。 [ 谷歌学者 ] Kingma DP、Salimans T、Jozefowicz R、Chen X、Sutskever I和Welling M(2016年)。 基于逆自回归流的改进变分推理 .英寸 神经信息处理系统研究进展 第4743–4751页。 [ 谷歌学者 ] Kucukelbir A、Tran D、Ranganath R、Gelman A和Blei DM(2017年)。 自动微分变分推理 . 机器学习研究杂志 18 ( 1 ), 430–474. [ 谷歌学者 ] Kurtek S(2017)。 基于重要性抽样的函数数据两两贝叶斯比对的几何方法 . 电子统计杂志 11 ( 1 ), 502–531. [ 谷歌学者 ] Kurtek S和Bharath K(2015)。 基于Fisher-Rao度量的贝叶斯灵敏度分析 . 生物特征 102 ( 三 ), 601–616. [ 谷歌学者 ] Lang S(2012年)。 微分几何基础 ,音量 191 施普林格科技与商业媒体。 [ 谷歌学者 ] 伦纳德·T(1978)。 密度估计、随机过程和先验信息 . 英国皇家统计学会杂志B辑 , 113–146. [ 谷歌学者 ] Li Y和Turner RE(2016)。 Rényi散度变分推理 .英寸 神经信息处理系统 第1073-1081页。 [ 谷歌学者 ] McGrory CA和Titterington D(2007年)。 有限混合分布贝叶斯模型选择中的变分逼近 . 计算统计与数据分析 51 ( 11 ), 5352–5367. [ 谷歌学者 ] Minka TP(2001)。 近似贝叶斯推理的期望传播 第十七届人工智能不确定性会议,第362-369页。 [ 谷歌学者 ] Minka TP(2005)。 分歧措施和信息传递 技术报告。 Olson JM和Weissfeld LA(1991年)。 某些多元积分的逼近 . 统计与概率信件 11 ( 4 ), 309–317. [ 谷歌学者 ] Ramsay JO、Hooker G和Graves S(2009年)。 用R和MATLAB进行函数数据分析 Springer科学与商业媒体。 [ 谷歌学者 ] Rao CR(1945年)。 统计参数估计中可获得的信息和准确性 . 加尔各答数学学会公报 37 , 81–91. [ 谷歌学者 ] Rényi A(1961年)。 论熵与信息的测度 .英寸 伯克利数理统计与概率研讨会 ,音量 1 第547-561页。 [ 谷歌学者 ] Rezende D和Mohamed S(2015)。 具有归一化流的变分推理 《机器学习国际会议》,第1530–1538页。 [ 谷歌学者 ] Riihimäki J和Vehtari A(2014)。 logistic高斯过程密度估计和回归的拉普拉斯近似 . 贝叶斯分析 9 ( 2 ), 425–448. [ 谷歌学者 ] Ring W和Wirth B(2012年)。 黎曼流形的优化方法及其在形状空间中的应用 . SIAM优化期刊 22 ( 2 ), 596–627. [ 谷歌学者 ] Saul LK和Jordan MI(1996年)。 利用难处理网络中的可处理子结构 .英寸 神经信息处理系统 第486-492页。 [ 谷歌学者 ] Sigillito VG、Wing SP、Hutton LV和Baker KB(1989年)。 基于神经网络的电离层雷达回波分类 . 约翰斯·霍普金斯大学APL技术摘要 10 ( 三 ), 262–266. [ 谷歌学者 ] Srivastava A、Jermyn IH和Joshi SH(2007年)。 概率密度函数的黎曼分析及其在视觉中的应用 在IEEE计算机视觉和模式识别会议上,第1-8页。 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Srivastava A、Klassen E、Joshi SH和Jermyn IH(2011年)。 欧氏空间中弹性曲线的形状分析 . IEEE模式分析和机器智能汇刊 33 ( 7 ), 1415–1428. [ 公共医学 ] [ 谷歌学者 ] Tan LS(2018)。 改进变分推理的模型重参数化 . arXiv预打印arXiv:1805.07267 [ 谷歌学者 ] Tokdar ST和Ghosh JK(2007)。 密度估计中logistic高斯过程先验的后验一致性 . 统计规划与推断杂志 137 ( 1 ), 34–42. [ 谷歌学者 ] Ueda N和Ghahramani Z(2002年)。 基于优化变分界的混合模型贝叶斯模型搜索 . 神经网络 15 ( 10 ), 1223–1241. [ 公共医学 ] [ 谷歌学者 ] van der Vaart AW和van Zanten JH(2009)。 基于逆Gamma带宽高斯随机场的自适应Bayesian估计 . 统计年刊 37 ( 第5页 ), 2655–2675. [ 谷歌学者 ] Van Erven T和Harremos P(2014)。 Rényi散度和Kullback-Leibler散度 . IEEE信息理论汇刊 60 ( 7 ), 3797–3820. [ 谷歌学者 ] Wang C和Blei DM(2013)。 非共轭模型中的变分推理 . 机器学习研究杂志 14 , 1005–1031. [ 谷歌学者 ] Yeung D、Chang H、Xiong Y、George S、Kashi R、Matsumoto T和Rigoll G(2004)。 SVC2004:首届国际签名验证竞赛 .英寸 生物认证 第16-22页。 [ 谷歌学者 ]