×

基于图形的高维数据分类中的不确定性量化。 (英语) Zbl 1394.62083号

摘要:高维数据的分类有着广泛的应用。在许多此类应用中,为最终分类配备不确定性度量可能与分类本身一样重要。本文介绍了二进制分类任务中各种贝叶斯模型的算法,并研究了它们的性质;通过分类标签上的后验分布,这些方法自动给出不确定性度量。这些方法都是基于半监督学习的图形表示。我们提供了一个统一的框架,将数学科学中不同社区引入的各种方法结合在一起。我们研究probit分类[C.K.威廉姆斯C.E.拉斯穆森,“回归的高斯过程”,in:神经信息处理系统的进展8。马萨诸塞州剑桥:麻省理工学院出版社。514–520(1996)]在基于图形的设置中,推广了贝叶斯反问题的水平集方法[M.A.伊格莱西亚斯等,接口自由约束。18,第2期,181-217页(2016年;Zbl 1353.65050号)]到分类设置,并推广基于Ginzburg-Landau优化的分类器[第一作者等人,《多尺度模型模拟》,第10期,第3期,1090–1118(2012;Zbl 1259.68215号);高级差异。埃克。17,编号11-12115-1180(2012年;Zbl 1388.35200号)]贝叶斯设置。我们还表明,probit和level-set方法是引入的调和函数方法的自然松弛[十、朱等,“使用高斯场和调和函数的半监督学习”,载于:第20届国际机器学习会议论文集,ICML'03。纽约州纽约市:计算机协会(ACM)。912–919 (2003)]. 我们为基于MCMC的采样和基于梯度的MAP估计引入了适用于大型数据集的高效数值方法。通过数值实验研究了模型的分类精度和不确定性量化;这些实验展示了一组常用于评估基于图形的半监督学习算法的数据集。

理学硕士:

62H30型 分类和区分;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] C.M.Alaiáz、M.Fanuel和J.A.Suykens,核PCA的凸公式及其在半监督学习中的应用,预印本,2016年。
[2] C.M.Alaiáz、M.Fanuel和J.A.Suykens,基于图的数据的稳健分类,预印本,2016年。
[3] M.Belkin、I.Matveeva和P.Niyogi,大型图的正则化和半监督学习《计算学习理论国际会议》,Springer,纽约,2004年,第624-638页·Zbl 1078.68685号
[4] M.Belkin、P.Niyogi和V.Sindhwani,流形正则化:从标记和未标记示例学习的几何框架,J.马赫。学习。Res.,7(2006),第2399–2434页·兹比尔1222.68144
[5] M.Berthod、Z.Kato、S.Yu和J.Zerubia,基于马尔可夫随机场的贝叶斯图像分类,图像视觉计算。,14(1996),第285-295页·Zbl 0825.62706号
[6] A.L.Bertozzi和A.Flenner,用于高维数据分类的图上扩散接口模型SIAM Rev.,58(2016),第293–328页·Zbl 1339.68287号
[7] A.L.Bertozzi和A.Flenner,用于高维数据分类的图上扩散接口模型,多尺度模型。模拟。,10(2012),第1090–1118页·Zbl 1259.68215号
[8] A.L.Bertozzi、X.Luo和A.M.Stuart,大图半监督学习抽样方法的计算代价,正在准备中。
[9] A.Beskos、G.Roberts和A.Stuart,高维非产品目标上本地Metropolis-Hastings链的最优缩放,Ann.应用。概率。,(2009),第863-898页·Zbl 1172.60328号
[10] A.Beskos、G.Roberts、A.M.Stuart和J.Voss,扩散桥的MCMC方法,斯托克。动态。,8(2008),第319-350页·Zbl 1159.65007号
[11] C.主教,模式识别与机器学习《信息科学与统计》,施普林格,纽约,2007年·Zbl 1107.68072号
[12] A.Blum和S.Chawla,使用图切割从标记和未标记数据中学习,在程序中。第18届国际机器学习大会(ICML),2001年。
[13] Y.Boykov、O.Veksler和R.Zabih,具有有效逼近的马尔可夫随机场,《1998年IEEE计算机学会计算机视觉和模式识别会议论文集》,IEEE,1998年,第648–655页。
[14] Y.Boykov、O.Veksler和R.Zabih,基于图割的快速近似能量最小化,IEEE传输。模式分析。机器。智力。,23(2001),第1222-1239页。
[15] Y.Y.Boykov和M.-P.Jolly,交互式图切割用于N-D图像中对象的最优边界和区域分割,《第八届IEEE国际计算机视觉会议论文集》(ICCV 2001),第1卷,IEEE,2001年,第105–112页。
[16] J.B.Broadwater、D.Limsui和A.K.Carr,用长波红外传感器探测化学羽流的底漆《技术论文》,国家安全技术部,内华达州拉斯维加斯,2011年。
[17] T.Buéhler和M.Hein,基于图p-Laplacian的谱聚类,《第26届国际机器学习年会论文集》,ACM,2009年,第81–88页。
[18] F.R.Chung,谱图论CBMS地区会议服务。数学方面。92,AMS,1997年·Zbl 0867.05046号
[19] S.L.Cotter、G.O.Roberts、A.M.Stuart和D.White,函数的MCMC方法:修改旧算法使其更快,统计。科学。,28(2013),第424–446页·Zbl 1331.62132号
[20] E.Dahlhaus、D.S.Johnson、C.H.Papadimitriou、P.D.Seymour和M.Yannakakis,多路切割的复杂性,《第24届ACM计算理论研讨会论文集》,ACM,纽约,1992年,第241-251页。
[21] M.M.Dunlop、M.A.Iglesias和A.M.Stuart,层次贝叶斯水平集反演,预印本,2016年·Zbl 1384.62084号
[22] C.Fowlkes、S.Belongie、F.Chung和J.Malik,使用Nystro¨m方法进行光谱分组,IEEE传输。模式分析。机器。智力。,26(2004),第214-225页。
[23] C.Garcia-Cardona、E.Merkurjev、A.L.Bertozzi、A.Flenner和A.G.Percus,基于图上扩散接口方法的多类数据分割,IEEE传输。模式分析。机器。智力。,36(2014年),第1600-1613页·Zbl 1329.68222号
[24] D.K.Hammond、P.Vandergheynst和R.Gribonval,基于谱图理论的图上小波,申请。计算。哈蒙。分析。,30(2011年),第129-150页·Zbl 1213.42091号
[25] J.Hartog和H.van Zanten,图的非参数贝叶斯标记预测,预印本,2016年·兹比尔1469.62076
[26] D.J.Higham和M.Kibble,光谱聚类的统一观点《数学研究报告2》,斯特拉斯克莱德大学,2004年。
[27] H.Hu、J.Sunu和A.L.Bertozzi,基于MBO方案的羽流检测多类图Mumford-Shah模型,摘自《计算机视觉和模式识别中的能量最小化方法》,Springer,纽约,2015年,第209-222页。
[28] M.A.Iglesias、Y.Lu和A.M.Stuart,几何反问题的贝叶斯水平集方法,接口自由绑定。,18(2016),第181-217页·Zbl 1353.65050号
[29] A.Kapoor、Y.Qi、H.Ahn和R.Picard,基于图的半监督分类的超参数和核学习NIPS,2005年,第627-634页。
[30] Y.LeCun、C.Cortes和C.J.Burges,MNIST手写数字数据库,1998年。
[31] 李S.Z,计算机视觉中的马尔可夫随机场建模《施普林格科学与商业媒体》,2012年。
[32] S.Lu和S.V.Pereverzev,多参数正则化及其数值实现,数字。数学。,118(2011),第1-31页·Zbl 1221.65128号
[33] X.Luo和A.L.Bertozzi,图Allen–Cahn格式的收敛性,《统计物理学杂志》。167(2017),第934-958页·Zbl 1375.82023号
[34] A.Madry,无向图中基于割的问题的快速逼近算法,《IEEE第51届计算机科学基础年会(FOCS)论文集》,IEEE,2010年,第245-254页。
[35] E.Merkurjev、T.Kosticí和A.L.Bertozzi,用于分类和图像处理的图的MBO方案,SIAM J.成像科学。,6(2013),第1903-1930页·Zbl 1279.68335号
[36] E.Merkurjev、J.Sunu和A.L.Bertozzi,用于高光谱对峙检测视频多类分割的图MBO方法,《2014年IEEE图像处理国际会议(ICIP)论文集》,IEEE,2014年,第689–693页。
[37] R.Neal,基于高斯过程先验的回归与分类《贝叶斯统计6》,牛津大学出版社,英国牛津,1999年,第475–501页,网址:·Zbl 0974.62072号
[38] B.Osting、C.D.White和Eí。乌代特,图的最小Dirichlet能量划分,SIAM J.科学。计算。,36(2014),第A1635–A1651页·Zbl 1302.05146号
[39] H.Owhadi、C.Scovel和T.Sullivan,贝叶斯推理的脆弱性SIAM Rev.,57(2015),第566–582页·Zbl 1341.62094号
[40] H.Owhadi、C.Scovel、T.J.Sullivan、M.McKerns和M.Ortiz,最佳不确定性量化SIAM Rev.,55(2013),第271-345页·Zbl 1278.60040号
[41] G.O.Roberts、A.Gelman、W.R.Gilks等人。,随机行走Metropolis算法的弱收敛性和最优尺度,Ann.应用。概率。,7(1997),第110–120页·Zbl 0876.60015号
[42] D.I.Shuman、M.Faraji和P.Vandergheynst,谱图小波的半监督学习,《采样理论与应用国际会议论文集》(SampTA),2011年,EPFL-CONF-164765。
[43] V.Sindhwani、M.Belkin和P.Niyogi,半监督学习的几何基础《半监督学习》,麻省理工学院出版社,马萨诸塞州剑桥,2006年·Zbl 1222.68144号
[44] R.C.史密斯,不确定性量化:理论、实现和应用,计算。科学。工程12,SIAM,费城,2014年·Zbl 1284.65019号
[45] A.Subramanya和J.Bilmes,测量传播的半监督学习,J.马赫。学习。Res.,12(2011),第3311-3370页·Zbl 1280.68200号
[46] T·J·沙利文,不确定性量化简介,文本应用。数学。63,Springer,Cham,2015年·Zbl 1336.60002号
[47] P.Talukdar和K.Crammer,用于传递学习的新正则化算法,《欧洲数据库机器学习和知识发现会议论文集》(ECML PKDD’09),第二部分,施普林格,柏林,2009年,第442-457页。
[48] Y.Van Gennip和A.L.Bertozzi,\图Ginzburg-Landau泛函的(Γ\)-收敛性《高级微分方程》,17(2012),第1115–1180页·Zbl 1388.35200号
[49] U.Von Luxburg,光谱聚类教程,统计。计算。,17(2007),第395–416页。
[50] G.Wahba,观测数据的样条模型,SIAM,费城,1990年·Zbl 0813.62001号
[51] C.K.Williams和C.E.Rasmussen,回归的高斯过程《神经信息处理系统进展8》,麻省理工学院出版社,马萨诸塞州剑桥,1996年,第514-520页。
[52] C.K.Williams和M.Seeger,使用Nystro¨m方法加速内核机器《第13届神经信息处理系统国际会议论文集》,麻省理工学院出版社,马萨诸塞州剑桥,2000年,第661-667页。
[53] D.Xiu,随机计算的数值方法:谱方法普林斯顿大学出版社,新泽西州普林斯顿,2010年·Zbl 1210.65002号
[54] L.Zelnik-Manor和P.Perona,自校正谱聚类,《第17届神经信息处理系统国际会议论文集》(NIPS’04),麻省理工学院出版社,马萨诸塞州剑桥,2004年,第1601–1608页。
[55] D.Zhou、O.Bousquet、T.N.Lal、J.Weston和B.Scho¨lkopf,以本地和全球一致性学习《第16届神经信息处理系统国际会议论文集》(NIPS'03),麻省理工学院出版社,马萨诸塞州剑桥,2003年,第321-328页。
[56] X.Zhu先生,半监督学习文献调查,技术报告TR1530,威斯康星大学麦迪逊分校,2008年。
[57] X.Zhu、Z.Ghahramani、J.Lafferty等。,使用高斯场和调和函数的半监督学习,载于ICML,2003年第3卷,第912-919页。
[58] X.Zhu、J.D.Lafferty和Z.Ghahramani,半监督学习:从高斯场到高斯过程,卡内基·梅隆大学,宾夕法尼亚州匹兹堡,2003年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。