×

通过贝叶斯层次模型对分类器进行统计比较。 (英语) Zbl 1440.62241号

摘要:通常人们会使用零假设显著性检验来比较两个竞争分类器的准确性。然而,这种测试存在着重要的缺陷,可以通过转换到贝叶斯假设测试来克服。我们提出了一个贝叶斯层次模型,联合分析两个分类器在多个数据集上获得的交叉验证结果。与传统的对每个数据集独立平均交叉验证结果的方法相比,该模型更准确地估计单个数据集上分类器之间的差异。它通过联合分析在所有数据集上获得的结果,并对估计值应用收缩率来实现这一点。该模型最终返回两个分类器准确度实际上相等或显著不同的后验概率。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G10型 非参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Benavoli,A.、Corani,G.、Demsar,J.和Zaffalon,M.《改变的时间:通过贝叶斯分析比较多个分类器的教程》。arXiv:1606.04316·Zbl 1440.62241号
[2] Benavoli,A.、Corani,G.、Mangili,F.、Zaffalon,M.和Ruggeri,F.(2014)。基于Dirichlet过程的Bayesian Wilcoxon签名秩检验。摘自:《第31届国际机器学习会议论文集》(ICML-14),(第1026-1034页)。
[3] Carpenter,B.、Gelman,A.、Hoffman,M.、Lee,D.、Goodrich,B.、Betancourt,M.等人(2017年)。斯坦:一种概率编程语言。统计软件杂志,76(1),1-32·doi:10.18637/jss.v076.i01
[4] Corani,G.和Benavoli,A.(2015)。在多个数据集上比较交叉验证算法的贝叶斯方法。机器学习,100(2),285-304·Zbl 1341.62088号 ·doi:10.1007/s10994-015-5486-z
[5] Demšar,J.(2006)。多个数据集上分类器的统计比较。机器学习研究杂志,7,1-30·Zbl 1222.68184号
[6] Friedman,J.H.(1991)。多元自适应回归样条。《统计年鉴》,19(1),1-67·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[7] Gelman,A.(2006年)。层次模型中方差参数的先验分布(Browne和Draper的文章评论)。贝叶斯分析,1(3),515-534·Zbl 1331.62139号 ·doi:10.1214/06-BA117A
[8] Hand,D.J.等人(2006年)。分类器技术和进步的幻觉。统计科学,21(1),1-14·Zbl 1426.62188号 ·doi:10.1214/08834230600000060
[9] Juárez,M.A.和Steel,M.F.J.(2010)。基于偏态t分布的非高斯面板数据的基于模型的聚类。《商业与经济统计杂志》,28(1),52-66·Zbl 1198.62097号 ·doi:10.198/jbes.2009.07145
[10] Krueger,T.、Panknin,D.和Braun,M.(2015)。通过顺序测试进行快速交叉验证。机器学习研究杂志,16,1103-1155·Zbl 1351.62099号
[11] Kruschke,J.(2015)。进行贝叶斯数据分析:R、Jags和Stan的教程。纽约:学术出版社·Zbl 1300.62001号
[12] Kruschke,J.K.(2013)。贝叶斯估计取代了t检验。《实验心理学杂志:总论》,142(2),573·doi:10.1037/a0029146
[13] Lacoste,A.、Laviolette,F.和Marchand,M.(2012年)。机器学习算法在单个和多个数据集上的贝叶斯比较。《第十五届国际人工智能与统计会议记录》(AISTATS-12),(第665-675页)。
[14] Murphy,K.P.(2012)。机器学习:概率观点。剑桥:麻省理工学院出版社·Zbl 1295.68003号
[15] Nadeau,C.和Bengio,Y.(2003年)。泛化错误的推断。机器学习,52(3),239-281·Zbl 1039.68104号 ·doi:10.1023/A:1024068626366
[16] Raftery,A.E.(1995)。社会研究中的贝叶斯模型选择。社会学方法,25111-164·doi:10.2307/271063
[17] Wasserstein,R.L.和Lazar,N.A.(2016年)。ASA关于p值的声明:背景、过程和目的。《美国统计学家》,70(2),129-133·Zbl 07665862号 ·doi:10.1080/00031305.2016.1154108
[18] Witten,I.H.、Frank,E.和Hall,M.(2011年)。数据挖掘:实用机器学习工具和技术(第三版)。洛斯·阿尔托斯:摩根·考夫曼。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。