文件Zbl 1440.62241-zbMATH Open

乔治·科拉尼;阿莱西奥·本纳沃利;珍妮斯·德姆沙尔;弗朗西丝卡·曼吉利;马可·扎法隆

通过贝叶斯层次模型对分类器进行统计比较。（英语） Zbl 1440.62241号

机器。学习。 106，第11期，1817-1837（2017）.

摘要：通常人们会使用零假设显著性检验来比较两个竞争分类器的准确性。然而，这种测试存在着重要的缺陷，可以通过转换到贝叶斯假设测试来克服。我们提出了一个贝叶斯层次模型，联合分析两个分类器在多个数据集上获得的交叉验证结果。与传统的对每个数据集独立平均交叉验证结果的方法相比，该模型更准确地估计单个数据集上分类器之间的差异。它通过联合分析在所有数据集上获得的结果，并对估计值应用收缩率来实现这一点。该模型最终返回两个分类器准确度实际上相等或显著不同的后验概率。

引用于5文件

MSC公司：

62H30型	分类和区分；聚类分析（统计方面）
62G10型	非参数假设检验

关键词：

分类器;贝叶斯层次建模

软件：

卡爪;斯坦;PMTK公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	Benavoli，A.、Corani，G.、Demsar，J.和Zaffalon，M.《改变的时间：通过贝叶斯分析比较多个分类器的教程》。arXiv:1606.04316·Zbl 1440.62241号
[2]	Benavoli，A.、Corani，G.、Mangili，F.、Zaffalon，M.和Ruggeri，F.（2014）。基于Dirichlet过程的Bayesian Wilcoxon签名秩检验。摘自：《第31届国际机器学习会议论文集》（ICML-14），（第1026-1034页）。
[3]	Carpenter，B.、Gelman，A.、Hoffman，M.、Lee，D.、Goodrich，B.、Betancourt，M.等人（2017年）。斯坦：一种概率编程语言。统计软件杂志，76（1），1-32·doi:10.18637/jss.v076.i01
[4]	Corani，G.和Benavoli，A.（2015）。在多个数据集上比较交叉验证算法的贝叶斯方法。机器学习，100（2），285-304·Zbl 1341.62088号 ·doi:10.1007/s10994-015-5486-z
[5]	Demšar，J.（2006）。多个数据集上分类器的统计比较。机器学习研究杂志，7，1-30·Zbl 1222.68184号
[6]	Friedman，J.H.（1991）。多元自适应回归样条。《统计年鉴》，19（1），1-67·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[7]	Gelman，A.（2006年）。层次模型中方差参数的先验分布（Browne和Draper的文章评论）。贝叶斯分析，1（3），515-534·Zbl 1331.62139号 ·doi:10.1214/06-BA117A
[8]	Hand，D.J.等人（2006年）。分类器技术和进步的幻觉。统计科学，21（1），1-14·Zbl 1426.62188号 ·doi:10.1214/08834230600000060
[9]	Juárez，M.A.和Steel，M.F.J.（2010）。基于偏态t分布的非高斯面板数据的基于模型的聚类。《商业与经济统计杂志》，28（1），52-66·Zbl 1198.62097号 ·doi:10.198/jbes.2009.07145
[10]	Krueger，T.、Panknin，D.和Braun，M.（2015）。通过顺序测试进行快速交叉验证。机器学习研究杂志，16，1103-1155·Zbl 1351.62099号
[11]	Kruschke，J.（2015）。进行贝叶斯数据分析：R、Jags和Stan的教程。纽约：学术出版社·Zbl 1300.62001号
[12]	Kruschke，J.K.（2013）。贝叶斯估计取代了t检验。《实验心理学杂志：总论》，142（2），573·doi:10.1037/a0029146
[13]	Lacoste，A.、Laviolette，F.和Marchand，M.（2012年）。机器学习算法在单个和多个数据集上的贝叶斯比较。《第十五届国际人工智能与统计会议记录》（AISTATS-12），（第665-675页）。
[14]	Murphy，K.P.（2012）。机器学习：概率观点。剑桥：麻省理工学院出版社·Zbl 1295.68003号
[15]	Nadeau，C.和Bengio，Y.（2003年）。泛化错误的推断。机器学习，52（3），239-281·Zbl 1039.68104号 ·doi:10.1023/A:1024068626366
[16]	Raftery，A.E.（1995）。社会研究中的贝叶斯模型选择。社会学方法，25111-164·doi:10.2307/271063
[17]	Wasserstein，R.L.和Lazar，N.A.（2016年）。ASA关于p值的声明：背景、过程和目的。《美国统计学家》，70（2），129-133·Zbl 07665862号 ·doi:10.1080/00031305.2016.1154108
[18]	Witten，I.H.、Frank，E.和Hall，M.（2011年）。数据挖掘：实用机器学习工具和技术（第三版）。洛斯·阿尔托斯：摩根·考夫曼。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

通过贝叶斯层次模型对分类器进行统计比较。（英语） Zbl 1440.62241号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

通过贝叶斯层次模型对分类器进行统计比较。 （英语） Zbl 1440.62241号

MSC公司：

关键词：

软件：

参考文献：

通过贝叶斯层次模型对分类器进行统计比较。（英语） Zbl 1440.62241号