×

ROC凸壳和非参数极大似然估计。 (英语) Zbl 1260.62022号

小结:ROC凸壳(ROCCH)是经验ROC曲线的最小凸主元,表示一组分类器的最优ROC曲线。本文为ROCCH提供了一个概率观点。我们证明了ROCCH可以刻画为凸ROC曲线的非参数极大似然估计(NPMLE)。我们提供了两种NPMLE公式,一种是无条件的,另一种是有条件的,这两种公式都产生ROCCH作为解决方案。求解技术将NPMLE与凸优化和分类器校准联系起来。NPMLE和ROCCH之间的联系还表明了计算凸ROC曲线的NPMLE的有效算法,以及评估ROCCH中不确定性的条件引导程序。

MSC公司:

62G05型 非参数估计
90C25型 凸面编程
62小时30分 分类和区分;聚类分析(统计方面)
65C60个 统计学中的计算问题(MSC2010)

软件:

GGPLAB公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Campbell,G.和Ratnaparkhi,M.V.(1993年)。Lomax分布在接收机工作特性(ROC)曲线分析中的应用。统计传播。理论与方法,22(6),1681-1697·Zbl 0800.62721号 ·doi:10.1080/03610929308831110
[2] Dorfman,D.D.、Berbaum,K.S.、Metz,C.E.、Lenth,R.V.、Hanley,J.A.和Dagga,H.A.(1997)。合适的接收机工作特性分析:bigamma模型。学术放射学,4(2),138-149·doi:10.1016/S1076-6332(97)80013-X
[3] Fawcett,T.和Niculescu-Mizil,A.(2007年)。PAV和ROC凸包。机器学习,68(1),97-106·Zbl 1470.62082号 ·doi:10.1007/s10994-007-5011-0
[4] Feltz,C.J.和Dykstra,R.L.(1985年)。n个随机序随机变量生存函数的极大似然估计。《美国统计协会杂志》,80(392),1012-1019·Zbl 0587.62085号
[5] Flach,P.A。;吴,S。;Kaelbling,L.P.(编辑);Saffiotti,A.(编辑),修复ROC曲线中的凹面,702-707(2005),丹佛
[6] Hand,D.J.(2009)。衡量分级机性能:ROC曲线下面积的一致替代方案。机器学习,77(1),103-123·Zbl 1470.62085号 ·doi:10.1007/s10994-009-5119-5
[7] Hinkley,D.V.(1988年)。引导方法。英国皇家统计学会杂志。B辑:统计方法,50(3),321-337·Zbl 0671.62037号
[8] Johansen,S.(1978年)。乘积极限估计是最大似然估计。《斯堪的纳维亚统计杂志》,195-199年·Zbl 0385.62059号
[9] Kaplan,E.L.和Meier,P.(1958年)。不完全观测的非参数估计。《美国统计协会杂志》,53(282),457-481·Zbl 0089.14801号
[10] Kim,S。;Magnani,A。;萨马尔,S。;博伊德,S。;Lim,J.,帕累托最优线性分类,匹兹堡,宾夕法尼亚州,纽约
[11] Lim,J.和Pyun,K.(2009年)。基于代价有效的隐马尔可夫模型的图像分割。IEEE信号处理快报,16(3),172-175·doi:10.1109/LSP.2008.2008586
[12] Lim,J.、Kim,S.J.和Wang,X.(2009)。通过几何规划估计随机有序生存函数。计算与图形统计杂志,18(4),978-994·doi:10.1198/jcgs.2009.06140
[13] Lloyd,C.J.(2002年)。凸ROC曲线的估计。《统计与概率快报》,59(1),99-111·Zbl 1056.62077号 ·doi:10.1016/S0167-7152(02)00212-2
[14] Macskassy,S。;Provost,F。;Rosset,S.,《ROC置信区间:实证评估》,537-544(2005),纽约·数字对象标识代码:10.1145/102351.1102419
[15] Metz,C.E.和Pan,X.(1999)。“适当”二正态ROC曲线:理论和最大似然估计。数学心理学杂志,43,1-33·Zbl 0920.62138号 ·doi:10.1006/jmps.1998.1218
[16] Metz,C.E.、Herman,B.A.和Shen,J.(1998年)。基于连续分布数据的接收机工作特性(ROC)曲线的最大似然估计。医学统计学,17(9),1033-1053·doi:10.1002/(SICI)1097-0258(19980515)17:9<1033::AID-SIM784>3.0.CO;2-Z型
[17] Mladenic,D。;Grobelnik,M.,《不平衡类分布的特征选择和朴素贝叶斯》(1999)
[18] Mutapcic,A.、Koh,K.、Kim,S.-J.和Boyd,S.(2006)。GGPLAB:用于几何编程的简单Matlab工具箱,版本1.00。网址:http://standord.edu/boyd/ggplab,2006年5月·Zbl 0800.62721号
[19] Pan,X.,&Metz,C.E.(1997年)。“适当”二正态模型:退化数据的参数接收机工作特性曲线估计。学术放射学,4(5),380-389·doi:10.1016/S1076-6332(97)80121-3
[20] Provost,F.和Fawcett,T.(2001)。针对不精确环境的稳健分类。机器学习,42(3),203-231·Zbl 0969.68126号 ·doi:10.1023/A:100760115854
[21] Tibshirani,R.和K.奈特(1999)。自适应模型选择的协方差膨胀准则。英国皇家统计学会杂志。B系列:统计方法,61(3),529-546·Zbl 0924.62031号 ·doi:10.1111/1467-9868.00191
[22] 扎德罗兹尼,B。;Elkan,C.,《将分类器分数转换为准确的多类概率估计》,加拿大艾伯塔省埃德蒙顿市,纽约·数字对象标识代码:10.1145/775047.75151
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。