×

用于评估分类器的概率混淆熵。 (英语) Zbl 1359.62267号

摘要:为了评估信息系统的分类模型,通常需要适当的度量来确定该模型是否适合处理特定的领域任务。尽管提出了许多绩效衡量标准,但很少有针对多类问题专门定义的衡量标准,这些问题往往比两类问题更复杂,尤其是在解决阶级歧视权力问题方面。在多类情况下,提出了模糊熵来评估分类器。然而,它并没有利用不同类别样本的概率。本文提出了基于概率混淆矩阵计算混淆熵的方法。除了继承了衡量分类器是否能够进行高精度分类和类别区分能力的优点外,概率混淆熵也倾向于衡量样本是否被分类为真实类并以高概率与其他类分离。分析和实验比较表明了简单改进措施的可行性,并证明了与比较措施相比,该措施在不同数据集上不超过分类器。

理学硕士:

62H30型 分类和区分;聚类分析(统计方面)
94甲17 信息的度量,熵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Egan,《信号检测理论和ROC分析》,认知和感知系列(1975年)
[3] DOI:10.1016/j.eswa.2009.11.040·doi:10.1016/j.eswa.2009.11.040
[4] DOI:10.1371/journal.pone.0041882·doi:10.1371/journal.pone.0041882
[5] 内政部:10.1016/j.pare.2008.08.010·doi:10.1016/j.patrec.2008.08.010
[6] DOI:10.1007/BF01617722·doi:10.1007/BF01617722
[7] DOI:10.1002/1097-0142(1950)3:1<32::AID-CNCR2820030106>3.0.CO;2-3 ·doi:10.1002/1097-0142(1950)3:1<32::AID-CNCR2820030106>3.0.CO;2-3
[8] DOI:10.1002/bimj.200410135·doi:10.1002/bimj.200410135
[9] 内政部:10.7326/0003-4819-122-5-199503010-00007·doi:10.7326/0003-4819-122-5-199503010-00007
[10] 内政部:10.1177/001316446002000104·doi:10.1177/001316446002000104
[11] Fleiss,《比率和比例的统计方法》(1981年)
[13] DOI:10.1093/生物信息学/bti033·doi:10.1093/bioinformatics/bti033
[14] Wickens,《社会科学多路列联表分析》(1989)·兹比尔0721.62116
[15] DOI:10.1016/j.compbiochem.2004.09.006·Zbl 1088.92017年 ·doi:10.1016/j.compbiochem.2004.09.006
[16] 耶茨,《现代信息检索》(1999)
[17] Mitchell,机器学习(1997)
[19] 良好的理性决策,J.R.Stat.Soc.系列B 14第107页–(1952年)
[20] 内政部:10.1093/bjps/19.2.123·doi:10.1093/bjps/19.2.123
[21] 内政部:10.1007/s10994-007-5011-0·Zbl 1470.62082号 ·doi:10.1007/s10994-007-5011-0
[24] DOI:10.1016/j.patrec.2005.10.010·doi:10.1016/j.patrec.2005.10.010
[25] DOI:10.1016/S0031-3203(96)00142-2·doi:10.1016/S0031-3203(96)00142-2
[26] DOI:10.10109/TPAMI.277.7740·doi:10.1109/TPAMI.2007.70740
[27] 内政部:10.1007/s10994-009-5119-5·Zbl 1470.62085号 ·doi:10.1007/s10994-009-5119-5
[28] 数字对象标识码:10.1002/sim.3859·数字对象标识代码:10.1002/sim.3859
[31] DOI:10.1023/A:10101920819831·Zbl 1007.68180号 ·doi:10.1023/A:1010920819831
[35] DOI:10.1023/A:100760115854·Zbl 0969.68126号 ·doi:10.1023/A:100760115854
[36] 内政部:10.1007/s10994-006-8199-5·doi:10.1007/s10994-006-8199-5
[37] Japkowicz,基于投影的分类器性能评估框架,讲义计算。科学。5211第548页–(2008年)·doi:10.1007/978-3-540-87479-9_54
[39] 内政部:10.1016/S0001-2998(78)80014-2·doi:10.1016/S0001-2998(78)80014-2
[40] DOI:10.1148/放射学.148.3.6878708·doi:10.1148/放射学.148.3.6878708
[41] 内政部:10.1126/科学3287615·Zbl 1226.92048号 ·doi:10.1126/科学.3287615
[43] 船级规则的编制和评估(1997年)·Zbl 0997.62500号
[44] 内政部:10.1111/1467-9574.00153·Zbl 1075.62646号 ·doi:10.1111/1467-9574.00153
[45] Sokolova,Beyond accuracy,F-score and ROC:A family of discriminant measures for performance evaluation,AI 2006,演讲笔记计算。科学。4304页1015–(2006)
[46] DOI:10.1016/j.ipm.2009.03.002·doi:10.1016/j.ipm.2009.03.002
[47] Bishop,模式识别神经网络(1995)
[48] 哈雷尔,《回归建模策略:线性模型、物流回归和生存分析的应用》(2001年)·Zbl 0982.62063号
[49] 里普利,模式识别和神经网络(1996)·Zbl 0853.62046号
[50] Hernández-Orallo,《性能指标的统一视图:将阈值选择转化为预期分类损失》,J.Mach。学习。第13号决议第2813页–(2012年)·Zbl 1436.62260号
[52] Labatut,分类器比较的性能度量评估,普适计算。Commun公司。J.6第21页–(2011年)
[54] Witten,《数据挖掘:实用机器学习工具和技术》(2005)
[55] 数字对象标识码:10.1007/s10994-008-5070-x·doi:10.1007/s10994-008-5070-x
[56] DOI:10.1175/1520-0493(1950)078<0001:VOFEIT>2.0.CO;2 ·doi:10.1175/1520-0493(1950)078<0001:VOFEIT>2.0.CO;2
[57] UCI机器Learninghttp://mlearn/MLRepository.html
[58] 昆兰,C4.5:机器学习课程(1993)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。