×

采矿监督分类性能研究:一项荟萃分析调查。 (英语) Zbl 1260.62043号

摘要:已有许多分类方法的比较研究,其中使用实际数据集作为衡量标准来评估这些方法的相对性能。由于这些比较通常对这些方法的表现产生不确定或有限的结果,人们通常认为,结合这些研究的更广泛的方法将对这个难题有所帮助。本文描述了这样一种尝试:我们对现有文献进行了抽样,并创建了一个包含5807个分类结果的数据集。我们表明,分析结果数据的一种可能方法是对分类方法进行全面评估,并且我们提出了用于该特定目的的方法。本文讨论了这种方法的优缺点,并得出了一些结论,这些结论可能有助于未来的研究:我们认为,目前的文献状况几乎不允许进行大规模调查。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统

软件:

COSTA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] BATCHELOR,B.G.和HAND,D.J.(1976),“模式识别比赛”,《第三届模式识别国际联合会议论文集》,圣地亚哥,1976年。
[2] BERTHOLD,M.R.和DIAMOND,J.(1998),“概率神经网络的建设性训练”,神经计算,19:167–183·doi:10.1016/S0925-2312(97)00063-5
[3] BLUE,J.L.、CANDELA,G.T.、GROTHER,P.J.、CHELLAPPA,R.和WILSON,C.L.(1994),“指纹和OCR应用的模式分类器评估”,模式识别,4:485–501·doi:10.1016/0031-3203(94)90031-0
[4] 布拉德利·R.A.和特里·M.E.(1952),“不完全区组设计的秩分析:I.成对比较的方法”,生物特征分析,39:324-345·Zbl 0047.12903号
[5] BRAZDIL,P.B.、SOARES,C.和PINTO DA COSTA,J.(2003),“排名学习算法:使用IBL和元学习的准确性和时间结果”,机器学习,50:251–277·Zbl 1033.68082号 ·doi:10.1023/A:1021713901879
[6] COLLETT,D.(2002),《二进制数据建模》(第二版),伦敦:查普曼和霍尔出版社·Zbl 1041.62058号
[7] CURRAM,S.P.和MINGERS,J.(1994),“神经网络,决策树归纳和判别分析”,运筹学学会杂志,45:440-450·Zbl 0925.62233号
[8] DIETTERICH,T.G.(2000),“构建决策树集合的三种方法的实验比较:打包、提升和随机化”,机器学习,40:139–157·doi:10.1023/A:1007607513941
[9] DUIN,R.P.W.(1996),“关于比较分类器的注释”,《模式识别信件》,17:529–536·doi:10.1016/0167-8655(95)00113-1
[10] EKLUND,P.W.和HOANG,A.(2002),“公共领域监督机器学习算法的性能调查”,http://citeseer.nj.nec.com/142129.html .
[11] FISHER,R.A.(1936),“在分类学问题中使用多重测量”,优生学年鉴,7:179-188。
[12] FUKUNAGA,K.(1990),《统计模式识别导论》,圣地亚哥:学术出版社·Zbl 0711.62052号
[13] HAND,D.J.(2004),“学术痴迷和分类现实:忽视监督分类中的实用性”,载于《分类、聚类和数据挖掘应用》,编辑:B.Banks、L.House、F.R.McMorris、P.Arabie和W.Gaul,柏林:施普林格,第209–232页。
[14] HAND,D.J.(1981),《歧视与分类》,奇切斯特:威利出版社·Zbl 0587.62119号
[15] HAND,D.J.(1997),《分类规则的构建和评估》,奇切斯特:威利出版社·Zbl 0997.62500号
[16] HAND,D.J.、MANNILA,H.和SMYTH,P.(2001),《数据挖掘原理》,马萨诸塞州剑桥:麻省理工学院出版社。
[17] HASTIE,T.、TIBSHIRANI,R.和FRIEDMAN,J.(2001),《统计学习理论的要素》,纽约:斯普林格出版社·Zbl 0973.62007号
[18] HOOPER,P.M.(1999),“参考点物流分类”,《分类杂志》,16(1):91–116·Zbl 0940.62057号 ·数字标识代码:10.1007/s003579900044
[19] JAMAIN,A.(2004),“分类方法的元分析”,伦敦帝国学院数学系博士论文。
[20] JAMAIN,A.和HAND,D.J.(2005),“天真的贝叶斯之谜:一个分类侦探故事”,《模式识别快报》,26:1752-1760·doi:10.1016/j.patrec.2005.02.001
[21] KLEINBERG,E.M.(2000),“关于随机鉴别的算法实现”,IEEE模式分析和机器智能汇刊,22(5):473-490·数字对象标识代码:10.1109/34.857004
[22] LIM,T.、LOH,W.和SHIH,Y.(2000),“三十三种新旧分类算法的预测准确性、复杂性和训练时间的比较”,机器学习,40:203-228·Zbl 0969.68669号 ·doi:10.1023/A:1007608224229
[23] MCLACHLAN,G.J.(1992),判别分析和统计模式识别,纽约:Wiley·兹比尔1108.62317
[24] 金属联合会(2002),“Esprit项目金属(#26.357)”,http://www.metalkdd.org .
[25] MICHIE,D.、SPIEGELHALTER,D.J.和TAYLOR,C.C.(1994),《机器学习、神经和统计分类》,纽约:Ellis Horwood·兹伯利0827.68094
[26] MITCHELL,T.M.(1997),机器学习,纽约:McGraw-Hill·Zbl 0913.68167号
[27] RASMUSSEN,C.E.,NEAL,R.M.,HINTON,G.E.,VAN CAMP,D.,REVOW,M.,GHAHRAMANI,Z.,KUSTRA,R.和TIBSHIRANI,R..(1996),“DELVE,有效实验中评估学习的数据”,http://www.cs.toronto.edu/\(\sim\)深入/。
[28] RENDELL,L.和SESHU,R.(1990),“通过构造归纳法学习困难概念”,计算智能,6:247-270·文件编号:10.1111/j.1467-8640.1990.tb00298.x
[29] RIPLEY,B.D.(1996),模式识别和神经网络,剑桥:剑桥大学出版社·Zbl 0853.62046号
[30] SARGENT,D.J.(2001),“人工神经网络与其他统计方法的比较”,《癌症》,91:1636-42·doi:10.1002/1097-0142(20010415)91:8+<1636::AID-CNCR1176>3.0.CO;二维
[31] SCHIAVO,R.A.和HAND,D.J.(2000),“误差率研究的十年”,《国际统计评论》,68(3):295–310·Zbl 1107.62339号 ·doi:10.1111/j.1751-5823.2000.tb00332.x
[32] SOHN,S.Y.(1999),“模式识别分类算法的元分析”,IEEE模式识别和机器智能汇刊,21(11):1137–1144·数字对象标识代码:10.1109/34.809107
[33] 范德林登,W.J.和汉密尔顿,R.K.(1997),《现代项目反应理论手册》,纽约:施普林格出版社·兹比尔0872.62099
[34] WEBB,A.(2002),统计模式识别(第二版),伦敦:Arnold·Zbl 1102.68639号
[35] ZARNDT,F.(1995),“综合案例研究:机器学习和连接算法的检验”,http://citeseer.nj.nec.com/481595.html .
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。