×

使用层次朴素贝叶斯模型进行分类。 (英语) Zbl 1110.68130号

分类问题在机器学习文献中由来已久。朴素贝叶斯模型是最简单但性能最稳定的分类器之一。然而,这些分类器的一个固有问题是,假设用于描述实例的所有属性在给定该实例的类的情况下都是条件独立的。当违反这一假设时(实际上经常如此),由于“信息重复计数”和交互遗漏,可能会降低分类准确性。
在本文中,我们关注一组相对较新的模型,称为层次朴素贝叶斯模型。分层朴素贝叶斯模型通过引入潜在变量来放松这些模型中的一些独立性陈述,从而扩展了朴素贝叶斯模型的建模灵活性。我们提出了一种简单的算法来学习分类背景下的层次朴素贝叶斯模型。实验结果表明,与其他框架相比,学习后的模型能够显著提高分类精度。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Binder,J.、Koller,D.Russell,S.和Kanazawa,K.(1997年)。具有隐藏变量的自适应概率网络。机器学习,29:2–3,213–244·Zbl 0892.68079号 ·doi:10.1023/A:1007421730016
[2] Blake,C.和Merz,C.(1998年)。机器学习数据库的UCI存储库。http://www.ics.uci.edu/mlearn/MLRepository.html
[3] Boutiler,C.、Friedman,N.、Goldszmidt,M.和Koller,D.(1996)。贝叶斯网络中特定上下文的独立性。摘自:第十二届人工智能不确定性会议论文集。加利福尼亚州旧金山(第115-123页),摩根考夫曼出版社。
[4] Chow,C.K.和Liu,C.(1968年)。用依赖树逼近离散概率分布。IEEE信息理论汇刊,14,462–467·Zbl 0165.22305号 ·doi:10.1109/TIT.1968.1054142
[5] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会杂志。B系列39,1–38·Zbl 0364.62022号
[6] Domingos,P.和Pazzani,M.(1997年)。简单贝叶斯分类器在零损失下的最优性。机器学习,29:2–3,103–130·Zbl 0892.68076号 ·doi:10.1023/A:1007413511361
[7] Duda,R.O.和Hart,P.E.(1973年)。模式分类和场景分析。纽约:John Wiley&Sons·Zbl 0277.68056号
[8] Elidan,G.和Friedman,N.(2001年)。学习隐藏变量的维度。摘自:第十七届人工智能不确定性会议记录。加利福尼亚州旧金山(第144-151页),摩根考夫曼出版社。
[9] Fayyad,U.M.和Irani,K.B.(1993年)。用于分类学习的连续值属性的多区间离散化。摘自:第十三届国际人工智能联合会议记录。圣马特奥。加利福尼亚州(第1022-1027页),摩根考夫曼出版社。
[10] Friedman,J.H.(1997)。关于偏差、方差、0/1损失和维度诅咒。数据挖掘和知识发现,1:1,55–77。
[11] Friedman,N.、Geiger,D.和Goldszmidt,M.(1997)。贝叶斯网络分类器。机器学习,29:2–3,131–163·Zbl 0892.68077号 ·doi:10.1023/A:1007465528199
[12] Greiner,R.、Grove,A.J.和Schuurmans,D.(1997年)。学习性能良好的贝叶斯网。收录于:《第十三届人工智能不确定性大会论文集》。加利福尼亚州旧金山(第198-207页),摩根考夫曼出版社。
[13] Grossman,D.和Domingos,P.(2004)。通过最大化条件似然学习贝叶斯网络分类器。收录:第二十届机器学习国际会议论文集。加拿大班夫,(第361-368页),ACM出版社。
[14] Jaeger,M.(2003)。概率分类器及其识别的概念。摘自:第二十届机器学习国际会议论文集。Menlo Park,(第266–273页),AAAI出版社。
[15] Jensen,F.V.(2001)。贝叶斯网络和决策图。纽约州纽约市:Springer-Verlag·Zbl 0973.62005号
[16] Kohavi,R.(1995)。精度估计和模型选择的交叉验证和引导研究。摘自:第十四届国际人工智能联合会议记录。加利福尼亚州圣马特奥(第1137-1143页),摩根·考夫曼出版社。
[17] Kohavi,R.、John,G.、Long,R.,Manley,D.和K.Pfleger。(1994). MLC++:C++中的机器学习库。摘自:第六届人工智能工具国际会议论文集。(第740-743页),IEEE计算机学会出版社。
[18] Kohavi,R.和John,G.H.(1997年)。特征子集选择的包装器。人工智能,97:1–2,273–324·Zbl 0904.68143号 ·doi:10.1016/S0004-3702(97)00043-X
[19] Kononenko,I.(1991)。半主动贝叶斯分类器。摘自:第六届欧洲学习工作会议记录。葡萄牙波尔图(第206-219页),斯普林格-Verlag。
[20] Kočka,T.和Zhang,N.L.(2002年)。层次潜在类模型的维数修正。摘自:第十八届人工智能不确定性会议记录。旧金山。加利福尼亚州(第267-274页),摩根考夫曼出版社。
[21] Lam,W.和Bacchus,F.(1994年)。学习贝叶斯信念网络:一种基于MDL原理的方法。计算智能,10:4269-293·文件编号:10.1111/j.1467-8640.1994.tb00166.x
[22] Langley,P.(1993)。递归贝叶斯分类器的归纳。摘自:《第四届欧洲机器学习会议论文集》,《人工智能讲稿》第667卷。(第153-164页),斯普林格·弗拉格·Zbl 0789.30019号
[23] Langley,P.(1994年)。机器学习中相关特征的选择。摘自:AAAI秋季相关性研讨会论文集。AAAI出版社。
[24] Lauritzen,S.L.和Spiegelhalter,D.J.(1988)。图形结构上概率的局部计算及其在专家系统中的应用。英国皇家统计学会杂志。B系列,50:2157-224·Zbl 0684.68106号
[25] Madsen,A.L.和Jensen,F.V.(1998年)。接合树中的延迟传播。摘自:第十四届人工智能不确定性会议论文集。(第362-369页)。摩根考夫曼出版社。
[26] Martin,J.D.和VanLehn,K.(1994年)。离散因子分析:学习贝叶斯网络中的隐藏变量。技术报告LRDC-ONR-94–1,匹兹堡大学计算机科学系。http://www.pitt.edu/vanlehn/distrib/Papers/Martin.pdf
[27] Mitchell,T.M.(1997)。机器学习。马萨诸塞州波士顿:McGraw Hill·Zbl 0913.68167号
[28] Nadeau,C.和Bengio,Y.(2003年)。泛化错误的推断。机器学习,52:3239-281·兹比尔1039.68104 ·doi:10.1023/A:1024068626366
[29] Ng,A.Y.和Jordan,M.I.(2002年)。区分性分类器与生成性分类器:逻辑回归与朴素贝叶斯的比较。主题:神经信息处理系统进展15。温哥华。加拿大不列颠哥伦比亚省,(第841-848页),麻省理工学院出版社。
[30] Pazzani,M.(1996年a)。在贝叶斯分类器中搜索相关性。摘自:《从数据中学习:人工智能与统计V.纽约》(第239-248页)。
[31] Pazzani,M.J.(1996b),笛卡尔产品属性的构造归纳。ISIS:科学中的信息、统计和归纳。新加坡,(第66-77页),《世界科学》。
[32] Pearl,J.(1988)。智能系统中的概率推理:合理推理网络。加利福尼亚州圣马特奥:摩根考夫曼出版社·Zbl 0746.68089号
[33] Quinlan,R.(1998)。C5.0:非正式教程。http://www.rulequest.com/see5-unix.html
[34] Rissanen,J.(1978年)。通过最短数据描述建模。自动化,14665-471·Zbl 0418.93079号 ·doi:10.1016/0005-1098(78)90005-5
[35] Schwarz,G.(1978年)。估算模型的维度。《统计年鉴》,第6461–464页·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
[36] Shafer,G.R.和Shenoy,P.P.(1990年)。概率传播。数学与人工智能年鉴,2327-352·Zbl 0875.68676号 ·doi:10.1007/BF01531015
[37] Spites,P.、Glymour,C.和Scheines,R.(1993)。因果关系、预测和搜索。纽约:Springer-Verlag·Zbl 0806.62001
[38] SPSS公司(2002)。克莱门廷v6.5。http://www.spss.com/clementine网站/
[39] Wettig,H.、Grunwald,P.、Roos,T.、Myllymaki,P.和Tirri,H.(2003)。当贝叶斯网络参数的判别学习很容易时。收录于:《第十八届国际人工智能联合会议论文集》。(第491-496页),摩根考夫曼出版社。
[40] Whittaker,J.(1990)。应用多元统计中的图形模型。英国奇切斯特:John Wiley&Sons·Zbl 0732.62056号
[41] Zhang,H.(2004a),朴素贝叶斯的最优性。摘自:第十七届佛罗里达人工智能研究会会议记录。(第562-567页),AAAI出版社。
[42] Zhang,N.L.(2004b),聚类分析的层次潜在类模型。机器学习研究杂志,5:6697–723·Zbl 1222.68343号
[43] Zhang,N.L.、Nielsen,T.D.和Jensen,F.V.(2003)。分类模型中的潜在变量发现。医学中的人工智能,30:3283-299·兹伯利05391210 ·doi:10.1016/j.artmed.2003.11.004
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。