×

学习贝叶斯网络分类器:在部分有向非循环图空间中搜索。 (英语) Zbl 1101.68710号

摘要:人们普遍认为,学习无限制类型贝叶斯网络的算法,特别是基于分数+搜索范式的算法,不适合构建基于竞争贝叶斯网的分类器。自那时以来,已经开发了几种专门的算法,用于搜索不同类型的有向非循环图(DAG)拓扑,其中大多数是Naive Bayes基本拓扑的扩展(使用增广弧)或修改。本文提出了一种新的基于贝叶斯网络的分类器诱导算法,即使使用标准的评分函数,该算法也能获得良好的结果。该方法在空间中执行简单的局部搜索,与不受限制或增强的DAG不同。我们的搜索空间由一类部分有向无环图组成,它结合了DAG等价的两个概念:分类等价和独立等价。详尽的实验结果表明,该方法可以与最新的分类算法竞争。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acid,S.和de Campos,L.M.(2001)。学习信念网络的混合方法:Benedict。国际近似推理杂志,27235-262·Zbl 0983.68197号 ·doi:10.1016/S0888-613X(01)00041-X
[2] Acid,S.和de Campos,L.M.(2003)。在限制非循环部分有向图空间中搜索贝叶斯网络结构。《人工智能研究杂志》,第18445–490页·Zbl 1056.68142号
[3] Aliferis,C.F.、Tsamardinos,I.和Statnikov,A.(2003)。HITON:一种用于最优变量选择的新型马尔可夫覆盖算法。《2003年美国医学信息学协会会刊》(第21-25页)。
[4] Blake,C.L.和Merz,C.J.(1998年)。机器学习数据库的UCI知识库。http://www.ics.uci.edu/learn/MLRepository.html加州大学欧文分校信息与计算机科学系。
[5] Cheng,J.和Greiner,R.(1999)。比较贝叶斯网络分类器。《第十五届人工智能不确定性会议记录》(第101-108页)。
[6] Cheng,J.、Greiner,R.、Kelly,J.,Bell,D.A.和Liu,W.(2002年)。从数据中学习贝叶斯网络:一种基于信息理论的方法。人工智能,137,43-90·Zbl 0995.68114号 ·doi:10.1016/S0004-3702(02)00191-1
[7] Chickering,D.M.(1996)。学习贝叶斯网络结构的等价类。《第十二届人工智能不确定性大会论文集》(第150–157页)。
[8] Chickering,D.M.(2002)。学习贝叶斯网络结构的等价类。机器学习研究杂志,2445–498·Zbl 1007.68179号 ·doi:10.1162/1532443027600696
[9] Chow,C.和Liu,C.(1968年)。用依赖树逼近离散概率分布。IEEE信息理论汇刊,14,462–467·Zbl 0165.22305号 ·doi:10.1109/TIT.1968.1054142
[10] Cooper,G.F.和Herskovits,E.(1992年)。从数据中归纳概率网络的贝叶斯方法。机器学习,9309–348·Zbl 0766.68109号
[11] de Campos,L.M.和Huete,J.F.(2000)。使用独立标准学习信念网络的新方法。国际近似推理杂志,24,11-37·Zbl 0995.68109号 ·doi:10.1016/S0888-613X(99)00042-0
[12] Domingos,P.和Pazzani,M.J.(1997年)。简单贝叶斯分类器在零损失下的最优性。机器学习,29,103–130·Zbl 0892.68076号 ·doi:10.1023/A:1007413511361
[13] 埃尔维拉财团。(2002). Elvira:概率图形模型环境。《第一届欧洲概率图形模型研讨会论文集》(第222–230页)。
[14] Ezawa,K.、Singh,M.和Norton,S.(1996年)。面向电信风险管理的学习目标贝叶斯网络。《第十三届机器学习国际会议论文集》(第139-147页)。
[15] Fayyad,U.M.和Irani,K.B.(1993年)。用于分类学习的连续值属性的多值区间离散化。《第十三届国际人工智能联合会议记录》(第1022-1027页)。
[16] Frey,L.、Fisher,D.、Tsamardinos,I.、Aliferis,C.F.和Statnikov,A.(2003)。用决策树归纳法识别马尔可夫覆盖层。在第三届IEEE数据挖掘国际会议论文集(第59–66页)。
[17] Friedman,N.、Geiger,D.和Goldszmidt,M.(1997)。贝叶斯网络分类器。机器学习,29131-163·Zbl 0892.68077号 ·doi:10.1023/A:1007465528199
[18] 很好,I.J.(1965)。概率的估计。剑桥:麻省理工学院出版社·Zbl 0168.39603号
[19] Hand,D.J.(1981)。歧视和分类。威利·Zbl 0587.62119号
[20] Heckerman,D.、Geiger,D.和Chickering,D.M.(1995)。学习贝叶斯网络:知识和统计数据的结合。机器学习,20197-243·Zbl 0831.68096号
[21] John,G.H.和Kohavi,R.(1994年)。无关特征和子集选择问题。第十一届机器学习国际会议论文集(第121-129页)。
[22] Keogh,E.和Pazzani,M.(2002年)。学习增强贝叶斯分类器。国际人工智能工具杂志,11587–601·doi:10.1142/S0218213002001052
[23] Kohavi,R.(1995)。精度估计和模型选择的交叉验证和引导研究。《第十四届国际人工智能联合会议记录》(第1137-1143页)。
[24] Kohavi,R.和John,G.H.(1997年)。特征子集选择的包装器。人工智能,97273–324·Zbl 0904.68143号 ·doi:10.1016/S0004-3702(97)00043-X
[25] Kohavi,R.、John,G.H.、Long,R.,Manley,D.和Pfleger,K.(1994年)。MLC++:C++中的机器学习库。《第六届人工智能工具国际会议论文集》(第740-743页)。
[26] Koller,D.和Sahami,M.(1996年)。朝向最佳特征选择。《第十三届机器学习国际会议论文集》(第284–292页)。
[27] Kononenko,I.(1991年)。半主动贝叶斯分类器。《第二届数据库知识发现国际会议论文集》(第206-219页)。
[28] Lam,W.和Bacchus,F.(1994年)。学习贝叶斯信念网络。基于MDL原则的方法。计算智能,10269–293·文件编号:10.1111/j.1467-8640.1994.tb00166.x
[29] Langley,P.、Iba,W.和Thompson,K.(1992年)。贝叶斯分类器分析。《全国人工智能会议记录》(第223-228页)。
[30] Langley,P.和Sage,S.(1994年)。选择性贝叶斯分类器的归纳。《第十届人工智能不确定性会议论文集》(第399-406页)。
[31] Lucas,P.(2002)。受限贝叶斯网络结构学习。《概率图形模型第一届欧洲研讨会论文集》(第117-126页)。
[32] Pazzani,M.J.(1995年)。在贝叶斯分类器中搜索依赖项。统计学课堂讲稿,112239-248。
[33] Pearl,J.(1988)。智能系统中的概率推理。加利福尼亚州旧金山:Morgan Kaufmann·Zbl 0649.68104号
[34] Pearl,J.和Verma,T.S.(1990年)。因果模型的等效性和综合。《第六届人工智能不确定性会议论文集》(第220-227页)。
[35] Sahami,M.(1996年)。学习有限依赖贝叶斯分类器。《第二届知识发现和数据挖掘国际会议论文集》(第335–338页)。
[36] Sierra,B.和Larrañaga,P.(1998年)。使用遗传算法自动诱导的贝叶斯网络预测恶性皮肤黑色素瘤的存活率。不同方法之间的实证比较。医学中的人工智能,14,215–230·doi:10.1016/S0933-3657(98)00024-4
[37] Singh,M.和Provan,G.M.(1996年)。选择性贝叶斯网络分类器的有效学习。《第十三届机器学习国际会议论文集》(第453-461页)。
[38] Spirtes,P.、Glymour,C.和Scheines,R.(1993年)。因果、预测和搜索。统计学课堂讲稿81。纽约:施普林格出版社·兹比尔0806.62001
[39] Zhang,N.L.、Nielsen,T.D.和Jensen,F.V.(2004)。分类模型中的潜在变量发现。医学中的人工智能,30283-299·doi:10.1016/j.artmed.2003.11.004
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。