×

近似最优二叉决策树。 (英语) Zbl 1236.68290号

摘要:我们给出了决策树(DT)问题的(lnn+1)-近似。DT的一个实例是一组二进制测试(T=(T_{1},dots,T_{m})和一组项目(X=(X_1},dots,X_{n}))。目标是输出一个二叉树,其中每个内部节点是一个测试,每个叶子是一个项目,树的总外部路径长度最小化。总外部路径长度是树中所有叶子深度的总和。DT在计算机科学领域有着悠久的历史,其应用范围从医学诊断到实验设计。它还推广了在偏序集中寻找最优平均情况搜索策略的问题,其中包括几个字母树问题。我们的工作将近似比的先前最佳上界减小了一个常数因子。我们对贪婪算法进行了新的分析,该算法使用一个简单的记帐方案在特定节点上拆分的成对项目之间分摊树的成本。我们的结论是,我们的上界也适用于加权测试的DT问题。

理学硕士:

68周25 近似算法
68页第10页 搜索和排序
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alekhnovich,M.、Braverman,M.,Feldman,V.、Klivans,A.R.、Pitassi,T.:可学习性和自动化。摘自:第45届计算机科学基础年度研讨会论文集,第621-630页。IEEE计算。洛斯·阿拉米托斯学院(2004)
[2] Arkin,E.M.,Meijer,H.,Mitchell,J.S.B.,Rappaport,D.,Skiena,S.:几何模型的决策树。国际期刊计算。地理。申请。8(3), 343–364 (1998) ·Zbl 1035.68521号 ·doi:10.1142/S021819599800175
[3] Carmo,R.,Donadelli,J.,Kohayakawa,Y.,Laber,E.S.:随机偏序集的搜索。理论。计算。科学。321(1), 41–57 (2004) ·Zbl 1068.68050号 ·doi:10.1016/j.tcs.2003.06.001
[4] Chakaravarthy,V.T.,Pandit,V.,Roy,S.,Awasthi,P.,Mohania,M.K.:实体识别的决策树:近似算法和硬度结果。收录于:Libkin,L.(编辑)第二十六届ACM数据库系统原理研讨会论文集,第53-62页(2007年)·Zbl 1295.68210号
[5] Feige,U.,Lovász,L.,Tetali,P.:近似最小和集覆盖。《算法》40(4),219–234(2004)·Zbl 1082.68126号 ·doi:10.1007/s00453-004-1110-5
[6] Garey,M.R.:最佳二进制识别程序。SIAM J.应用。数学。23(2), 173–186 (1972). http://www.jstor.org/stable/2099637 ·Zbl 0229.68037号 ·doi:10.1137/0123019
[7] Garey,M.R.,Graham,R.L.:二进制测试分裂算法的性能边界。Acta Inform公司。3, 347–355 (1974) ·doi:10.1007/BF00263588
[8] Garey,M.R.,Johnson,D.S.:《计算机与不可修复性:NP完全性理论指南》。弗里曼,纽约(1979)·Zbl 0411.68039号
[9] Hancock,T.、Jiang,T.,Li,M.、Tromp,J.:学习决策列表和树的下限。Inf.计算。126(2), 114–122 (1996) ·兹比尔0856.68121
[10] Heeringa,B.:改善对有组织信息的获取。马萨诸塞大学阿默斯特分校博士论文(2006)
[11] Hyafil,L.,Rivest,R.L.:构建最优二叉决策树是np完全的。信息处理。莱特。5(1), 15–17 (1976) ·兹伯利0333.68029 ·doi:10.1016/0020-0190(76)90095-8
[12] Kosaraju,S.R.,Przytycka,T.M.,Borgstrom,R.S.:关于最优分裂树问题。摘自:Dehne,F.K.H.A.,Gupta,A.,Sack,J.-R.,Tamassia,R.(编辑)第六届算法和数据结构国际研讨会,第1663卷,第157-168页(1999)·Zbl 1063.68575号
[13] Laber,E.S.,Nogueira,L.T.:关于最小高度决策树问题的硬度。离散应用程序。数学。144(1–2), 209–212 (2004). doi:10.1016/j.dam.2004.06.002·Zbl 1078.68043号 ·doi:10.1016/j.dam.2004.06.002
[14] B.M.E.莫雷特:决策树和图表。ACM计算。Surv公司。14(4), 593–623 (1982). 数字对象标识代码:10.1145/356893.356898·数字对象标识代码:10.1145/356893.356898
[15] Moshkov,M.J.:实际数据表的决策树构造贪婪算法。收录:《粗糙集汇刊》,第161-168页(2004年)·兹比尔1104.68768
[16] Munagala,K.,Babu,S.,Motwani,R.,Widom,J.:流水线集合覆盖问题。In:ICDT,第83–98页(2005年)·Zbl 1112.68373号
[17] Murthy,K.V.S.:关于从数据中生成更好的决策树。约翰霍普金斯大学博士论文(1996年)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。