×

知道什么不重要:利用不相关数据的遗漏。 (英语) Zbl 0904.68141号

摘要:当训练数据包含完全指定的标记样本时,大多数学习算法最有效。然而,在许多诊断任务中,数据将仅包括某些属性的值;我们将其建模为一个阻止过程,向学习者隐藏这些属性的值。虽然删除关键属性值的拦截器可能会妨碍学习者,但本文将重点放在只删除条件无关属性值的拦截器上,即给定其他未阻止属性的值,不需要对实例进行分类的值。我们首先激励并形式化了这个“多余值阻塞”模型,然后通过证明在一般PAC模型中似乎很难学习的某些类(即决策树和DNF公式)在这种情况下很难学习,证明了这些遗漏是有用的。然后,我们将该模型扩展到处理(1)理论修正(即修改现有公式);(2) 偶尔包含多余值或排除所需值的拦截器;以及(3)训练数据的其他损坏。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68宽10 计算机科学中的并行算法

软件:

4.5条
PDF格式 BibTeX公司 XML格式 引用
全文: 内政部

参考文献:

[1] Angluin,D.,《计算学习理论:调查与精选书目》,(第24届美国计算机学会计算机理论研讨会论文集(1992年),美国计算机学会出版社:美国计算机学会纽约出版社),351-369
[2] Blum,A.,在无限属性空间中学习布尔函数,机器学习,9,4,373-386(1992)·Zbl 0766.68108号
[3] Blum,A。;Hellerstein,L。;Littlestone,N.,《有限或无限多无关属性存在下的学习》,J.Compute。系统科学。,50, 1, 32-40 (1995) ·Zbl 0826.68100号
[4] 布雷曼,L。;弗里德曼,J。;Olshen,J。;Stone,C.(分类和回归树(1984),Wadsworth和Brooks:WadsworthandBrooks-Monterey,CA)·Zbl 0541.62042号
[5] Chernoff,H.,《基于观测值和的假设检验的渐近效率度量》,《数学年鉴》。统计人员。,23, 493-507 (1952) ·Zbl 0048.11804号
[6] 埃伦菲赫特,A。;Haussler,D.,从随机示例中学习决策树,Inform。和计算。,82, 231-246 (1989) ·Zbl 0679.68157号
[7] 高盛公司。;Mathias,H.D.,《教聪明的学习者》,J.Compute。系统科学。,52, 2, 255-267 (1996) ·Zbl 1152.68451号
[8] 高盛公司。;Sloan,R.A.,PAC学习算法能容忍随机属性噪声吗?,算法,14,1(1995)·Zbl 0837.68094号
[9] Greiner,R.,《理论修正的复杂性》(Proceedings IJCAI-95)。《美国魁北克省蒙特利尔市IJCAI-95会议记录》(1995年)·Zbl 0996.68068号
[10] 格雷纳,R。;格罗夫,A。;Kogan,A.,《利用不相关数据的遗漏》(第13届国际机器学习会议论文集。第13届意大利巴里国际机器学习大会论文集(1996),Morgan Kaufmann:Morgan Koufmann Los Altos,CA)·Zbl 0904.68141号
[11] Haussler,D。;卡恩斯,M。;利特斯通,N。;Warmuth,M.K.,多项式可学习性模型的等价性,Inform。和计算。,95, 2, 129-161 (1991) ·Zbl 0743.68115号
[12] 约翰·G·H。;Kohavi,R。;Pfleger,K.,《无关特征和子集选择问题》(Proceedings 11th International Machine Learning Conference),第11届国际机器学习会议论文集,新泽西州新不伦瑞克(1994),Morgan Kaufmann:Morgan Koufmann Los Altos,CA),121-129
[13] 卡恩斯,M。;Li,M.,《恶意错误中的学习》,SIAM J.Compute。,22, 807-837 (1993) ·Zbl 0789.68118号
[14] 卡恩斯,M。;李,M。;皮特·L。;Valiant,L.,《关于布尔公式的可学习性》,(第19届计算理论研讨会论文集,第19届计算机理论研讨会论文集中,纽约(1987)),285-295
[15] 卡恩斯,M。;Mansour,Y。;罗恩·D。;罗宾菲尔德。;夏皮雷,R。;Sellie,L.,《关于离散分布的可学习性》,(第26届ACM计算理论研讨会论文集。第26届APM计算理论会议论文集,魁北克省蒙特利尔(1994)),273-282·Zbl 1345.68252号
[16] M.J.卡恩斯。;夏皮雷,R.E。;Sellie,L.M.,《走向有效的不可知论学习》(Proceedings 5th Annual Workshop on Computed Learning Theory(1992),美国计算机学会出版社:美国计算机学会纽约出版社),341-352
[17] Kushilevitz,E。;Roth,D.,《关于学习视觉概念和DNF公式》(计算学习理论第六届年度研讨会论文集。计算学习理论论文集第六届年会论文集,加州圣克鲁斯(1993),ACM出版社:纽约ACM出版社),317-326
[18] 兰利,P。;Drastal,G。;巴拉特·拉奥,R。;Greiner,R.,《故障层次理论修正》,(第五届诊断原理国际研讨会论文集(DX-94)。第五届诊断原理国际研讨会论文集(DX-94),纽约州纽帕尔茨(1994)
[19] Little,J.A。;Rubin,D.B.(缺失数据的统计分析(1987),Wiley:Wiley New York)·Zbl 0665.62004号
[20] Littestone,N.,《当不相关属性大量存在时快速学习:一种新的线性阈值算法》,《机器学习杂志》,第2285-318页(1988年)
[21] Littlestone,N.,使用Winnow的冗余噪声属性、属性错误和线性阈值学习,(计算学习理论第四届年度研讨会论文集(1991),Morgan Kaufmann:Morgan Koufmann San Mateo,CA),147-156
[22] 马哈德万,S。;Tadepalli,P.,使用PAC学习模型量化先验知识,机器学习,17,69-105(1994)
[23] Mooney,R.,《理论修正的初步PAC分析》(Petsche,T.;Hanson,S.,《计算学习理论和自然学习系统第三届年度研讨会论文集》(CLNL-92)(1994年),麻省理工学院出版社:麻省理学学院出版社剑桥,MA)
[24] 麻格尔顿,S。;Buntine,W.,《通过反转决议实现一阶谓词的机器发明》,(第五届机器学习国际会议论文集。第五届国际机器学习会议论文集,密歇根州安娜堡(1988),Morgan Kaufmann:Morgan Koufmann Los Altos,CA),339-351
[25] Ourston,D。;Mooney,R.J.,《改变规则:理论完善的综合方法》(Proceedings AAAI-90)。AAAI-90诉讼,马萨诸塞州波士顿(1990),815-820
[26] 波特,B.W。;Bareiss,R。;Holte,R.C.,《弱理论领域的概念学习和启发式分类》,人工智能,45,1-2,229-263(1990)
[27] Quinlan,J.R.,(C4.5:机器学习程序(1992),Morgan Kaufmann:Morgan Koufmann-San Mateo,CA)
[28] Rivest,R.L.,学习决策列表,机器学习,2,3,229-246(1987)
[29] Ruberg,K。;科尼克,S.M。;James,K.A.,《House calls:构建和维护诊断规则库》(《基于知识的系统研讨会第三届知识获取会议论文集》(1988年))
[30] Russell,S.,(《类比和归纳法中知识的使用》(1989),Morgan Kaufmann:Morgan Koufmann Los Altos,CA)·Zbl 0733.68079号
[31] 舒尔曼斯,D。;Greiner,R.,(《学习分类不完整示例》(1997),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥),第6章
[32] 舒尔曼斯,D。;Greiner,R.,《学习默认概念》,(第十届加拿大人工智能会议论文集。第十届加拿大人人工智能会议文献集,阿尔伯塔省班夫(1994)),519-523
[33] 沙克尔福德,G。;Volper,D.,Learning\(k\)-DNF with noise in the attributes,(计算学习理论第二届年度研讨会论文集(1988),Morgan Kaufmann:Morgan Koufmann Los Altos,CA),97-103
[34] 沙夫利克,J.W。;Dietterich,T.G.(《机器学习读物》(1990),Morgan Kaufmann:Morgan Koufmann Los Altos,CA)
[35] Towell,G.,《符号知识和神经网络:插入、提炼和提取》(威斯康星大学:威斯康星-麦迪逊大学,1991年)
[36] Turny,P.D.,《成本敏感分类:混合遗传决策树归纳算法的实证评估》,J.Artif。智力。研究,2369-409(1995)
[37] Valiant,L.G.,《可学习理论》,ACM委员会,27,11,1134-1142(1984)·Zbl 0587.68077号
[38] Wogulis,J。;Pazzani,M.J.,《评估理论修正系统的方法:与Audrey II的结果》,(《国际期刊汇编》第93期)。法国尚伯里(1993),《国际商会会刊-93》(Proceedings IJCAI-93),1128-1134
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。