×

分析IJCNN 2007不可知论学习与先前知识挑战。 (英语) Zbl 1254.68207号

总结:我们为IJCNN 2007组织了一次挑战,以评估机器学习中先前领域知识的附加值。大多数商业数据挖掘程序接受以表格形式预先格式化的数据,每个示例都被编码为线性特征向量。是否值得花费时间将领域知识纳入功能构建或算法设计中,或者直接处理简单低级功能的离线程序是否比熟练的数据分析师做得更好?为了回答这些问题,我们使用两种数据表示形式格式化了五个数据集。“先验知识”轨道的参与者使用原始数据,充分了解数据表示的含义。相反,“不可知论学习”轨道的参与者使用预先格式化的数据表,不知道特征的身份。结果表明,使用相对简单特征的黑盒方法工作得很好,并且可以快速达到最佳性能。先验知识轨道上的获胜者使用了特征提取策略,产生了大量的低层特征。以通用编码/平滑方法的形式合并先验知识以利用数据中的规则是有益的,但在特征构建中合并实际的领域知识非常耗时,很少会带来显著的改进。AL vs.PK挑战网站仍然开放供挑战后提交:不可知论.inf.ethz.ch/.

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Azencott,C.A.、Ksikes,A.、Swamidass,S.J.、Chen,J.H.、Ralaivola,L.和Baldi,P.(2007)。用于虚拟筛选和物理、化学和生物特性预测的一到四维内核。化学杂志。信息模型。http://pubs3.acs.org/acs/journals/doilookup?in_doi=10.1021/ci600397pAzencott,C.A.、Ksikes,A.、Swamidass,S.J.、Chen,J.H.、Ralaivola,L.和Baldi,P.(2007)。用于虚拟筛选和物理、化学和生物特性预测的一到四维内核。化学杂志。信息模型。http://pubs3.acs.org/acs/journals/doilookup?in_doi=10.1021/ci600397p
[2] Baldi,P.,《生物信息学:机器学习方法》(2001年),麻省理工学院出版社:马萨诸塞州坎布里奇·Zbl 0992.92024号
[3] Bekkerman,R.、El-Yaniv,R.,Tishby,N.和Winter,Y.(2003)。分布词簇与文本分类词。代码可在网址:http://www.cs.technion.ac.il/ronb/;Bekkerman,R.、El-Yaniv,R.,Tishby,N.和Winter,Y.(2003)。分布词簇与文本分类词。代码可在网址:http://www.cs.technion.ac.il/朗布/·Zbl 1102.68528号
[4] Blackard,J.A.和Dean,D.J.(1998年)。森林覆盖类型。http://kdd.ics.uci.edu/databases/convertype/convertype.htmlBlackard,J.A.和Dean,D.J.(1998年)。森林覆盖类型。http://kdd.ics.uci.edu/databases/convertype/convertype.html
[5] Boulé,M.,选择性朴素贝叶斯分类器的基于压缩的平均,JMLR,1659-1685(2007)·兹比尔1222.62035
[6] Boullé,M.,不可知论学习与先验知识挑战中数据网格模型的初步实验报告,(Proc.IJCNN07(2007),INNS/IEEE)
[7] 考利,G.C。;Talbot,N.L.C.,《不可知学习与内核机器设计中的先验知识》(Proc.IJCNN07(2007),INNS/IEEE)
[8] 考利,G.C。;Talbot,N.L.C.,使用贝叶斯正则化防止模型选择过程中的过度拟合,JMLR,8,841-861(2007)·Zbl 1222.68160号
[9] Collins,J.M.副总监。(1999年)。DTP艾滋病抗病毒筛选程序。http://dtp.nci.nih.gov/docs/aids/aids_data.htmlCollins,J.M.副总监。(1999年)。DTP艾滋病抗病毒筛选程序。http://dtp.nci.nih.gov/docs/aids/aids_data.html
[10] Escalante,H.J.(2007)。粒子群模型选择。JMLR公司Escalante,H.J.(2007)。粒子群模型选择。JMLR公司
[11] Escalante,H.J。;蒙特斯,M。;Sucar,L.E.,《神经网络PSMS:IJCNN 2007不可知论与先验知识挑战的结果》(Proc.IJCNN07(2007),INNS/IEEE)
[12] Guyon,I.(2005)。不可知学习与先前知识竞争的数据集。技术报告http://clopinet.com/isabelle/Projects/agnostic/Dataset.pdfGuyon,I.(2005)。不可知学习与先前知识竞争的数据集。技术报告http://clopinet.com/isabelle/Projects/agnostic/Dataset.pdf
[13] 盖恩,I。;Gunn,S。;Ben-Hur,A。;Dror,G.,《nips 2003特征选择挑战的结果分析》,(Saul,L.K.;Weiss,Y.;Bottou,L..,《神经信息处理系统的进展》,第17卷(2005),麻省理工学院出版社:麻省理学院出版社剑桥,马萨诸塞州),545-552,http://books.nips.cc/papers/files/nips17/NIPS2004_0194.pdf
[14] Guyon,I.、Saffari,A.、Dror,G.和Buhmann,J.(2006)。性能预测挑战。IEEE/INNS会议IJCNN 2006Guyon,I.、Saffari,A.、Dror,G.和Buhmann,J.(2006)。性能预测挑战。IEEE/INNS会议IJCNN 2006
[15] 盖恩,I。;Saffari,A。;Dror,G。;Cawley,G.,《不可知论与先验知识挑战》(Proc.IJCNN07(2007),INNS/IEEE)·兹比尔1254.68207
[16] Kohavi,R.和Becker,B.(1994年)。成人数据库。ftp://ftp.ics.uci.edu/pub/machine-learning-databases/成人/Kohavi,R.和Becker,B.(1994年)。成人数据库。ftp://ftp.ics.uci.edu/pub/machine-learning-databases/成人/
[17] LeCun,Y.和Cortes,C.(1998年)。手写数字的MNIST数据库。http://yann.lecun.com/exdb/mnist/LeCun,Y.和Cortes,C.(1998年)。手写数字的MNIST数据库。http://yann.lecun.com/exdb/mnist/
[18] Lutz,R.W.(2006)。Logitboost和树应用于WCCI 2006性能预测挑战数据集。程序。IJCNN06型网址:http://stat.ethz.ch/lutz/publ/WCCIlogitboost.php;Lutz,R.W.(2006)。Logitboost和树应用于WCCI 2006性能预测挑战数据集。程序。IJCNN06型网址:http://stat.ethz.ch/lutz/publ/WCCIlogitboost.php
[19] Mitchell,T.(1999)。20新闻组数据集。http://kdd.ics.uci.edu/databases/20newsgroups/20newsproups.htmlMitchell,T.(1999)。20新闻组数据集。http://kdd.ics.uci.edu/databases/20newsgroups/20newsproups.html
[20] Nikulin,V.,《随机集和增强的非旋转分类》(Proc.IJCNN07(2007),INNS/IEEE)
[21] Pranckeviciene,E。;Somorjai,R。;Tran,M.N.,线性规划SVM与最新分类器相结合的特征/模型选择:我们可以从数据中了解什么,(Proc.IJCNN07(2007),INNS/IEEE)
[22] Reunanen,J.,《使用交叉索引进行模型选择和评估》(Proc.IJCNN07(2007),INNS/IEEE)
[23] Reunanen,J.(2007)。恢复替换错误有助于指导特征选择。JMLR公司Reunanen,J.(2007)。恢复替换错误有助于指导特征选择。JMLR公司
[24] Saffari,A.和Guyon,I.(2006年)。CLOP快速入门指南。技术报告http://ymer.org/research/files/clop/QuickStartV1.0.pdfSaffari,A.和Guyon,I.(2006年)。CLOP快速入门指南。技术报告http://ymer.org/research/files/clop/QuickStartV1.0.pdf
[25] Simard,P。;斯坦克劳斯,D。;Platt,J.,《卷积神经网络应用于可视文档分析的最佳实践》,(文件分析和识别国际会议(2003),IEEE计算机学会:IEEE计算机协会洛斯阿拉米托斯),958-962
[26] Weston,J.、Elisseeff,A.、Bakir,G.和Sinz,F.(2005)。蜘蛛机器学习工具箱。http://www.kyb.tuebingen.mpg.de/bs/people/spider/Weston,J.、Elisseeff,A.、Bakir,G.和Sinz,F.(2005)。蜘蛛机器学习工具箱。http://www.kyb.tuebingen.mpg.de/bs/people/spider/
[27] Wichard,J.,《分类器集成的不可知学习》(Proc.IJCNN07(2007),INNS/IEEE)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。