×

基于核的机器学习在R。 (英语) Zbl 1464.62100号

概要:基于内核的机器学习方法领域的最新进展允许使用后缀数组的字符串内核快速处理文本。kernlab提供了内核方法的基础设施和大量已经实现的算法,并包括基于后缀数组的字符串内核的实现。除了使用tm提供的文本挖掘基础设施外,这些软件包还为R提供了使用内核方法处理、可视化和分组大型文本数据集合的功能。重点是在这些任务中各种类型的字符串内核的性能。

MSC公司:

62-08 统计问题的计算方法
68T05型 人工智能中的学习和自适应系统
68T50型 自然语言处理
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Schölkopf,B。;Smola,A.,《用内核学习》(2002),麻省理工学院出版社
[2] 史J。;Malik,J.,标准化切割和图像分割,IEEE模式分析和机器智能汇刊,22,8,888-905(2000)
[3] Ng,A。;乔丹,M。;Weiss,Y.,《关于谱聚类:分析和算法》,(神经信息处理系统进展,第14卷(2001年)),1-8
[4] 宋,L。;Smola,A。;Borgwardt,K。;Gretton,A.,《彩色最大方差展开》(Platt,J.C.;Koller,D.;Singer,Y.;Roweis,S.,《神经信息处理系统的进展》20(2008),麻省理工学院出版社:麻省理工学出版社,美国马萨诸塞州剑桥),1385-1392
[5] 北卡罗来纳州坎塞达。;Gaussier,E。;古特,C。;Renders,J.-M,文字序列核心,文本和图像的机器学习方法。《关于文本和图像的机器学习方法》,《机器学习研究杂志》,3,6,1059-1082(2003),(专刊)·Zbl 1061.68563号
[6] Watkins,C.,《动态对齐内核》(Smola,A.;Bartlett,P.L.;Schölkopf,B.;Schuurmans,D.,《大边界分类器的进展》(2000),麻省理工学院出版社:麻省理学出版社剑桥,MA),39-50·兹伯利0988.68145
[7] Herbrich,R.,《学习核分类器理论和算法》(2002),麻省理工学院出版社·Zbl 1504.68002号
[8] 卡拉佐格鲁,A。;Feinerer,I.,《R中带字符串核的文本聚类》,(Decker,R.;Lenz,H.-J.,《数据分析进展》(Gesellschaft füR Klassifikation e.V.第三十届年会论文集,柏林弗雷大学,2006年3月8日至10日)。《数据分析进展》(德国柏林弗雷大学第30届Gesellschaft für Klassifikation e.V.年会论文集,2006年3月8日至10日),《分类、数据分析和知识组织研究》(2007年),斯普林格-Verlag),第91-98页
[9] Usotskaya,N。;Ryabko,B.,基于马尔可夫链模型的DNA序列分析的信息理论测试应用,计算统计与数据分析,53,5,1861-1872(2009)·Zbl 1453.62223号
[10] Vishwanathan,S。;Smola,A.J.,《字符串和树匹配的快速内核》,(Schölkopf,B.;Tsuda,K.;Vert,J.P.,《计算生物学中的内核方法》(2004),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥),113-130
[11] Teo,C.H。;Vishwanathan,S.V.N.,使用后缀数组的快速和节省空间的字符串内核,(第23届机器学习国际会议论文集(2006),ACM出版社:宾夕法尼亚州匹兹堡ACM出版社),929-936
[12] 卡拉佐格鲁,A。;Smola,A。;霍尼克,K。;Zeileis,A.,kernlab-An S4软件包,R中的内核方法,统计软件杂志,11,9,1-20(2004)
[14] 费内尔,I。;霍尼克,K。;Meyer,D.,R中的文本挖掘基础设施,《统计软件杂志》,25,5,1-54(2008)
[16] 莱斯利,C.S。;Eskin,E。;韦斯顿,J。;Noble,W.S.,《支持向量机蛋白质分类的错配字符串核》(Becker,S.;Thrun,S.);Obermayer,K.,《神经信息处理系统进展》,第15卷(2002年),麻省理工学院出版社:麻省理理工学院剑桥出版社,1417-1424
[17] Lodhi,H。;桑德斯,C。;肖-泰勒,J。;北卡罗来纳州克里斯蒂亚尼尼。;Watkins,C.,使用字符串内核进行文本分类,《机器学习研究杂志》,2419-444(2002)·Zbl 1013.68176号
[18] M.I.Abouelhoda。;Kurtz,S。;Ohlebusch,E.,用增强后缀数组替换后缀树,离散算法杂志,253-86(2004)·Zbl 1115.92303号
[19] Porter,M.,后缀剥离算法,程序,33130-137(1980)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。