×

关系分类器的集合。 (英语) Zbl 1154.68496号

知识。信息系统。14,第3期,249-272(2008)。
摘要:关系分类旨在将实体之间的关系纳入分类过程,例如考虑到文档之间的关系,例如共同作者或引文。然而,考虑多个关系可以进一步提高分类精度。在这里,我们介绍了一种新的方法,利用几个关系以及关系和局部属性进行集成分类。为了实现这一点,我们提出了一个通用的关系集成模型,该模型可以使用不同的关系分类器和局部分类器作为组件。此外,我们还讨论了关系数据的几个问题的解决方案,例如异构性、稀疏性和多重关系。特别是稀疏性问题将得到更详细的讨论。我们引入了一种称为PRNMultiHop的新方法,试图处理此问题。此外,我们以系统的方式对关系方法进行分类。最后,我们提供了经验证据,证明了我们的关系集成方法优于现有的关系分类方法,甚至优于关系概率树、关系依赖网络和关系贝叶斯分类器等复杂模型。

MSC公司:

68吨10 模式识别、语音识别

软件:

网络工具包

参考文献:

[1] Angelova R,Weikum G(2006)基于图形的文本分类:向邻居学习。在:SIGIR会议记录,第485–492页
[2] Bernstein A,Clearwater S,Provost F(2003)关系向量空间模型和行业分类。在:IJCAI关于关系数据统计模型研讨会论文集,第8-18页
[3] Breiman L(1996)。装袋预测器。马赫学习24:123–140·Zbl 0858.68080号
[4] Chakrabarti S,Dom B,Indyk P(1998)使用超链接增强超文本分类。收件人:ACM SIGMOD会议记录,第307–318页
[5] Cramer H(1999)。统计学的数学方法。普林斯顿大学出版社·Zbl 0933.62047号
[6] Dietterich TG(1997)。机器学习研究:四个当前方向。AI Mag 18(4):97–136
[7] Domingos P和Pazzani M(1997年)。简单贝叶斯分类器在零损失下的最优性。马赫学习29:103–130·Zbl 0892.68076号 ·doi:10.1023/A:1007413511361
[8] Fürnkranz J(2002)超链接集合:超文本分类的案例研究。Informat Fusion,第3卷
[9] HeßA,Kushmerick N(2004)《关系数据的迭代分类:语义web服务的案例研究》。摘自:欧洲机器学习会议记录·Zbl 1132.68553号
[10] 霍普菲尔德J(1982)。具有涌现集体计算能力的神经网络和物理系统。美国国家科学院79:2554–2558·Zbl 1369.92007号 ·doi:10.1073/pnas.79.8.2554
[11] 黄Z、陈浩和曾德(2004)。应用关联检索技术缓解协同过滤中的稀疏性问题。ACM Trans Informat Syst 22(1):116–142·Zbl 05457973号 ·doi:10.1145/963770.963775
[12] Jensen D,Neville J(2002)关联和自相关导致关系学习中的特征选择偏差。摘自:第19届机器学习国际会议论文集
[13] Jensen D,Neville J,Gallagher B(2004)为什么集体推理可以改进关系分类。致:第十届ACM SIGKDD会议记录
[14] Kleinberg J(1998)超链接环境中的权威来源。附:第九届ACM-SIAM离散算法研讨会论文集·Zbl 0930.68047号
[15] Kramer S,Lavrac N,Flach P(2001)关系数据挖掘的命题方法。In:关系数据挖掘。多德雷赫特Kluwer,第262–291页
[16] 卢Q,Getoor L(2003)基于链接的文本分类。In:IJCAI文本挖掘和链接分析研讨会论文集
[17] Macskassy AS,Provost F(2003)简单关系分类器。In:多关系数据挖掘研讨会ACM SIGKDD会议记录
[18] Macskassy AS,Provost F(2004)《网络数据分类:工具包和单变量案例研究》。纽约大学斯特恩商学院CeDER工作文件
[19] McCallum A、Nigam K、Rennie J和Seymore K(2000年)。使用机器学习自动构建互联网门户。Proc Informat Retri 3(2):127–163·Zbl 02181366号 ·doi:10.1023/A:1009953814988
[20] Neville J,Jensen D(2000)关系数据中的迭代分类。摘自:AAAI从关系数据学习统计模型研讨会论文集,第13-20页
[21] Neville J,Jensen D(2003)《关系依赖网络的集体分类》。In:多关系数据挖掘KDD第二次研讨会会议记录
[22] Neville J,Jensen D(2005)利用潜在群体模型的关系自相关。摘自:第五届IEEE数据挖掘国际会议记录,美国休斯顿,2005年11月,第322-329页
[23] Neville J,Jensen D,Friedland L,Hay M(2003)学习关系概率树。致:SIGKDD会议记录
[24] Neville J,Jensen D,Gallagher B,Fairgrage R(2003)关系贝叶斯分类器的简单估计。摘自:第三届IEEE数据挖掘国际会议记录,第609-612页
[25] Preisach C,Schmidt-Thieme L(2006)关系集合分类。摘自:第六届IEEE数据挖掘国际会议记录,香港,2006年12月,第499-509页
[26] Provost F,Domingos P(2000),井训练PET:改进概率估计树。纽约大学斯特恩商学院CeDER工作文件
[27] Rifkin RM和Klautau A(2004)。为“一对一”分类辩护。J Mach学习研究5:101–141·Zbl 1222.68287号
[28] Taskar B、Segal E、Koller D(1997)关系数据中的概率分类和聚类。摘自:第17届国际人工智能联合会议记录,第870-878页
[29] Ting KM,Witten IH(1997)叠加概括:何时起作用?摘自:国际人工智能联合会议记录,第866–871页
[30] Utard H,Fürnkranz J(2005)超文本分类的链接特征。摘自:EWMF会议记录,第51–64页
[31] Van Assche A、Vens C、Blockel H、Dzeroski S(2004)《使用随机森林进行关系学习》。摘自:ICML统计关系学习及其与其他领域的联系研讨会论文集,第110–116页
[32] Witten IH,Frank E(2000)《数据挖掘:Java实现的实用机器学习工具和技术》。摩根·考夫曼
[33] Wolpert DH(1992)堆积概括。在神经网络5。佩加蒙出版社,第214-259页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。