跳到主要内容
10.5555/2816272.2816313指导程序文章/章节视图摘要出版物页面会议记录acm-pubtype公司
研究论文
免费访问

利用自动关键词提取改进基于相关性的红外叠加模型

出版:2004年4月26日 出版历史
  • 获取引文警报
  • 摘要

    我们之前的研究证明,我们提出的基于相关性的信息检索叠加模型(RS)对于不同作者撰写的文档之间的表达差异较大的科学论文档案非常有效。RS模型通过基于相关性信息修改文档特征向量,最大限度地利用文档的相关性。
    本文提出了一种将RS模型应用于一般档案馆的方法,在这些档案馆中,没有为文档提供精心选择的关键字。我们研究了自动特征项提取,发现这一改进的关键问题是RS模型的聚类细化和参数优化。新的实验表明,与使用作者给出的关键字相比,扩展方法获得了更好的检索精度。

    工具书类

    [1]
    Burgin,R.(1995年)。五种聚类算法的检索效率与索引穷尽度的关系J.美国信息科学学会第46卷(第562-572页)。
    [2]
    Deerwester,S.、Dumais,S.T.、Landauer,T.K.、Furnas,G.W.和Harshman,R.A.(1990年)。通过潜在语义分析进行索引。J.美国信息科学学会第41卷(第391-407页)。
    [3]
    Hayashi,Y.(1998)。基于个人偏好的适合智能访问的新数据模型。IPSJ SIG票据,第98卷,共98卷98-DBS-116(2)(第381-388页)。
    [4]
    Hearst,M.和Pedersen,J.(1996年)。重新检查聚类假设:分散/聚集检索结果。SIGIR’96年(第76-84页)。
    [5]
    金泽,T.、爱泽一郎,A.、高须,A.和阿达奇,J.(2001)。基于相关性的叠加模型在跨语言信息检索中的作用。程序。第五届欧洲数字图书馆研究与先进技术会议达姆施塔特(第312-324页)。
    [6]
    Kanazawa,T.、Takasu,A.和Adachi,J.(2000a)。一种基于相关性的有效信息检索叠加模型,IEICE交易,E83-D(第2152-2160页)。
    [7]
    Kanazawa,T.、Takasu,A.和Adachi,J.(2000b)。基于相关性的叠加模型对信息检索的影响。2000年IPSJ数据库研讨会(IPSJ SIG Notes)岩手,第2000卷2000年12月22日(第57-64页)。
    [8]
    Mitra,M.、Singhal,A.和Buckley,C.(1998年)。改进自动查询扩展。98年SIGIR(第206-214页)。
    [9]
    NTCIR:http://research.nii.ac.jp/NTCIR/。
    [10]
    Sebastiani,F.(2002)。自动文本分类中的机器学习,倒排索引综述,已接受发布。
    [11]
    支持向量机: http://svmlight.joachims.org/。
    [12]
    语言数据联盟TIPSTER:http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC93T3A。
    [13]
    TREC主页:http://tree.nist.gov/。
    [14]
    Vapnik,V.(1995)。统计学习理论的本质斯普林格。
    [15]
    Voorhees,E.(1998年)。关联判断的变化与检索效果的衡量。98年SIGIR(第315-323页)。

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片指南会议记录
    RIAO'04:信息检索的耦合方法、耦合媒体和耦合语言
    2004年4月
    935页
    国际标准图书编号:905450096

    出版商

    LE CENTRE DE HAUTES ETUDES国际信息文件

    法国巴黎

    出版历史

    出版:2004年4月26日

    限定符

    • 研究文章

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 0
      引文总数
    • 11
      总下载次数
    • 下载次数(过去12个月)6
    • 下载次数(最近6周)2

    其他指标

    引文

    视图选项

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    获取访问权限

    登录选项

    完全访问权限

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享