×

基于信息检索模型的新闻搜索引擎评价。 (英语) 兹比尔1468.68084

摘要:新闻搜索引擎是用户获取新闻的独家搜索服务。通过向新闻搜索引擎提供相关查询,用户可以返回一个单一的新闻结果页面,该页面由万维网上数千个在线新闻来源聚合而成的各种新闻文章组成。Bing新闻、谷歌新闻和新闻查找等主要新闻搜索引擎的可用性和使用要求对这些搜索系统进行检索有效性评估。本文分别使用向量空间模型、Okapi BM25和潜在语义索引等核心检索模型对新闻搜索引擎的检索有效性进行评估,以进行相关性有效性评估。此外,基于蒙特卡罗交叉熵的排名聚合技术通过聚合三个独立排名来进行更全面的相关性有效性评估。实验结果表明,谷歌新闻的性能优于其他两个搜索引擎。

MSC公司:

68第20页 信息存储和数据检索
68英里11 互联网主题
68单位35 信息系统的计算方法(超文本导航、接口、决策支持等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aslam JA,Yilmaz E(2006)《通过平均精度推断文档相关性》,美国西雅图第29届国际ACM SIGIR信息检索研究与开发会议论文集601-602
[2] 克拉克,S。;J.和Willett,P.,《估计网络搜索引擎的召回性能》,《Aslib Proceedings》,49,7,184-189(1997)·doi:10.1108/eb051463
[3] Harter SP,Hert CA(1997)《信息检索系统的评估:方法、问题和方法》,摘自Williams,M.E.(ed.),ARIST,《今日信息》,美国新泽西州梅德福德,ARIST32:3-94
[4] 霍金,D。;贝利,P。;Grifiths,K.,测量搜索引擎质量,信息检索,4,33-59(2001)·Zbl 1030.68690号 ·doi:10.1023/A:1011468107287
[5] Li L,Shang Y(2000)《搜索引擎性能评估的新统计方法》,载于第12届IEEE人工智能工具国际会议论文集,ICTAI 2000,加拿大不列颠哥伦比亚省温哥华208-215
[6] Ali R,Beg MMS(2009)使用基于粗糙集的等级聚合对web搜索系统进行自动性能评估。in:U.S.Tiwari,T.J.Siddiqui,M.Radhakrishna&M.D.Tiwari(eds.)《第一届智能人机交互国际会议论文集》。,新德里施普林格44-348
[7] Bokhari MU,Adhami MK(2015)《评估新闻搜索系统的新标准》。Commun Appl Electron 2(7):28-35,美国纽约州计算机科学基金会(FCS)
[8] Bokhari MU,Adhami MK(2016)他们检索新鲜新闻的效果如何:新闻搜索引擎的视角。《透视科学》8:469-471,Elsevier
[9] MU Bokhari,Adhami MK(2018)新闻搜索引擎的检索有效性:一个理论框架。国际计算应用杂志180(38):17-23,美国
[10] Bokhari MU、Adhami MK、Ali R(2019)《评估新闻搜索系统的机器学习方法》,《IEEE电气国际会议论文集》。电子与计算机工程(UPCON'19),印度阿利加尔AMU 1-6
[11] Robertson SE,Zaragoza H(2009)《概率相关性框架:BM25及其后》,信息检索的基础和趋势,3(4)333-389
[12] Salton,G。;Wong,A。;杨,C。;美国,自动索引的向量空间模型,ACM通信,18,11,613-620(1975)·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220
[13] Robertson SE、Walker S、Jones S、Beaulieu MH、Gatford M(1994年)。Okapi在TREC上发表于《第三届文本检索会议论文集》(TREC 1994),1994年11月2-4日,美国马里兰州盖瑟斯堡,NIST特别出版物190
[14] Lv Y,Zhai CX(2011)下限项频率归一化,《CIKM-2011会议录》,英国苏格兰格拉斯哥7-16
[15] Zaragoza H、Crashwell N、Taylor M、Saria S、Robertson SE(2004)《微软剑桥大学TREC-13:网络和硬件轨迹》,载于《TREC-2004学报》。2004年11月16-19日,美国马里兰州盖瑟斯堡。https://trec.nist.gov/pubs/trec13/papers/microsoft-cambridge.web.hard.pdf
[16] Deerwester S(1988)《利用潜在语义索引改进信息检索》,美国信息科学学会第51届年会论文集(ASIS’88),美国佐治亚州亚特兰大25:36-40
[17] Deerwester,S.公司。;杜梅斯,ST;福纳斯,GW;蒂克斯·兰道尔;Harshman,R.,《利用潜在语义分析进行索引》,《美国科学信息学会杂志》,第41期,第6期,第391-407页(1990年)
[18] 丁C(1999)基于相似性的潜在语义索引概率模型,第22届国际ACM SIGIR信息检索研究与开发会议论文集,美国加利福尼亚州伯克利59-65
[19] Dumais,S。;T.,潜在语义分析,《信息科学与技术年度评论》,38,188-230(2005)·doi:10.1002/aris.1440380105
[20] Markovsky I(2012)低秩近似:算法、实现、应用。施普林格,国际标准图书编号:978-1-4471-2226·Zbl 1245.93005号
[21] 德梅尔,J。;Kahan,W.,双对角矩阵的精确奇异值,SIAM科学与统计计算杂志,11,5,873-912(1990)·兹比尔0705.65027 ·doi:10.1137/0911052
[22] Golub,G。;H.和Kahan,W.,计算矩阵的奇异值和伪逆,工业和应用数学学会杂志,B辑:数值分析。,2, 2, 205-224 (1965) ·Zbl 0194.18201号 ·doi:10.1137/0702016
[23] 墙,M。;E.、Rechtsteiner,A.和Rocha,L.M。;Berrar,DP;杜比茨基,W。;Granzow,M.,奇异值分解和主成分分析,微阵列数据分析的实用方法,91-109(2003),马萨诸塞州诺威尔:克鲁沃,诺威尔·doi:10.1007/0-306-47815-35
[24] Pihur,V。;苏西米塔·达塔;Datta,Somnath,聚类验证措施的加权秩聚合:蒙特卡罗交叉熵方法,生物信息学,23,131607-1615(2007)·doi:10.1093/bioinformatics/btm158
[25] CRAN(2021)软件包,于2021年2月21日访问。https://cran.r-project.org/web/packages/available_packages_by_date.html
[26] Daniel W(1990)斯皮尔曼等级相关系数。书中的章节-应用非参数统计(第二版)。波士顿:PWS-Kent 358-365。国际标准图书编号978-0-534-91976-4
[27] 斯皮尔曼,C.,《两件事之间联系的证明和测量》,《美国心理学杂志》,100,3-4,441-471(1987)·doi:10.2307/1422689
[28] Kendall MG(1970)等级相关法(第4版)。伦敦:格里芬。国际标准图书编号978-0-852-6419-96。OCLC 136868号·Zbl 0199.53501号
[29] Nelson RB(2001)Kendall Tau metric,In Hazewinkel Michiel(编辑),《数学百科全书》,Springer Science+Business Media B.V./Kluwer学术出版社,ISBN 978-1-55608-0104
[30] Prokhorov AV(2001)Kendall秩相关系数,In Hazewinkel Michiel(ed.),《数学百科全书》,Springer Science+Business Media B.V./Kluwer Academic Publishers,ISBN 978-1-55608-010-4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。