×

一种新的文档检索双翼和声模型。 (英语) Zbl 1175.68145号

摘要:针对文档检索的应用,提出了一种新的双翼和声模型,该模型将词频特征和词连接特征集成到一个低维语义空间中,而不增加计算量。采用加权特征提取方法,从文档的图表示中提取术语和矢量化图连接符。然后,我们开发了一个新的双翼和声模型,将这些多重特征投影到具有不同概率分布假设的低维潜在主题中。对比发散算法用于有效的学习和推理。我们进行了广泛的实验验证,对比结果表明,该方法在文档检索中准确且计算效率高。

MSC公司:

第68页第20页 信息存储和数据检索
68兰特 计算机科学中的图论(包括图形绘制)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] T.W.S.Chow,M.K.M.Rahman,《使用树结构数据进行高效文档检索和剽窃检测的多层SOM》,IEEE神经网络事务,即将出版。;T.W.S.Chow,M.K.M.Rahman,《使用树结构数据进行高效文档检索和剽窃检测的多层SOM》,IEEE神经网络事务,即将出版。
[2] G.Salton,M.McGill(编辑),《现代信息检索导论》,McGraw-Hill,纽约,1983年。;G.Salton,M.McGill(编辑),《现代信息检索导论》,McGraw-Hill,纽约,1983年·Zbl 0523.68084号
[3] 佐贝尔,J。;Moffat,A.,探索相似空间,ACM SIGIR论坛,第32卷,第1卷,第18-34页(1998年)
[4] Deerwester,S.公司。;Dumais,S.,通过潜在语义分析进行索引,《美国信息科学学会杂志》,41,6,391-407(1990)
[5] Berry,M.W。;Dumais,S.T。;O'Brien,G.W.,《使用线性代数进行智能信息检索》,SIAM Review,37,4,573-595(1995)·Zbl 0842.68026号
[6] T.Hofmann,概率潜在语义索引,载《第22届国际SIGIR年会论文集》,1999年。;T.Hofmann,概率潜在语义索引,收录于:第22届国际SIGIR年会论文集,1999年。
[7] Chien,J.T。;Wu,M.S.,自适应贝叶斯潜在语义分析,IEEE音频、语音和语言处理事务,16,1,198-207(2008)
[8] 布莱,D。;Ng,A。;Jordan,M.,潜在狄利克雷分配,机器学习研究杂志,1993-1022(2003)·Zbl 1112.68379号
[9] 韦林,M。;Rosen-Zvi,M。;Hinton,G.,《指数族和声及其在信息检索中的应用》,(神经信息处理系统进展,第17卷(2004),麻省理工学院出版社:马萨诸塞州剑桥,1481-1488)
[10] P.Gehler,A.Holub,M.Welling,信息检索和对象识别的速率自适应泊松模型,摘自:《第23届机器学习国际会议论文集》,宾夕法尼亚州匹兹堡,2006年。;P.Gehler,A.Holub,M.Welling,信息检索和对象识别的速率自适应泊松模型,摘自:《第23届机器学习国际会议论文集》,宾夕法尼亚州匹兹堡,2006年。
[11] E.Xing,R.Yan,A.Hauptmann,用两翼和声挖掘相关文本和图像,收录于:《人工智能不确定性会议论文集》,2005年。;E.Xing,R.Yan,A.Hauptmann,挖掘具有双翼和声的相关文本和图像,载于:《人工智能不确定性会议论文集》,2005年。
[12] Yang,J.,视频分类的和谐模型,统计分析和数据挖掘,1,23-37(2008)·Zbl 07260180号
[13] S.N.Dorogovtsev,J.F.F.Mendes,《语言作为一个进化的单词网络》,《皇家学会学报B:生物科学》,268(1485)(2001),2603-2606。;S.N.Dorogovtsev,J.F.F.Mendes,《语言作为一个进化的单词网络》,《皇家学会学报B:生物科学》,268(1485)(2001),2603-2606。
[14] R.F.I Cancho,R.V.Sole,《人类语言的小世界》,《皇家学会学报B:生物科学》,268(1482)(2001),2261-2265。;R.F.I Cancho,R.V.Sole,《人类语言的小世界》,《皇家学会学报B:生物科学》,268(1482)(2001),2261-2265。
[15] A.Schenker、M.Last、H.Bunke、A.Kandel。使用图形模型对网络文档进行分类,见:《第七届国际文档分析与识别会议论文集》(ICDAR’03),2003年。;A.Schenker、M.Last、H.Bunke、A.Kandel。使用图形模型对网络文档进行分类,见:《第七届国际文档分析与识别会议论文集》(ICDAR’03),2003年·兹比尔1104.68689
[16] Schenker,A。;最后,M。;Bunke,H。;Kandel,A.,使用图形匹配对web文档进行分类,《国际模式识别和人工智能杂志》,18,3,475-496(2004)
[17] Porter,M.F.,后缀剥离算法,Program,14,3,130-137(1980)
[18] Salton,G。;Buckley,C.,自动文本检索、信息处理和管理中的术语权重方法,24,5,513-523(1988)
[19] P.Smolensky,《动力系统中的信息处理:和谐理论的基础》,1986年,第194-281页。;P.Smolensky,《动力系统中的信息处理:和谐理论的基础》,1986年,第194-281页。
[20] Hinton,G.E.,《通过最小化对比差异来培训专家产品》,《神经计算》,第14期,1771-1800页(2002年)·Zbl 1010.68111号
[21] 韦林,M。;Hinton,G.E.,平均场Boltzmann机器的新学习算法,(ICANN'02:人工神经网络国际会议论文集(2002),Springer:Springer London),351-357·Zbl 1013.68639号
[22] Xing,E。;乔丹,M。;Russell,S.,指数族变分推理的广义平均场算法,(人工智能中的不确定性(UAI2003)(2003),Morgan Kaufmann出版社:Morgan Koufmann-Publishers San Francisco,CA),583-591
[23] 我·穆雷。;Ghahramani,Z.,《无向图形模型中的贝叶斯学习:近似MCMC算法》,(Chickering,M.;Halpern,J.,《第20届人工智能不确定性年会论文集》(2004),AUAI出版社:AUAI Press Banff,加拿大),392-399
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。