跳到主要内容
10.5555/1182635.1164169acm会议文章/章节视图摘要出版物页面超大规模数据库会议记录会议集合
第条

IO-Top-k:索引访问优化的top-k查询处理

出版:2006年9月1日 出版历史

摘要

顶部-k个查询处理是分级检索的重要组成部分,其应用范围从文本和数据集成到网络日志和传感器数据的分布式聚合。顶部-k个查询对查询的基本条件和结果候选的聚合分数的索引列表进行操作。在此设置中,最佳实现方法之一是阈值算法系列,其目的是根据候选结果最终得分的上下限,尽早终止索引扫描。此过程对排序的索引扫描执行顺序磁盘访问,但也可以选择执行随机访问以解决分数不确定性。这需要对两种访问进行调度:1)顺序访问中不同索引列表的优先级,以及2)决定何时执行随机访问以及对哪些候选对象执行随机访问。先前的文献已经研究了其中一些调度问题,但仅针对这两种访问类型中的每一种单独进行了研究。当前的论文综合考虑了调度问题,并开发了新的策略,其性能大大优于先前的建议。我们的主要贡献是基于连续访问的Knapsack相关优化和随机访问的成本模型的新的原则性调度方法。通过利用分数、选择性和指数列表相关性的概率估计值,可以进一步增强这些方法。在使用三个不同数据集(TREC Terabyte、HTTP服务器日志和IMDB)进行的性能实验中,与之前已知的最佳方法相比,我们的方法取得了显著的性能提升。

工具书类

[1]
{1} S.Agrawal等人。数据库查询结果的自动排名。CIDR公司, 2003.
[2]
{2} R.Avnur,J.M.Hellerstein。Eddies:连续自适应查询处理。西格莫德2000,第261-2722000页。
[3]
{3} W.-T.Balke,U.Güntzer,J.X.Zheng。web信息系统的高效分布式天际线。EDBT 2004年,第256-273页,2004年。
[4]
{4} H.Bast等人,IO-Top-k:索引访问优化的Top-k查询处理。技术代表MPI-I-2006-5-002,MPI Informatik,2006年。http://domino.mpi-sb.mpg.de/internet/reports.nsf/NumberView/2006-5-002/。
[5]
{5} N.Bruno、L.Gravano、A.Marian。评估web可访问数据库上的前k个查询。ICDE 2002年第369-380页,2002年。
[6]
{6} C.Buckley、G.Salton、J.Allan。在相关反馈环境中添加相关信息的效果。SIGIR 1994年第292-300页,1994年。
[7]
{7} P.Cao,Z.Wang。分布式网络中高效的top-k查询计算。PODC 2004年,第206-215页,2004年。
[8]
{8} M.J.Carey和D.Kossmann。在SQL中说“已经够了!”。SIGMOD 1997年,第219-230页,1997年。
[9]
{9} K.C.-C.Chang,S.-W.Hwang。最小探测:为top-k查询支持昂贵的谓词。SIGMOD 2002年第346-357页,2002年。
[10]
{10} S.Chaudhuri、L.Gravano、A.Marian。优化多媒体存储库上的top-k选择查询。IEEE TKDE公司,16(8):992-1009, 2004.
[11]
{11} R.费金。结合模糊信息:概述。SIGMOD记录,31(2):109-118, 2002.
[12]
{12} R.Fagin、A.Lotem和M.Naor。中间件的最佳聚合算法。联合作战支持系统,66(4):614-656, 2003.
[13]
{13} D.A.Grossmann,O.Frieder。信息检索斯普林格出版社,2005年。
[14]
{14} U.Güntzer,W.-T.Balke,W.Kießling。在异构环境中实现高效的多功能查询。国际贸易中心2001,第622-628页,2001年。
[15]
{15} I.F.Ilyas、W.G.Aref、A.K.Elmagarmid。支持关系数据库中的top-k联接查询。VLDB J。,13(3):207-221, 2004.
[16]
{16} I.F.Ilyas等人,Rank-ware查询优化。SIGMOD 2004年,第203-214页,2004年。
[17]
{17} 约安尼迪斯。直方图的历史(节略)。2003年VLDB,第19-30页,2003年。
[18]
{18} R.Kaushik等人。关于结构索引和倒排列表的整合。SIGMOD 2004年,第779-790页,2004年。
[19]
{19} N.Lester等人。使用自适应剪枝的空间限制排序查询评估。WISE 2005年第470-477页,2005年。
[20]
{20} C.Li等人。RankSQL:关系top-k查询的查询代数和优化。SIGMOD 2005年,第131-142页,2005年。
[21]
{21}X.Long,T.Suel。在具有全局页面排序的大型搜索引擎中优化查询执行。2003年VLDB,第129-140页,2003年。
[22]
{22}A.Marian,N.Bruno,L.Gravano。评估web可访问数据库上的top-k查询。ACM TODS公司,29(2):319-362, 2004.
[23]
{23}A.Marian等人。XML中前k个查询的自适应处理。国际标准化委员会2005第162-173页,2005年。
[24]
{24}A.Moffat,J.Zobel。用于快速文本检索的自索引倒置文件。ACM TOIS公司,14(4):349-379, 1996.
[25]
{25}尼泊尔南部,M.V.Ramakrishna。图像(多媒体)数据库中的查询处理问题。ICDE 1999年,第22-29页,1999年。
[26]
{26}M.Persin、J.Zobel、R.Sacks-Davis。使用频率排序索引进行筛选的文档检索。日本证券交易所,47(10):749-764, 1996.
[27]
{27}W.H.Press等人。英文的剑桥大学出版社,1992年。
[28]
{28}M.Theobald,R.Schenkel,G.Weikum。TopX搜索的高效通用查询引擎。2005年VLDB第625-636页,2005年。
[29]
{29}M.Theobald,G.Weikum,R.Schenkel。概率保证的Top-k查询评估。2004年VLDB,第648-659页,2004年。
[30]
{30}H.Yu等.分布式top的高效处理-k个查询。DEXA 2005年,第65-74页,2005年。

引用人

查看全部
  • (2020)全连接查询答案排序枚举的优化算法VLDB捐赠会议记录10.14778/3397230.339725013:9(1582-1597)在线发布日期:2020年6月26日
  • (2018)选择top-k属性组合的优化算法VLDB期刊-超大数据库国际期刊2007年10月7日/0778-017-0485-227:1(27-52)在线发布日期:2018年2月1日
  • (2016)级联秩的快速第一阶段候选生成第39届国际ACM SIGIR信息检索研究与开发会议记录10.1145/2911451.2911515(295-304)在线发布日期:2016年7月7日
  • 显示更多引用者

建议

评论

信息和贡献者

问询处

发布于

赞助商

  • SIGMOD:ACM数据管理特别利益小组
  • K.I.S.S.SIG数据库
  • AJU信息技术有限公司
  • 美国陆军ITC-PAC亚洲研究办公室
  • 谷歌公司。
  • 日本数据库协会
  • 三星SOS
  • 先进信息技术研究中心
  • 韩国NAVER网
  • 微软:微软
  • 韩国信息科学学会:韩国信息科学协会
  • SK电信
  • 系统应用产品
  • ORACLE:甲骨文
  • 国际商业管理
  • 空军科学研究办公室/亚洲航空航天研发办公室
  • 科塞夫
  • 凯斯特
  • LG电子
  • CCF-DBS公司

出版商

VLDB捐赠

出版历史

出版:2006年9月1日

检查更新

限定符

  • 第条

贡献者

其他指标

文献计量学和引文

文献计量学

文章指标

  • 下载次数(过去12个月)8
  • 下载次数(最近6周)0
反映截至2024年9月17日的下载量

其他指标

引文

引用人

查看全部
  • (2020)全连接查询答案排序枚举的优化算法VLDB捐赠会议记录10.14778/3397230.339725013:9(1582-1597)在线发布日期:2020年6月26日
  • (2018)选择top-k属性组合的优化算法VLDB期刊-超大数据库国际期刊2007年10月7日/0778-017-0485-227:1(27-52)在线发布日期:2018年2月1日
  • (2016)级联秩的快速第一阶段候选生成第39届国际ACM SIGIR信息检索研究与开发会议记录10.1145/2911451.2911515(295-304)在线发布日期:2016年7月7日
  • (2015)基于关键字的多维数据分布式top-k查询处理第27届国际科学和统计数据库管理会议记录10.1145/2791347.2791355(1-12)在线发布日期:2015年6月29日
  • (2014)高效的基于索引的代码段生成美国计算机学会信息系统汇刊10.1145/259097232:2(1-24)在线发布日期:2014年4月1日
  • (2013)现代cpu上用于快速top-k查询处理的候选过滤机制第36届ACM SIGIR信息检索研究与开发国际会议记录10.1145/2484028.2484087(723-732)在线发布日期:2013年7月28日
  • (2013)更快的交叉点尺寸上限第36届ACM SIGIR信息检索研究与发展国际会议论文集10.1145/2484028.2484065(703-712)在线发布日期:2013年7月28日
  • (2013)针对块最大索引优化top-k文档检索策略第六届ACM网络搜索和数据挖掘国际会议记录10.1145/2433396.2433412(113-122)在线发布日期:2013年2月4日
  • (2013)TJJE公司信息科学:国际期刊10.1016/j.ins.2012.08.013222(362-383)在线发布日期:2013年2月1日
  • (2013)高效的并行块最大WAND算法第19届并行处理国际会议记录10.1007/978-3-642-40047-6_41(394-405)在线发布日期:2013年8月26日
  • 显示更多引用者

视图选项

获取访问权限

登录选项

完全访问权限

查看选项

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用联机查看电子阅读器.

电子阅读器

媒体

数字

其他

桌子

分享

分享

共享此出版物链接

在社交媒体上分享