复杂的因素会减缓从数据库检索特定记录的搜索速度。本文解决的一个复杂因素是涉及多个维度时的查询选择标准,当维度使用非键数据时,这一复杂因素会更加严重。文献中经常使用的、本文中使用的一种经典多维搜索是从酒店数据库中对最靠近海滩且价格最低的酒店集进行二维检索:即所谓的天际线检索。
本文首先在文献调查的基础上,对用于天际线搜索的主要算法进行了评估和比较。报告的六种算法是分治算法、块嵌套循环算法、排序优先天际线算法、位图算法、索引算法和最近邻算法。这种比较强调了累进性、无虚假遗漏、无虚假点击、公平性、检索引用的合并和普遍性。在最近邻算法的基础上,本文提出了一种比六种比较算法更好的算法,称之为分枝定界算法。
本文解释了分枝定界算法,并提供了其正确性的广泛形式证明。然后,本文简要检查了对搜索到的数据库进行添加和删除的影响。接下来,本文确定了六种天际线搜索的“新变体”,以证明分枝定界算法的优越性:约束天际线、分级天际线,分组天际线和动态天际线K(K)-主导查询和天带。
只有分支和边界与所有六种变体兼容,除此之外,论文还引入了一种新的变体,即近似天带,它也在其中大放异彩。然后,本文对分枝定界算法与最近邻算法(通常是六种主要算法中用于大多数天际线搜索的最佳算法)的效率进行了实验评估。对于非新颖搜索,分支定界算法可以更好地显示三个评级因素中的每一个:维度、基数和累进行为。在这六种新的变种中,本文的分支定界算法最终也会比最近邻算法工作得更好。正如文章所指出的,保存与常见查询类型相关的天际线可以为活跃的数据库用户提供重要的节省。对我来说,分支定界算法所声称的理想属性表明,数据管理员应该调查该算法对他们自己的数据库的适用性。