×

网页分割块的语义标注。 (英语) Zbl 1224.68212号

摘要:传统搜索引擎,如谷歌(Google)、雅虎(Yahoo)、Altavista等,在过去十年中取得了巨大成功,最初的设计目的是为了轻松定位和检索网络上的任何可用信息。当时,计算机工程师没有考虑信息被机器理解的可能性。由于Web上现有的大量信息,信息的自动智能检索成为一项繁琐的任务:用户应该理解、组合、解释、选择和评估这些信息。
在大多数情况下,Web页面包含多个语义主题,一种自然的方法是不将其视为原子元素。更自然的做法是,将Web页面可以分解成的语义块(每个块对应不同的主题)作为最小的信息单元进行推理和操作。

MSC公司:

68单位99 计算方法和应用
68第20页 信息存储和数据检索
PDF格式BibTeX公司 XML格式引用