米雷尔·科斯基 网页分割块的语义标注。 (英语) Zbl 1224.68212号 Craiova大学。材料信息。 37,第3期,92-100(2010). 摘要:传统搜索引擎,如谷歌(Google)、雅虎(Yahoo)、Altavista等,在过去十年中取得了巨大成功,最初的设计目的是为了轻松定位和检索网络上的任何可用信息。当时,计算机工程师没有考虑信息被机器理解的可能性。由于Web上现有的大量信息,信息的自动智能检索成为一项繁琐的任务:用户应该理解、组合、解释、选择和评估这些信息。在大多数情况下,Web页面包含多个语义主题,一种自然的方法是不将其视为原子元素。更自然的做法是,将Web页面可以分解成的语义块(每个块对应不同的主题)作为最小的信息单元进行推理和操作。 MSC公司: 68单位99 计算方法和应用 68第20页 信息存储和数据检索 关键词:语义标注;网页分割;网页呈现;Web信息检索;视觉特征 PDF格式BibTeX公司 XML格式引用 \textit{M.Cosulschi},科罗瓦州立大学。Mat.Inf.37,No.3,92--100(2010;Zbl 1224.68212)