摘要:网络表格的扩展是根据已知信息扩展与主列相关的其他属性列,以满足人们通过表格获取感兴趣信息的需求。目前的研究工作主要针对由主列和待扩展列组成的实体-属性二元表,并将主列视为其他属性列扩展的唯一依据,但该技术运用到具有多个待扩展列的网络表格时,由多个二元表拼接而成的结果表很容易出现实体不一致现象。综合考虑各属性列间以及元组行间的关系,提出一致性支持度概念,设计并实现了基于列重合度的表格一致性扩展系统CCA、,其既能保证候选值的高匹配分数,又能使结果表中填值所使用的数据源表数目最小化,有效地避免了实体不一致问题。实验表明,与现有方法相比CCA公司系统有更高的精确度、覆盖率、一致性,以及更低的查询时间代价。
齐飞,王宁,张丽方,孙伟娟.基于列重合度的网络表格一致性扩展[J] ●●●●。计算机科学, 2017, 44(9): 208-215. https://doi.org/10.11896/j.issn.1002-137X.2017.09.039
齐飞、王宁、张丽芳和孙伟娟。基于列重叠的一致Web表增强[J] ●●●●。计算机科学,2017,44(9):208-215。https://doi.org/10.11896/j.issn.1002-137X.2017.09.039