×

旋转

swMATH ID: 2620
软件作者: W.W.科恩。
描述: 分布式、异构数据库(如万维网上可用的数据库)的集成带来了许多问题。这里我们考虑集成来自缺少公共对象标识符的源的数据的问题。针对包含对象的非正式自然语言“名称”的数据库,提出了解决此问题的方法;大多数基于Web的数据库都满足了这一要求,因为它们通常通过一层文本向最终用户显示信息。我们描述了WHIRL,它是一个“软”数据库管理系统,支持“相似性连接”,基于文本的某些健壮的通用相似性度量。这样可以将文本片段(例如,对象的非正式名称)用作键。WHIRL将文本对象作为内置类型,将相似性推理作为内置谓词,并使用根据总分排序的答案替换列表来回答每个查询。实验表明,WHIRL比朴素的推理方法要快得多,即使是在短查询中也是如此,并且在对具有数万个元组的真实数据库的典型查询中效率很高。WHIRL做出的推断也出人意料地精确,在一个基准问题上与手工编码规范化例程的精度相当,在第二个问题上优于与合理的全局域的精确匹配。
主页: http://www.cs.cmu.edu/~wcohen/旋转/
关键词: 知识表示;信息检索;文本相似性;异构数据库;信息集成;文本分类;信息提取
相关软件: 4.5条;XPath(XPath);苏格兰和南方能源公司;戴纳;菲加罗;棱镜;MCINTYRE公司;博客;教堂;IBAL公司;PITA公司;CP逻辑;ProbLog(问题日志);XIRQL公司;请参见5;函数;WordNet(文字网);Python语言;ADMIT公司;奥德赛
引用于: 11文件

按年份列出的引文