×

ERBlox公司

swMATH ID: 28909
软件作者: 扎伊纳布巴赫马尼;利奥波多·贝托西;尼古拉斯·瓦西洛格鲁
描述: ERBlox:将匹配依赖项与机器学习相结合,用于实体解析。实体解析(ER)是一个重要而常见的数据清理问题,它涉及检测相同外部实体的数据重复表示,并将其合并为单个表示。最近,提出了称为匹配依赖(MD)的声明性规则,用于指定数据库记录中属性值合并的相似条件。在这项工作中,我们展示了集成ER三个组件的过程和好处:(a)使用机器学习(ML)技术构建的重复/非重复记录对分类器,(b)支持ML的阻塞阶段和合并本身的MD;和(c)使用声明性语言LogiQL(LogicBlox平台支持的扩展形式的Datalog)进行数据处理,以及MD的规范和实施。
主页: https://arxiv.org/abs/1508.06013
关键词: 实体解析;匹配依赖项;支持向量机;分类;数据日志
相关软件: 逻辑Blox;逻辑QL;数据日志
引用于: 2文件

在1个字段中引用

2 计算机科学(68至XX)

按年份列出的引文