ERBlox公司 swMATH ID: 28909 软件作者: 扎伊纳布巴赫马尼;利奥波多·贝托西;尼古拉斯·瓦西洛格鲁 描述: ERBlox:将匹配依赖项与机器学习相结合,用于实体解析。实体解析(ER)是一个重要而常见的数据清理问题,它涉及检测相同外部实体的数据重复表示,并将其合并为单个表示。最近,提出了称为匹配依赖(MD)的声明性规则,用于指定数据库记录中属性值合并的相似条件。在这项工作中,我们展示了集成ER三个组件的过程和好处:(a)使用机器学习(ML)技术构建的重复/非重复记录对分类器,(b)支持ML的阻塞阶段和合并本身的MD;和(c)使用声明性语言LogiQL(LogicBlox平台支持的扩展形式的Datalog)进行数据处理,以及MD的规范和实施。 主页: https://arxiv.org/abs/1508.06013 关键词: 实体解析;匹配依赖项;支持向量机;分类;数据日志 相关软件: 逻辑Blox;逻辑QL;数据日志 引用于: 2文件 标准条款 1出版物描述软件,包括1出版物以zbMATH为单位 年份 ERBlox:将匹配依赖项与机器学习相结合,用于实体解析。 Zbl 1404.68093号扎伊纳布·巴赫马尼;利奥波多·贝托西;尼古拉斯·瓦西洛格鲁 2017 全部的 前5名8位作者引用 1 扎伊纳布·巴赫马尼 1 利奥波多·贝尔托西。 1 道格拉斯·伯迪克 1 罗纳德·费金 1 Phokion G.科莱蒂斯。 1 波帕,卢西恩 1 Tan、Wang-Chiew 1 尼古拉斯·瓦西洛格鲁 2篇连载文章中引用 1 计算机与系统科学杂志 1 国际近似推理杂志 在1个字段中引用 2 计算机科学(68至XX) 按年份列出的引文