跳到主要内容
研究论文

使用组合优化解决实体对齐::有效的无监督模型

出版:2023年11月14日 出版历史

摘要

实体对齐(EA)旨在发现不同知识图(KG)中具有相同意义的唯一等价实体对,这是扩展KG规模的关键步骤。现有的EA方法通常利用图形神经网络(GNN)来对齐实体。然而,这些方法继承了GNN的复杂结构,导致效率较低。同时,大多数EA方法要么由于对可用信息的利用不足而限制了其性能,要么需要大量的手动预处理来获得额外的信息。此外,对于大多数依赖于监督学习的EA方法来说,种子对齐获取具有挑战性。为了应对这些挑战,本文提出了一个简单有效的无监督EA模型COEA。COEA利用实体名称信息为EA获取可靠的补充信息,并通过将实体名称捕获的文本特征与KG的结构特征相结合来提高性能。重要的是,COEA继承了GNN的优点,同时减少了冗余。它仅使用图卷积网络(GCN)中的邻域特征聚合方法,将EA问题转化为组合优化问题。COEA在五个数据集上的充分实验验证了该框架的优异性能和泛化能力。COEA在所有性能指标中都取得了最佳性能。值得注意的是,该框架能够以最小的计算延迟快速实现实体对齐。

工具书类

[1]
F.Zhang,N.J.Yuan,D.Lian,X.Xie,W.-Y.Ma,推荐系统的协作知识库嵌入,第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,2016年,第353-362页。
[2]
邱义清,王义忠,金克力,张克力,Acm,弱监督下知识图上多关系问题求解的逐步推理,第十三届Acm网络搜索与数据挖掘国际会议,德克萨斯州休斯顿,2020年,第474-482页。
[3]
P.Tong,Q.Zhang,J.Yao,利用领域上下文在知识图上进行问答,数据科学。工程师。4 (4) (2019) 323–335.
[4]
K.Zeng,C.Li,L.Hou,J.Li,L Feng,知识图实体对齐的综合研究,AI开放2 (2021) 1–13.
[5]
Z.Sun,Q.Zhang,W.Hu,C.Wang,M.Chen,F.Akrami,C.Li,基于嵌入的知识图实体对齐基准研究,程序。荷兰VLDB。13 (12) (2020) 2326–2340.
[6]
M.Chen,Y.Tian,M.Yang,C.Zaniolo,《跨语言知识对齐的多语言知识图嵌入》,arXiv(2016)。https://doi.org/arXiv:.03954。
[7]
D.Qi,S.Chen,X.Sun,R.Luan,D.Tong,仅使用结构信息进行实体对齐的多尺度卷积图形网络,申请。智力。53 (7) (2023) 7455–7465.
[8]
孙振中、胡伟伟、张强、屈毅、,基于知识图嵌入的自举实体对齐IJCAI,2018年。
[9]
L.Lin,J.Liu,Y.Lv,F.Guo,面向知识图无序融合的基于增强局部最大连通同一目的地结构的相似模型,申请。智力。50 (9) (2020) 2867–2886.
[10]
N.Fanourakis,V.Efthymiou,D.Kotzinos,V.Christophides,K.Discovery,实体对齐的知识图嵌入方法:实验综述,数据挖掘(2023) 1–68.
[11]
W.Zeng,X.Zhao,W.Wang,J.Tang,Z.Tan,尾部实体的度软件对齐,第43届国际ACM SIGIR信息检索研究与开发会议论文集,2020年,第811-820页。
[12]
F.Zhang,J.Li,J.Cheng,通过属性和外部知识过滤改进实体对齐,申请。智力。53 (6) (2023) 6671–6681.
[13]
B.D.Trisedya,J.Qi,R.Zhang,使用属性嵌入的知识图之间的实体对齐,《AAAI人工智能会议论文集》,2019年,第297-304页。
[14]
X.Tang,J.Zhang,B.Chen,Y.Yang,H.Chen,C.Li,BERT-INT:基于BERT的知识图对齐交互模型,互动100(2020)e1。
[15]
Q.Zhang,Z.Sun,W.Hu,M.Chen,L.Guo,Y.Qu,实体对齐的多视图知识图嵌入,arXiv(2019)。https://doi.org/arXiv:.02390。
[16]
F.Liu M.Chen D.Roth N.Collier(无监督)实体线形视觉旋转AAAI 35 5 4257 4266。
[17]
Z.Wang,Q.Lv,X.Lan,Y.Zhang,通过图卷积网络进行跨语言知识图对齐,2018年自然语言处理实证方法会议论文集,2018年,第349-357页。
[18]
Y.Wu,X.Liu,Y.Feng,Z.Wang,R.Yan,D.Zhao,异构知识图的关系感知实体对齐,arXiv(2019)。https://doi.org/arXiv:.08210。
[19]
K.Xu,L.Wang,M.Yu,Y.Feng,Y.Song,Z.Wang,D.Yu,通过图匹配神经网络进行跨语言知识图对齐,arXiv(2019)。https://doi.org/arXiv:.11605。
[20]
X.Zhao,W.Zeng,J.Tang,W.Wang,F.M.Suchanek,D.Engineering,最先进实体对齐方法的实验研究,IEEE传输。知识数据工程。34 (6) (2020) 2610–2625.
[21]
A.Bordes,N.Usunier,A.Garcia-Duran,J.Weston,O.Yakhnenko,为多关系数据建模翻译嵌入,高级神经信息处理。系统。26 (2013).
[22]
F.Scarselli,M.Gori,A.C.Tsoi,M.Hagenbuchner,G.Monfardini,图神经网络模型,IEEE传输。神经网络学习。系统。20 (1) (2008) 61–80.
[23]
L.Guo,Z.Sun,W.Hu,学习利用知识图中的长期关系依赖,收录于:机器学习国际会议PMLR,2019年,第2505-2514页。
[24]
C.Li、Y.Cao、L.Hou、J.Shi、J.Li、T.-S.Chua、,基于联合知识嵌入模型和交叉图模型的半监督实体对齐计算语言学协会,2019年。
[25]
M.Fey,J.E.Lenssen,C.Morris,J.Masci,N.M.Kriege,深度图匹配共识,arXiv(2020)。https://doi.org/arXiv:.09621。
[26]
Z.Liu,Y.Cao,L.Pan,J.Li,T.S.Chua,探索和评估实体对齐的属性、值和结构,arXiv(2020)。https://doi.org/arXiv:.03249。
[27]
X.Mao,W.Wang,H.Xu,Y.Wu,M.Lan,关系反射实体对齐,第29届ACM信息与知识管理国际会议论文集,2020,第1095-1104页。
[28]
H.Nie,X.Han,L.Sun,C.M.Wong,Q.Chen,S.Wu,W.Zhang,实体对齐的全局结构和局部语义预留嵌入,第二十届国际人工智能联合会议论文集,2021年,第3658-3664页。
[29]
Y.Wu,X.Liu,Y.Feng,Z.Wang,D.Zhao,《实体对齐的联合学习实体和关系表示》,arXiv(2019)。https://doi.org/arXiv:.09317。
[30]
H.-W.Yang,Y.Zou,P.Shi,W.Lu,J.Lin,X.Sun,使用多方面信息对齐跨语言实体,arXiv(2019)。https://doi.org/arXiv:.06575。
[31]
M.Chen,Y.Tian,K.-W Chang,S.Skiena,C.Zaniolo,跨语言实体比对的知识图和实体描述的联合训练嵌入,arXiv(2018)。https://doi.org/arXiv:.06478。
[32]
X.Mao,W.Wang,H.Xu,M.Lan,Y.Wu,MRAEA:一种有效且稳健的跨语言知识图实体对齐方法,《第十三届网络搜索和数据挖掘国际会议论文集》,2020年,第420-428页。
[33]
C.Ge,X.Liu,L.Chen,B.Zheng,Y.Gao,《让它变得容易:一个有效的端到端实体对齐框架》,第44届国际ACM SIGIR信息检索研究与开发会议论文集,2021年,第777-786页。
[34]
R.Jonker,T.Volgenant,稠密和稀疏线性分配问题的最短增广路径算法,DGOR/NSOR:DGOR与NSOR/Vorträge der 16合作召开的第16届年度会议论文。Jahrestagung der DGOR zusammen mit der NSOR,施普林格出版社,1988年,第622-622页。
[35]
G.Mena,D.Belanger,S.Linderman,J.Snoek,《利用树胶角网络学习潜在排列》,arXiv(2018)。https://doi.org/arXiv:.08665。
[36]
G.Papadakis,V.Efthymiou,E.Thanos,O.Hassanzadeh,P.Christen,实体解析的一对一匹配算法分析,VLDB J。(2023),.
[37]
L.Havrlant,V.Kreinovich,对术语频率-反向文档频率(tf-idf)启发式的简单概率解释(以及由此解释引发的变化),国际通用系统杂志46 (1) (2017) 27–36.
[38]
J.Pennington,R.Socher,C.D.Manning,《Glove:单词表征的全球向量》,《2014年自然语言处理经验方法会议论文集》(EMNLP),2014年,第1532-1543页。
[39]
P.Bojanowski,E.Grave,A.Joulin,T.Mikolov,用子单词信息丰富单词向量,事务处理。关联计算。语言学5 (2017) 135–146.
[40]
K.Xu,L.Song,Y.Feng,Y.Song,D.Yu,跨语言知识图对齐的协调推理,《AAAI人工智能会议论文集》,2020年,第9354-9361页。
[41]
X.Mao,W.Wang,Y.Wu,M.Lan,《从对齐到赋值:令人沮丧的简单无监督实体对齐》,《2021年自然语言处理实证方法会议论文集》,2021年,第2843-2853页。
[42]
H.W.Kuhn,分配问题的匈牙利方法,海军资源后勤季刊2 (1–2) (1955) 83–97.
[43]
M.Cuturi,Sinkhorn distance:最优运输的光速计算,高级神经信息处理。系统。26 (2013).
[44]
孙振华,胡文华,李振华,通过联合属性保留嵌入实现跨语言实体对齐,语义网络——ISWC,施普林格,2017,2017,第628-644页。
[45]
孙志强、胡伟伟、张庆华、屈毅中、,第27届国际人工智能联合会议(IJCAI)上的自举实体对齐与知识图嵌入瑞典斯德哥尔摩,2018年,第4396–4402页。
[46]
曹毅,刘振中,李振中,蔡振中,实体对齐的多通道图神经网络,arXiv(2019)。https://doi.org/arXiv:.09898。
[47]
Z.Sun,J.Huang,W.Hu,M.Chen,L.Guo,Y.Qu,Transedge:为知识图翻译关系上下文化嵌入,in:语义网——2019年国际语义网大会:第18届国际语义网会议,新西兰奥克兰,2019年10月26日至30日,会议记录,第一部分18,施普林格,2019年,第612–629页。
[48]
X.Mao,W.Wang,Y.Wu,M.Lan,提高实体对齐速度10×:使用归一化硬样本挖掘的双注意匹配网络,2021年网络会议论文集,第821-832页。
[49]
X.Mao,W.Wang,Y.Wu,M.Lan,实体对齐是否需要阴性样本?《第30届ACM信息与知识管理国际会议论文集》,2021年,第1263-1273页。
[50]
W.Zeng,X.Zhao,J.Tang,X.Lin,P.Groth,具有自适应特征的基于强化学习的集体实体对齐,ACM事务处理。信息系统。39 (3) (2021) 1–31.

索引术语

  1. 使用组合优化解决实体对齐:一种有效的无监督模型
          索引项已通过自动分类分配给内容。

          建议

          评论

          信息和贡献者

          问询处

          发布于

          封面图像神经计算
          神经计算 第558卷,C期
          2023年11月
          322页
          国际标准编号:0925-2312
          期刊目录

          出版商

          爱思唯尔科学出版社。

          荷兰

          出版历史

          出版:2023年11月14日

          作者标记

          1. 知识图表
          2. 实体对齐
          3. 图形神经网络
          4. 组合优化

          限定符

          • 研究文章

          贡献者

          其他指标

          文献计量学和引文

          文献计量学

          文章指标

          • 0
            引文总数
          • 0
            总下载次数
          • 下载次数(过去12个月)0
          • 下载次数(最近6周)0
          反映截至2024年9月22日的下载量

          其他指标

          引文

          视图选项

          查看选项

          获取访问权限

          登录选项

          完全访问权限

          媒体

          数字

          其他

          桌子

          分享

          分享

          共享此出版物链接

          在社交媒体上分享