{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期部分”:[[2024,6,19]],“日期时间”:“2024-06-19T11:56:58Z”,“时间戳”:1718798218723},“参考计数”:111,“出版商”:“计算机协会(ACM)”,“问题”:“3”,“资助者”:[{“名称”:“科尼特和挪威研究委员会”,“奖项”:[“298 998“]}],“内容域”:{“域”:[“dl.acm.org”],“crossmark-restriction”:true},“short-container-title”:[”acm Trans.Knowl.Discov.Data“],“published-print”:{“date-parts”:[[2021,6,30]]},”抽象“:”实体匹配是指识别哪些记录引用同一个真实实体的问题。几十年来,人们一直在积极研究它,并开发了各种不同的方法。即使在今天,这仍然是一个具有挑战性的问题,仍有很大的改进空间。近年来,我们看到了基于深度学习技术的自然语言处理新方法的出现。</jats:p>在本次调查中,我们介绍了如何将神经网络用于实体匹配。具体来说,我们使用神经网络确定了现有工作针对的实体匹配过程的哪些步骤,并概述了每个步骤中使用的不同技术。我们还讨论了与传统方法相比,深度学习在实体匹配中的贡献,并提出了用于实体匹配的深度神经网络分类<\/jats:p>“,”DOI“:”10.1145\/3442200“,”type“:”journal-article“,”created“:{”date-parts“:[2021,4,21]],”date-time“:”2021-04-21T15:42:54Z“,”timestamp“:1619019774000},“page”:“1-37”,“update-policy”:“:[“实体匹配的神经网络:一项调查”],”前缀“:”10.1145“,”卷“:”15“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0003-4618-9702“,”authenticated-ORCID“:false,”给定“:”Nils“,”家族“:”Barlaug“,“sequence”:“first”,“affiliation”:[{“name”:“Cognite and NTNU,Trondheim,Norway”}]},{“given”:“Jon Atle”,“family”:“Gulla”,“seq”:“additional”,“从属关系”“:[{”name“:”NTNU“}]}],”member“:”320“,”published-online“:{“date-parts”:[[2021,4,21]]},“reference”:[{“key”:“e_1_1_1”,“unstructured”:“2003。重复检测记录链接和身份不确定性:数据集。检索自http://www.cs.utexas.edu\/users\/ml\/liger\/data.html。2003.重复检测记录链接和身份不确定性:数据集。检索自http://www.cs.utexas.edu\/users\/ml\/liger\/data.html。“},{”key“:”e_1_2_2_1“,”volume title“:”神经信息处理系统进展论文集。C.Cortes,N.D“,”作者“:”Andoni Alexandr“,”年份“:”2015“},{”key“:”e_1_2_3_1“,”volume title“:”2008年IEEE第24届国际数据工程会议论文集。IEEE,40\u201349“,”作者“:”Arasu A.“},{”key“:”e_1_1_4_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1145 \/1807167.1807252“},{“key”:“e_1_1_5_1”,“volume-title”:“通过联合学习对齐和翻译进行神经机翻译。(Sept“,”author“:”Bahdanau Dzmitry“,”year“:”2014“}”,{”key“:”e_2_1_6_1“,“volome-title“:”数据质量:概念、方法和技术(数据中心系统和应用程序)“,”author“:”Batini Carlo“,”year“:”2006“},{”key“:”e_1_2_1_7_1“,”doi-asserted-by“:”crossref“,“unstructured”:“Zohra Bellahsene Angela Bonifati and Erhard Rahm(Eds.),2011。模式匹配和映射。柏林施普林格。Zohra Bellahsene Angela Bonifati和Erhard Rahm(编辑)。2011.模式匹配和映射。施普林格柏林。“,”DOI“:”10.1007\/978-3-642-16518-4“},{”key“:”e_1_2_1_8_1“,”volume-title“:”KDD Cup Workshop会议记录“,”author“:”Bennett J.“,“年份”:“2007”},“key”:“e_1_i_1_9_1”,“DOI-asserted-by”:“crossref”,”unstructured“:”Piotr Bojanowski Edouard Grave Armand Joulin and Tomas Mikolov.2016。用子单词信息丰富单词向量。计算语言学协会学报。彼得·博亚诺夫斯基(Piotr Bojanowski)、爱德华·格雷夫·阿曼德·朱林(Edouard Grave Armand Joulin)和托马斯·米科洛夫(Tomas Mikolov)。2016.使用子单词信息丰富单词向量。计算语言学协会学报。“,”DOI“:”10.1162\/tacl_a_00051“},{”key“:”e_1_1_10_1“,”volume-title“:”2018年机器翻译会议(WMT18)成果。在第三届机器翻译会议论文集:共享任务论文.272\u2013303“中,”author“:”Bojar Ond\u0159ej“,”year“:”2018},“key”:“e_2_1_11_1”,“volume-titel”:“”扩展数据库技术国际会议论文集。“,”author“:”Brunner Ursin“,”year“:”2020“},{”key“:”e_1_1_12_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/50907.509965”},“key”:“e_2_1_13_1”,“doi-assert-by”:“publisher”,”doi“:”10.5555\/3304222.3304304326“}”,{“:”10.3115\/v1\/W14-4012“},{“key”:“e_1_2_1_15_1”,“doi-asserted-by”:“publisher”,”DOI“:”10.1007\/978-3642-31164-2“},{“key”:“e_1_1_16_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.1109\/TKDE.2011.127“}、{“密钥”:“e_1_2_1_17_1”、“volume-title”:“大数据的端到端实体解析:调查。(五月”,“author”:“Christophides Vassilis”,“year”:“2019”},“key“:”e_2_1/18_1“,”DOI-assert-by“:”crossref“,”unstructured“:”亚历克西斯·康诺·霍尔格·施文克·罗(Alexis Conneau Holger Schwenk Lo\u00efc Barrault)和亚恩·勒村(Yann Lecun)。2016.文本分类的深度卷积网络。计算语言学协会欧洲分会(EACL'17)。亚历克西斯·康诺·霍尔格·施文克·罗(Alexis Conneau Holger Schwenk Lo\u00efc Barrault)和亚恩·勒村(Yann Lecun)。2016.文本分类的深度卷积网络。计算语言学协会欧洲分会(EACL'17)。“,”DOI“:”10.18653\/v1\/E17-1104“},{”key“:”e_1_2_1_19_1“,”unstructured“:”Sanjib Das A.Doan C.Gokhale Psgc P.Konda Y.Govind和D.Paulsen.2016。麦哲伦数据存储库。https:\/\/sites.google.com/site\/anhaidgroup\/projects\/data。Sanjib Das A.Doan C.Gokhale Psgc P.Konda Y.Govind和D.Paulsen。2016年麦哲伦数据存储库。https:\/\/sites.google.com/site\/anhaidgroup\/projects\/data。“},{”key“:”e_1_1_20_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/CVPR.2009.5206848”},“key”:“e_1_i_1_21_21_1”,“volume-title”:“BERT:用于语言理解的深层双向变换器的预训练。(10月,”author“:”Devlin Jacob“,年”:“2018”}、{”key“:“e_i_1_22_22_1”、“doi-assert-by”:“publisher”,”doi“:”10.1145\/3077257.3077268“},{”key“:”e_1_1_23_1“,”volume-title“:”数据集成原理“,”author“:”Doan Anhai“,”edition“:”1“},{“key”:“e_2_1_24_1”,“doi-asserted-by”:“publisher”,”doi“:”10.14778\/3236187.326198“}”,{键“:”d_2_25_1“、”doi-assert-by“:”publisher“,“doi”:”10.5555\/1191739“}、{“键”:“”e_1_2_1_26_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1207\/s15516709cog1402_1“},{“key”:“e_1_2_1_27_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1080\/01621459.1969.10501049“}”,{”key“:”e_1_cu1_28_1“,”doi-assert-by“:”publisher“,“doi”:“10.24963\/ijcai.2019\/689”},“key“:”e_2_2_29_1“”,“doi-asserte-by”:“publisher”,”“doi“”:“10.14778\/2367502.2367564”},{“key”:“e_1_2_1_30_1”,“doi-asserted-by”:“publisher”,”DOI“:”10.2200\/S00762ED1V01Y201703HLT037“},{”key“:”e_1_2_1_31_1“,”volume-title“:”深度学习“,”author“:”Goodfellow Ian“}”,{“key”:“e_1_i_1_32_32_1”,“volume-title”:“使用卷积神经网络的实体解析。Procedia Compute.Sci.95(1月),“author”:“Gottapu Ram Deepak”,”年份:“2016”},“key“DOI-asserted-by“:”publisher“,”DOI“:”10.14778\/3229863.3236255“},{“key”:“e_1_1_34_1”,“volume-title”:“用递归神经网络生成序列e_1_2_1_36_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1145\/3357384.3360316”},{“key”:“e_1_i_1_37_1”,”volume-title“:“2016 IEEE计算机视觉和模式识别会议论文集。770--778”,“author”:“He Kaiming”,“year”:“2015”}、{“key”:”e_2_138_1},{“键”:“e_1_2_1_39_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1162\/neco.1997.9.81735”},{“key”:“e_1_cu1_40_1”,”doi-assert-by“:”publisher“,”doi“:”10.1145\/27698.276876“},“key“:”e_1_i_1_41_1“42_1“,”卷时间“:”神经信息处理系统进展论文集。J.D.Lafferty、C.K.I.Williams、J.Shawe-Taylor、R.S.Zemel和A.Culotta(编辑)。Curran Associates,Inc.,928\u2013936”,“作者”:“Jain Prateek”,“年份”:“2010”},{“密钥”:“e_1_2_1_43_1”,“卷标题”:“2019自然语言处理实证方法会议和第九届自然语言处理国际联席会议(EMNLP-IJCNLP\u201919)论文集”,“作者”:“Joshi Mandar”},{“密钥”:“e_1_2_1_44_1”volume-title“:”Martin“,”author“:”Jurafsky Daniel“,“year”:“2008”},{“key”:“e_1_1_45_1”,“volume-titel”:“已检索”,“author”:“Jurafsk Dan”,”year“:”2020“},}“keys”:“e_1_2_1_46_1”、“doi-asserted-by”:“publisher”,‘doi’:“10.18653\/v1_/P19-1586”}、{“key”:”e_2_1_47_1“,‘doi-assert-by”“:”publisher“,”doi“:”10.3115\/v1\/D14-1181“},{”key“:”e_1_2_1_48_1“,“doi-asserted-by“:”publisher“,”doi“:”10.1364\/AO.26.004910“},{“key”:”e_1_1_49_1“,“doi-assert-by”:“publisher”,“doi”:“10.18653\/v1\/K18-1050”},“key“:”e_ 1_1_ 1_50_1“、”首页“:”12“,”文章标题“Magellan:朝向建筑实体匹配管理系统”,“volume”:“9”,“author”:“Konda Pradap”,“year“:”2016“,”新闻标题“:”VLDB Endowment论文集“},{“key”:“e_1_2_1_51_1”,“volume-title”:“智能信息和数据库系统”,“author”:“Kooli Nihel”},},“key“:”e_1_i_1_52_1“,”doi-asserted-by“:”publisher“,“doi”:“10.14778\/1920841.1920904”}},{“键”:“e_1_1_54_1”,“doi-asserted-by”:“publisher“,”DOI“:”10.18653\/v1\/N16-1030“},{“key”:“e_1_1_55_1”,“DOI-asserted-by”:“publisher”,”DOI:“10.1038\/nature14539”},“key“:”e_1_i_1_56_1“,“DOI-asserted-by”:”publisher,“DOI”:“10.18653\/v1_/D17-1018”}“,{”key“:”e_2_1_57_1“、”DOI-assert-by“:”publicher“,”DOI“:”10.1109\/TKDE.2016.2535242“},{“key”:“e_1_2_1_58_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.5555\/645920.672826“},{”key“:”e_1_1_59_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1016\/S0169-023X(99)00044-0“}”,{“key”:“e_1_i_1_60_1”,“DOI-assert-by”:“publisher”,”DOI“:”10.14778\/3424.3421431431“},“DOI”:“10.1109\/CVPRW.2015.7301269”},{“key”:“e_1_2_1_62_1”,“DOI-asserted-by”:“publisher“,”DOI“:”10.1145\/3357384.3360319“},{“key”:“e_1_1_63_1”,“volume-title”:“神经信息处理系统进展会议录。C.J.C.Burges,L.Bottou,M.Welling,Z.Ghahramani,and K.Q.Weinberger(编辑)。Curran Associates,Inc.,3111\u20133119”,“author”:“Mikolov Tomas”,《年份》:“2013”},“key“:”e_2_1_64_1“,“”卷标题“:”用于信息检索的神经模型。(May“,”author“:”Mitra Bhaskar“,”year“:”2017“},{”key“:”e_1_1_65_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3183713.3196926”},}“key”:“e_1_i_1_66_1”,“doi-assert-by”:“crossref”,”volume-title“重复检测简介”,“author”:“Naumann Felix”,“doi:”10.1007\/978-3-031-01835-0“}”,{“key”:“e_1_2_1_67_1”,“doi-asserted-by”:“publisher“,”DOI“:”10.1126\/science.130.3381.954“},{“key”:“e_1_1_68_1”,“DOI-asserted-by”:“publisher”,”DOI:“10.1145\/3357384.3358018”},“{”key“:”e_2_1_69_1“,“volume-title”:“人工智能建模决策”,“author”:“Nin Jordi”}、{“key”:2019年第六届计算科学/智能与应用信息学国际会议论文集(CSII\u201919)“,“作者”:“Nozaki K.”},{“密钥”:“e_1_2_1_71_1”,“非结构化”:“Christopher Olah,2015。了解LSTM网络。检索自https:\/\/colah.github.io\/posts\/2015-08-Understanding-LSTMs\/。克里斯托弗·奥拉。2015.了解LSTM网络。检索自https:\/\/colah.github.io\/posts\/2015-08-Understanding-LSTMs\/。“},{”key“:”e_1_1_72_1“,”volume-title“:”实体解析的阻塞和过滤技术调查。(May“,”author“:”Papadakis George“,”year“:”2019“}”,{“key”:“e_2_1_73_1”,”doi-asserted-by“:”publisher“,/v1\/D16-1244“},{”键“:”e_1_2_1_75_1“,“doi-asserted-by”:“publisher”,“doi”:“10.3115\/v1\/D14-1162”},{“key”:“e_1_i_1_76_1”,”doi-assert-by“:”publisher“,”doi“:”10.18653\/v1\/N18-1202“},”{“key”:”e_1_c_1_77_1“”,“volume-title”:“第六届家族史和系谱研究技术年度研讨会论文集”,“author”:“Pixton Burdette”,“year”:“”2006“},{”键“:”e_1_2_1_78_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3132847.3132949”},{“key”:“e_1_i_79_1”,“首页”:“9”,“文章标题”:“语言模型是无监督的多任务学习者”,“卷”:“1”,“作者”:“Radford Alec”,“年份”:“2019”,”日志标题“OpenAI博客”}“publisher”,“doi”:“10.1007\/s00780100057“},{“key”:“e_1_2_1_81_1”,“volume-title”:“AAAI人工智能会议论文集32”,“author”:“Raiman Jonathan”,《年份》:“2018年”},}“key”:《e_1_i_1_82_1》,“volume-title”:《神经信息处理系统进展论文集》,C.Cortes,N.D,“au作者”:“任绍清”,“年份”:“2015”}、{“密钥”:“e_1_2_1_83_1“,”volume-title“:”Pizzi“,”author“:”Reyes-Galaviz Orion F“,”year“:”2017“},{“key”:“e_1_i_1_85_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1007\/s11263-015-0816-y“}”,{”key“:”e_2_86_1“、”doi-assert-by“:”publisher 87_1“,”doi-asserted-by“:”publisher“,“doi”:“10.18653\/v1\/P16-1162”},{“key”:“e_1_2_1_88_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/TKDE.2016.2601325”},{“key”:“e_1_cu1_89_1”,“volume-title”:“公路网。(五月”,“author”:“Srivastava Rupesh Kumar”,“year”:“2015”}、{“密钥”:“e_1_2_1_90_1”、“doi-assert-by”:“publisher”,”doi“:”10.1145\/2567948.2577263“},”{“key”:“e_1_2_1_91_1”,“doi-asserted-by”:“出版商”,“doi”:“10.24963\/ijcai.2018\/611“},{“key”:“e_1_2_1_92_1”,“volume-title”:“神经信息处理系统进展论文集。Z.Ghahramani,M.Welling,C.Cortes,N.D”,“author”:“Sutskever Ilya”},“key“:”e_1_i_1_93_1“,“volome-title“:”实体分辨率和信息质量“,”author“:”Talbert John R.“}volume-title“:“通过转移学习重用和适应实体解析。(9月,“作者”:“Thirumuruganathan Saravanan”,“年份”:“2018”},{“key”:“e_1_1_95_1”,“volume-title”:“智能信息和数据库系统”,“author”:“Tran Hung Nghiep”}、{“密钥”:“e_1_2_1_96_1”、“volume-title”:“神经信息处理系统进展会议录”,“作者“:”Vaswani Ashish“}”,{”key“:”e_2_197_1“,”doi-asserted-by“:”publisher,“DOI”:“10.14778\/2732977.2732982”},{“key”:“e_1_1_98_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.14778\/2350229.2350263“}”,{”key“:”e_1_i_1_99_1“,”volume-title“:”Jingkuan Song,Jianqiu Ji.“,”author“:”Wang Jingdong“,”year“:”2014“},”{“密钥”:“d_2_1_100_1”“,”DOI-assert-by“:”“publisher”,“DOI”:“10.14778\/2536336.2536337”},{“key”:“e_1_2_1_101_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/IJCNN.2011.6033192”},{“key”:“e_1_i_1_102_1”,”doi-assert-by“:”crossref“,”unstructured“:”William e.Winkler,1995。匹配和记录链接。商业调查方法。355\u2013384。https:\/\/www.wiley.com/en-us\/Business+Survey+Methods+-p-9780471598527。威廉·温克勒(William E.Winkler)。1995年。匹配和记录链接。商业调查方法。355\u2013384。https:\/\/www.wiley.com/en-us\/Business+Survey+Methods+-p-9780471598527.“,”DOI“:”10.1002\/978111850504.ch20“},{“key”:“e_1_1_104_1”,“volume-title”:“2018 IEEE国际大数据会议论文集.4268\u20134275”,“author”:“Wolcott L.”},”key“:”e_2_1_105_1“,“DOI-asserted-by”:“publisher”,”DOI:“10.1109\/TIP.2018.2878970“},{”key“:”e_1_1_106_1“,”volume-title“:”乐“,”作者“:”杨志林“,”年份“:”2019“},{“key”:“e_1_cu1_107_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/WI.2005.129“}”,{”key“:”e_2_1_108_1“_1“,”卷标题“:”2014年IEEE服务计算国际会议记录。448\u2013455”,“author”:“Zhang J.”},{“key”:“e_1_2_1_110_1”,“volume title”:“第十三届网络搜索与数据挖掘国际会议论文集。744--752”,“author”:“Zhang Wei”,“year”:“2019”},{“key”:“e_1_2_1_111_1”,“doi asserted by”:“publisher”,“doi”:“10.1145\\3308558.3313578”},{“key”:“e_1_2_1_112_1”,“volume title”:“第32届AAAI人工智能会议记录。“,”author“:”Zhong Zexuan“,”year“:”2018“},{”key“:”e_1_1_113_1“,”doi-asserted-by“:”publisher“,“doi”:“10.24963\/ijcai.2017\/595”}],“container-title”:[“ACM Transactions on Knowledge Discovery from Data”],“original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\\/dl.ACM.org\/doi\/pdf\/10.1145\/34 42200“,”内容类型“:”未指定“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2023,11,2]],”date-time“:”2023-11-02T13:47:58Z“,”timestamp“:1698932878000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3442200”}},“字幕”:[],“短标题”:[],“issued”“:{”日期部分“:[[2021,4,21]]},”references-count“:111,”journal-issue“:{”issue“:“3”,“published-print”:{“date-parts”:[[2021,6,30]]}},“alternative-id”:[“10.1145\/3442200”],“URL”:“http://\/dx.doi.org\/10.1145\/344220”,“relationship”:{},”ISSN“:[”1556-4681“,”1556-472X“],”ISSN-type“:[{”value“:”1556-4581“,“type”:“打印”},{“值”:“1556-472X”,“类型”:“电子”}],“主题”:[],“发布”:{”date-parts“:[[2021,4,21]]},”assertion“:[{”value“:”2020-03-01“,”order“:0,”name“:”received“,”label“:”received“,“group”:{“name”:“publication_history”,“label”:“publication history”}},{“value”:“2020-12-01”,“order”:1,“name”:“accepted”,“tabel”:”accepted“,“值”:“2021-04-21”,“顺序“:2,”名称“:”发布“,”标签“:”已发布“,“组”:{“名称”:“publication_history”,“标签”:“publication history”}}]}