@正在进行的{bast-etal-2023展览会,title=“对现有端到端实体链接系统的公平深入评估”,author=“Bast、Hannah和Hertel、Matthias和Natalie Prange”,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.411",doi=“10.18653/v1/2023.emnlp-main.411”,pages=“6659--6672”,abstract=“实体链接系统的现有评估通常很少说明系统在特定应用程序中的性能。这有两个基本原因。一是许多评估只使用聚合度量(如精度、召回和F1得分)没有详细的错误分析或更仔细地查看结果。另一个是,所有广泛使用的基准都有很强的偏见和人为因素,尤其是:对命名实体的强烈关注,对实体提及的其他内容的不明确或缺失的规范,对歧义的处理不力,以及对某些类型实体的代表性过高或过低。我们对各种现有的端到端实体链接器进行了更有意义和公平的深入评估。我们描述了它们的优缺点,并报告了再现性方面的情况。我们评估的详细结果可以通过以下方式进行检查https://elevant.cs.uni-freiburg.de/emnlp2023。我们的评估基于几个广泛使用的基准,这些基准在不同程度上反映了上述问题,以及两个解决上述问题的新基准。新的基准可以在下面找到https://github.com/ad-freiburg/fair-entity-linking-bequicks。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“bast-etal-2023-fair”><标题信息>对现有端到端实体链接系统进行公正深入的评估</titleInfo><name type=“personal”>汉娜<namePart type=“family”>巴斯特</namePart><角色>作者</角色></name><name type=“personal”>马提亚斯赫特尔<角色>作者</角色></name><name type=“personal”>娜塔莉普拉奇<角色>作者</角色></name><originInfo>2023-12年发布</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达布阿莫尔<角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”>卡利卡语巴厘岛<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>新加坡</地点></originInfo>会议出版物</relatedItem>实体链接系统的现有评估通常很少说明系统将如何为特定应用程序执行。这有两个根本原因。一是许多评估只使用聚合度量(如精确度、召回率和F1得分),没有详细的错误分析或更仔细地查看结果。另一个是,所有广泛使用的基准都有很强的偏见和工件,特别是:对命名实体的强烈关注,对实体提及的其他内容的不明确或缺失的规范,对歧义的处理不当,以及对某些类型实体的过度或低估。我们对各种现有的端到端实体链接器进行了更有意义和公平的深入评估。我们描述了它们的优缺点,并报告了再现性方面的情况。我们评估的详细结果可以通过以下方式进行检查https://elevant.cs.uni-freiburg.de/emnlp2023。我们的评估是基于几个广泛使用的基准,这些基准在不同程度上显示了上述问题,以及基于两个新的基准,这些基准解决了上述问题。新的基准可以在下面找到https://github.com/ad-freiburg/fair-entity-linking-bequicks。</摘要>bast-etal-2023-展览会10.18653/v1/2023.emnlp-main.411<位置><网址>https://aclantology.org/2023.emnlp-main.411</url></位置><部分><日期>2023-12年</日期><扩展单元=“page”><开始>6659</开始>6672</范围></部分></mods></modsCollection>
%0会议记录%对现有端到端实体链接系统的公平和深入评估%一个巴斯特,汉娜%马提亚斯·赫特尔%娜塔莉,A Prange%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F bast-etal-2023展览会%X实体链接系统的现有评估通常很少说明系统将如何为特定应用程序执行。这有两个根本原因。一是许多评估只使用聚合度量(如精确度、召回率和F1得分),没有详细的错误分析或更仔细地查看结果。另一个是,所有广泛使用的基准都有很强的偏见和工件,特别是:对命名实体的强烈关注,对实体提及的其他内容的不明确或缺失的规范,对歧义的处理不当,以及对某些类型实体的过度或低估。我们对各种现有的端到端实体链接器进行了更有意义和公平的深入评估。我们描述了它们的优缺点,并报告了再现性方面的情况。我们评估的详细结果可以通过以下方式进行检查https://elevant.cs.uni-freiburg.de/emnlp2023。我们的评估基于几个广泛使用的基准,这些基准在不同程度上反映了上述问题,以及两个解决上述问题的新基准。新的基准可以在下面找到https://github.com/ad-freiburg/fair-entity-linking-bequicks。%R 10.18653/v1/2023.emnlp-main.411%单位https://aclantology.org/2023.emnlp-main.411%单位https://doi.org/10.18653/v1/2023.emnlp-main.411%电话:6659-6672
降价(非正式)
[对现有端到端实体链接系统的公正深入评估](https://aclantology.org/2023.emnlp-main.411)(Bast等人,EMNLP 2023)
国际计算语言学协会
- Hannah Bast、Matthias Hertel和Natalie Prange。2023对现有端到端实体链接系统的公正深入评估.英寸2023年自然语言处理实证方法会议记录,第6659–6672页,新加坡。计算语言学协会。