@进行中{wang-etal-2023-maud,title=“{MAUD}:用于理解合并协议的专家注释法律{NLP}数据集”,author=“王、史蒂文和斯卡迪格利、安托万和唐、伦纳德和Chen、Wei和列夫金、德米特里和陈、安雅和鲍尔、斯宾塞和伍德赛德、托马斯和张、奥利弗和Dan Hendrycks“,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.1019",doi=“10.18653/v1/2023.emnlp-main.1019”,pages=“16369--16382”,abstract=“由于法律条款的长度和复杂性以及缺乏专家注释数据集,法律文本的阅读理解可能是一项特别具有挑战性的任务。为了应对这一挑战,我们引入了合并协议理解数据集(MAUD),这是一个基于美国律师协会2021年公共目标交易点研究的专家注释阅读理解数据集,有39000多个例子和47000多个注释。我们的微调变压器基线显示出良好的结果,模型在大多数问题上的表现远远高于随机性。然而,在很大一部分问题上,仍有很大的改进空间。作为唯一由专家注释的合并协议数据集,MAUD作为法律专业和NLP社区的基准非常有价值。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“wang-etal-2023-maud”><标题信息>MAUD:用于理解合并协议的专家注释的法律NLP数据集</titleInfo><name type=“personal”>史蒂文王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>安托万Scardigli刀疤<角色>作者</角色></name><name type=“personal”>伦纳德唐<角色>作者</角色></name><name type=“personal”>魏<namePart type=“given”><namePart type=“family”>陈</namePart><角色>作者</角色></name><name type=“personal”>德米特里列夫金<角色>作者</角色></name><name type=“personal”>安雅<namePart type=“family”>陈</namePart><角色>作者</角色></name><name type=“personal”>斯宾塞<namePart type=“family”>球</namePart><角色>作者</角色></name><name type=“personal”>托马斯伍德赛德<角色>作者</角色></name><name type=“personal”><namePart type=“given”>Oliver</namePart>奥利弗<namePart type=“family”>张<角色>作者</角色></name><name type=“personal”>丹亨德利克斯<角色>作者</角色></name><originInfo>2023-12年发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达布阿莫尔<角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>卡利卡</namePart>巴厘岛<角色>编辑器</角色></name><originInfo>计算语言学协会<地点>新加坡</place></originInfo>会议出版物</relatedItem>由于法律条款的长度和复杂性以及缺乏专家注释数据集,法律文本的阅读理解可能是一项特别具有挑战性的任务。为了应对这一挑战,我们引入了合并协议理解数据集(MAUD),这是一个基于美国律师协会2021年公共目标交易点研究的专家注释阅读理解数据集,包含39000多个示例和47000多个注释。我们的微调变压器基线显示出良好的结果,模型在大多数问题上的表现远远高于随机性。然而,在很大一部分问题上,仍有显著改进的空间。作为唯一由专家注释的合并协议数据集,MAUD作为法律专业和NLP社区的基准非常有价值</摘要><identifier type=“citekey”>wang-etal-2023-maud</identifier>10.18653/v1/2023.emnlp-main.1019<位置><网址>https://aclantology.org/2023.emnlp-main.1019</url></位置><部分>2023-12年<扩展单元=“page”><开始>1636916382</范围></部分></mods></modsCollection>
%0会议记录%T MAUD:用于理解合并协议的专家注释的法律NLP数据集%A Wang,史蒂文%安托万·斯卡迪利%伦纳德·A·唐%A Chen,Wei(陈伟)%德米特里·莱夫金%阿陈,安雅%一个球,斯宾塞%A Woodside,托马斯%奥利弗·A·张%A Hendrycks,Dan%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F wang-etal-2023-maud公司%由于法律条款的长度和复杂性以及缺乏专家注释数据集,法律文本的阅读理解可能是一项特别具有挑战性的任务。为了应对这一挑战,我们引入了合并协议理解数据集(MAUD),这是一个基于美国律师协会2021年公共目标交易点研究的专家注释阅读理解数据集,包含39000多个示例和47000多个注释。我们的微调变压器基线显示出良好的结果,模型在大多数问题上的表现远远高于随机性。然而,在很大一部分问题上,仍有很大的改进空间。作为唯一由专家注释的合并协议数据集,MAUD作为法律专业和NLP社区的基准非常有价值。%R10.18653/v1/2023.emnlp-main.1019%U型https://aclantology.org/2023.emnlp-main.1019%U型https://doi.org/10.18653/v1/2023.emnlp-main.1019%电话:16369-16382
降价(非正式)
【MAUD:用于理解合并协议的专家注释的法律NLP数据集】(https://aclantology.org/2023.emnlp-main.1019)(Wang等人,EMNLP 2023)
国际计算语言学协会
- Steven Wang、Antoine Scardigli、Leonard Tang、Wei Chen、Dmitry Levkin、Anya Chen、Spencer Ball、Thomas Woodside、Oliver Zhang和Dan Hendrycks。2023MAUD:用于理解合并协议的专家注释的法律NLP数据集.英寸2023年自然语言处理实证方法会议记录第16369–16382页,新加坡。计算语言学协会。