@在过程中{yao-etal-022-leven,title=“{LEVEN}:A大型{C} 中文法律事件检测数据集”,author=“姚、冯和肖朝军和王晓志和刘志远和侯、雷和涂、存超和李、娟子和刘、云和沈伟兴和孙茂松”,editor=“Muresan、Smaranda和纳科夫、普雷斯拉夫和Aline Villavicencio“,booktitle=“计算语言学协会的发现:ACL 2022”,月=5月,年=“2022”,address=“爱尔兰都柏林”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.findings-acl.17",doi=“10.18653/v1/2022.findings-acl.17”,pages=“183--201”,abstract=“识别事实是作出判断的最基本步骤,因此检测法律文件中的事件对法律案例分析任务非常重要。然而,现有的法律事件检测(LED)数据集只涉及不理解的事件类型,注释数据有限,这限制了LED方法及其下游应用的发展。为了缓解这些问题,我们向LEVEN提供了一个大规模的中国LEgal eVENt检测数据集,其中包含8116份法律文件和150977份涉及108种事件类型的人工注释事件。LEVEN不仅涵盖了与充电相关的事件,还涵盖了一般事件,这些事件对于理解法律案件至关重要,但在现有LED数据集中被忽视了。据我们所知,LEVEN是最大的LED数据集,其数据规模是其他数据集的几十倍,这将大大促进LED方法的培训和评估。大量实验结果表明,LED具有挑战性,需要进一步努力。此外,我们只是利用法律事件作为辅助信息来推广下游应用程序。该方法在低资源判断预测中平均精度提高了2.2点,在无监督案例检索中平均精度提高了1.5点,这表明了LED的根本性。源代码和数据集可以从\url获得{https://github.com/thunlp/LEVEN}.",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“yao-etal-2022-leven”><标题信息>LEVEN:中国大型法律事件检测数据集</titleInfo><name type=“personal”>冯姚明<角色>作者</角色></name><name type=“personal”>朝军<namePart type=“given”>肖(Xiao)<角色>作者</角色></name><name type=“personal”><namePart type=“given”>小智<namePart type=“family”>王</namePart><角色>作者</角色></name><name type=“personal”><namePart type=“given”>致远</namePart>刘<角色>作者</角色></name><name type=“personal”>雷<namePart type=“given”>侯<角色>作者</角色></name><name type=“personal”>寸草<namePart type=“given”><namePart type=“family”>Tu</namePart>图</namePart<角色>作者</角色></name><name type=“personal”>娟子李<namePart type=“family”><角色>作者</角色></name><name type=“personal”>Yun(云)刘<角色>作者</角色></name><name type=“personal”>伟兴<namePart type=“given”>沈<namePart type=“family”><角色>作者</角色></name><name type=“personal”>毛松太阳<角色>作者</角色></name><originInfo>2022-05发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息><title=计算语言学协会的研究结果:ACL 2022</title=</titleInfo><name type=“personal”>斯马兰达穆雷桑<角色>编辑器</角色></name><name type=“personal”>普雷斯拉夫纳科夫<角色>编辑器</角色></name><name type=“personal”>Aline(别名)维拉维森西奥<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>爱尔兰都柏林</place></originInfo>会议出版物</relatedItem>识别事实是作出判断的最基本步骤,因此,检测法律文件中的事件对法律案例分析任务非常重要。然而,现有的法律事件检测(Legal Event Detection,LED)数据集只涉及不理解的事件类型,并且注释数据有限,这限制了LED方法及其下游应用的发展。为了缓解这些问题,我们向LEVEN提供了一个大规模的中国LEgal eVENt检测数据集,其中包含8116份法律文件和150977份涉及108种事件类型的人工注释事件。LEVEN不仅涵盖了与充电相关的事件,还涵盖了一般事件,这些事件对于理解法律案件至关重要,但在现有LED数据集中被忽视了。据我们所知,LEVEN是最大的LED数据集,其数据规模是其他数据集的几十倍,这将大大促进LED方法的培训和评估。大量实验结果表明,LED具有挑战性,需要进一步努力。此外,我们只是利用法律事件作为辅助信息来推广下游应用程序。该方法在低资源判断预测中平均提高了2.2点精度,在无监督案例检索中平均提高1.5点精度,这表明了LED的重要性。源代码和数据集可以从https://github.com/thunlp/LEVEN。</摘要>yao-etal-2022-leven10.18653/v1/2022.findings-acl.17<位置><网址>https://acl选集.org/2022.findings-acl.17</url></位置><部分>2022-05年<扩展单元=“page”><开始>183201年年底</范围></部分></模块></modsCollection>
%0会议记录%T LEVEN:一个大规模的中国法律事件检测数据集%阿瑶、冯%阿晓、朝军%王小志%刘志远%阿侯、雷%阿图,村曹%A李,娟子%刘云%阿申、伟星%孙茂松%Y Muresan,斯马兰达%普雷斯拉夫·纳科夫%Y Villavicencio,阿琳%计算语言学协会的研究结果:ACL 2022%D 2022年%5月8日%计算语言学协会%C都柏林,爱尔兰%F yao-etal-2022-leven公司%X认识事实是做出判决的最基本步骤,因此发现法律文件中的事件对法律案件分析任务很重要。然而,现有的法律事件检测(Legal Event Detection,LED)数据集只涉及不理解的事件类型,并且注释数据有限,这限制了LED方法及其下游应用的发展。为了缓解这些问题,我们向LEVEN提供了一个大规模的中国LEgal eVENt检测数据集,其中包含8116份法律文件和150977份涉及108种事件类型的人工注释事件。LEVEN不仅涵盖了与充电相关的事件,还涵盖了一般事件,这些事件对于理解法律案件至关重要,但在现有LED数据集中被忽视了。据我们所知,LEVEN是最大的LED数据集,其数据规模是其他数据集的几十倍,这将大大促进LED方法的培训和评估。大量实验结果表明,LED具有挑战性,需要进一步努力。此外,我们只是利用法律事件作为辅助信息来推广下游应用程序。该方法在低资源判断预测中平均提高了2.2点精度,在无监督案例检索中平均提高1.5点精度,这表明了LED的重要性。源代码和数据集可以从https://github.com/thunlp/LEVEN。%R 10.18653/v1/2022.查找-acl.17%U型https://aclantology.org/2022.findings-acl.17%U型https://doi.org/10.18653/v1/2022.findings-acl.17%第183-201页
降价(非正式)
[LEVEN:中国大型法律事件检测数据集](https://aclantology.org/2022.findings-acl.17)(Yao等人,《2022年调查结果》)
国际计算语言学协会