@进行中{lai-etal-2022-behancecc,title=“{B}ehance{CC}:A{C}点击{C}hat实时流视频脚本检测数据集”,author=“赖、越南和Pouran Ben Veyseh、Amir和德农考特、弗兰克和阮,阮“,editor=“Calzolari、Nicoletta和B{\'e}切特,Fr{\e}d{\ee}ric和Blache、Philippe和Choukri、Khalid和Cieri、Christopher和Declerck、Thierry和戈吉、萨拉和Isahara、Hitoshi和Maegaard、Bente和玛丽亚尼、约瑟夫和Mazo、H{\'e}l{\`e}ne和Odijk、Jan和Piperidis,Stelios“,booktitle=“第十三届语言资源与评价会议论文集”,月份=六月,年=“2022”,address=“法国马赛”,publisher=“欧洲语言资源协会”,url=“https://aclantology.org/2022.lrec-1.791”,pages=“7284--7290”,abstract=“直播视频已成为视频共享和教育目的的有效广播方法。然而,直播视频包含大量离题内容(即高达50%)这给下游应用程序带来了显著的噪声和数据负载。本文介绍了BehanceCC,这是一个新的用于流媒体视频脚本中的非主题检测(也称为聊天检测)的人注释基准数据集。除了描述数据集的挑战外,我们对各种基线的广泛实验揭示了流媒体视频聊天检测的复杂性,并为这项任务提出了潜在的未来研究方向。该数据集将公开,以促进该领域的研究。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“lai-etal-2022-behancecc”><标题信息>BehanceCC:实时流视频脚本的ChitChat检测数据集</titleInfo><name type=“personal”>越南赖<角色>作者</角色></name><name type=“personal”>Amir(阿米尔)波兰·本·韦瑟<角色>作者</角色></name><name type=“personal”>弗兰克德隆考特<角色>作者</角色></name><name type=“personal”>蒂恩阮<namePart type=“family”>阮</namePart><角色>作者</角色></name><originInfo>2022-06发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第十三届语言资源与评估会议记录</titleInfo><name type=“personal”><namePart type=“given”>Nicoletta</namePart>卡尔佐拉里<角色>编辑器</角色></name><name type=“personal”>弗雷德里克贝歇<角色>编辑器</角色></name><name type=“personal”>菲利普布莱切<角色>编辑器</角色></name><name type=“personal”>哈立德乔克里<角色>编辑器</角色></name><name type=“personal”>克里斯托弗Cieri公司<角色>编辑器</角色></name><name type=“personal”>蒂埃里Declerck公司<角色>编辑器</角色></name><name type=“personal”>萨拉戈吉<角色>编辑器</角色></name><name type=“personal”>HitoshiIsahara<角色>编辑器</角色></name><name type=“personal”>Bente(本特)梅加德<角色>编辑器</角色></name><name type=“personal”>约瑟夫玛丽亚尼<角色>编辑器</角色></name><name type=“personal”>Hélène<namePart type=“family”>马祖<角色>编辑器</角色></name><name type=“personal”>一月<namePart type=“family”>Odijk</namePart><角色>编辑器</角色></name><name type=“personal”>Stelios公司哌啶虫<角色>编辑器</角色></name><originInfo>欧洲语言资源协会<地点>法国马赛</place></originInfo>会议出版物</relatedItem><abstract>直播视频已成为视频共享和教育目的的有效广播方法。然而,直播视频包含大量离题内容(即高达50%),这会给下游应用程序带来显著的噪音和数据负载。本文介绍了BehanceCC,这是一个新的用于流媒体视频脚本中的非主题检测(也称为聊天检测)的人注释基准数据集。除了描述数据集的挑战外,我们对各种基线的广泛实验揭示了流媒体视频聊天检测的复杂性,并为这项任务提出了潜在的未来研究方向。该数据集将公开,以促进该领域的研究</摘要>lai-etal-2022-behancecc<位置><网址>https://aclantology.org/2022.lrec-1.791</url></位置><部分>2022-06年<扩展单元=“page”><开始>7284</开始><end>7290</范围></部分></模块></modsCollection>
%0会议记录%T BehanceCC:用于直播视频转录的ChitChat检测数据集%越南阿来%阿米尔·A Pouran Ben Veyseh%法兰克,德隆考特%阮先生%尼科莱塔·Y·卡尔佐拉里%Y Béchet,Frédéric%Y Blache,菲利普%哈立德·朱克里%克里斯托弗·西埃里%蒂埃里·德克勒克%萨拉·戈吉%Y Isahara,Hitoshi%Y Maegaard,本特%约瑟夫·马里亚尼%耶鲁·马佐%Y Odijk,简%Y Piperidis、Stelios%第十三届语言资源与评价会议论文集%D 2022年%6月8日%I欧洲语言资源协会%C马赛,法国%F莱塔-2022-behancecc%X直播视频已成为视频共享和教育目的的有效广播方法。然而,直播视频包含大量非主题内容(即高达50%),这给下游应用程序带来了显著的噪音和数据负载。本文介绍了BehanceCC,这是一个新的用于流媒体视频脚本中的非主题检测(也称为聊天检测)的人注释基准数据集。除了描述数据集的挑战外,我们对各种基线的广泛实验揭示了流媒体视频聊天检测的复杂性,并为这项任务提出了潜在的未来研究方向。该数据集将公开,以促进这一领域的研究。%U型https://aclantology.org/2022.lrec-1.791%电话7284-7290
降价(非正式)
[BehanceCC:直播视频脚本的ChitChat检测数据集](https://aclantology.org/2022.lrec-1.791)(Lai等人,LREC 2022)
国际计算语言学协会