BOBSL:英国广播公司牛津英国手语数据集

BOBSL(v1_2版)是英国手语(BSL)的大规模数据集。它包括1940集(约1400小时)由英国广播公司(BSL)翻译的英国广播公司播出的视频,并配有书面英语字幕。从恐怖、时代和医疗剧、历史、自然和科学纪录片、情景喜剧、儿童节目和涵盖烹饪、美容、商务和旅行的节目,BOBSL涵盖了广泛的主题。BOBSLv1_2还包括272集,作为ECCV SLRTP 2022车间挑战的挑战部分。这个分区没有字幕或注释。该数据集共有37名签名者(不包括挑战集中的签名者)。不同的签名者出现在训练、验证、测试和挑战集中,用于进行签名者独立评估。


拆分 第集 签名人数 句子数量 文本Vocab。 持续时间(小时)
火车 1,658 27 993千 7.2万 1,220
val值 32 6 20公里 13公里 27
测试 250 4 16.5万 3.5万 200
攻击试验 272 4 - - 213
总计(不包括挑战测试) 1,940 37 120万 7.7万 1,447

您还可以找到数据集的不推荐使用的早期版本的统计信息(BOBSLv1_0级BOBSLv1_1级).


有关数据集构建的更多详细信息,请访问技术报告的链接:

新闻

示例视频

标志识别注释


句子对齐批注

数据和使用条款

该数据集是使用BBC节目内容创建的提供给牛津大学研究“英国手语翻译的端到端解决方案”作为EPSRC资助项目Extol的一部分。数据集(包括视频和元数据)由提供牛津大学对来自大学和其他机构的研究人员声誉良好的学术机构和相关公共组织对相关领域的非商业、学术研究Extol项目(英国手语和相关的可访问性)。独立研究人员、中等教育(例如高中生),或商业组织。在获得访问权限之前,您需要完成与BBC签订的“BBC BOBSL使用条款”协议。有关信息,请访问BBC研发网站:https://www.bbc.co.uk/rd/projects/extol-dataset网站.表格经英国广播公司批准后,他们将为您提供个人密码,然后可以从该站点下载BBC数据集。BBC完全拥有并控制数据集及其任何使用。

下载

单个数据文件和注释可用于从下载https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/.BOBSLv1_2包括ECCV 2022 SLRTP挑战集。

为了下载数据集,我们推荐使用属于GNU(全球导航单元)Wget公司对于递归选项,就像这样:

                                  #当心!这将下载1.6 TiB的数据。wget--recursive--no-parent--continue--wait=1\--无主目录--剪切目录2\--用户${BOBSL_USERNAME}--密码${BOBSL_password}\https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/
                                

可以下载子集通过指定感兴趣的目录,如下所示:

                                  #仅下载视频(294 GiB)得到。。。。https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/videos#下载姿势估计(591 GiB)得到。。。。https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/pose#下载光流估算(671 GiB)得到。。。。https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/flow#要下载仅点选(60 MiB)或仅字幕(34.9 MiB)或子集地图,请访问:https://thor.robots.ox.ac.uk网址/~vgg/data/bobsl/
                                

SHA256和MD5校验和为用于验证数据:

                                  sha256sum—检查bobsl.sha256sumssha256sum—检查bobsl-videos.sha256sumssha256sum—检查bobsl-pose.sha256sumssha256sum—检查bobsl-flow.sha256sums
                                

出版物

如果您使用此数据集,请考虑引用以下论文:

S.Albanie*、G.Varol*、L.Momeni*、H.Bull*、T.Afouras、,H.Chowdhury、N.Fox、B.Woll、,R.Cooper、A.McParland、A.Zisserman。
BBC-牛津英国手语数据集
S.Albanie*、G.Varol*、L.Momeni、T.Afouras、J.S.Chung、N.Fox、B.Woll、A.Zisserman。
BSL-1K:使用发音线索扩大联合发音手语识别

挑战

查看作为SLRTP’22车间。研讨会结束后,评估服务器将保持打开状态。

联系人

视频中出现在口译员背后的背景脸已被匿名自动。然而,可能会有错误-如果您发现任何错误,请联系我们启用他们的解决方案。此联系人的电子邮件以及任何其他相关查询致BOBSL:albanie[AT]robots.ox.ac.uk

致谢

这项工作得到了EPSRC Grant EXTol EP/R03298X/1的支持。