概述




这项工作的重点是识别标志-给定一个孤立标志的视频,我们的任务是识别是否哪里它是在一段连续的、共同表达的手语视频中签署的。为了完成这项识别标志的任务,我们使用多种可用的监督方式训练一个模型:(1)观看现有稀疏标记的镜头;(2)阅读提供额外弱监管的相关字幕(签名内容的现成翻译);(3)抬头看视觉手语词典中的单词(没有共同表达的标记示例),以实现新颖的手势识别。

视频摘要

第一段视频对作品进行了一分钟的简短总结,说明了应用程序(无旁白)。第二段视频提供了更详细的叙述性描述,包括配音、BSL翻译和英文字幕(约10分钟长)。

短视频(1分钟)

旁白视频(10分钟)

采样说明

BSLDict数据集

下载:可以找到BSLDict数据集的文档和下载说明在这里.
许可证:BSLDict数据集可以下载用于商业/研究目的Creative Commons Attribution 4.0国际许可。版权归视频的原始所有者所有。可以找到许可证的完整版本在这里.
注意:我们注意到数据的几个局限性在这里。如果您在此处看到任何您自己的视频,并对其是否包含在数据集中有任何疑问,请联系我们(电子邮件地址列在论文中)。

致谢

这项工作得到了EPSRC赠款ExTol、英国EPSRC自主智能机器和系统CDT、牛津大学-谷歌DeepMind研究生奖学金、EPSRC项目赠款Seebbyte EP/M013774/1和皇家学会研究教授2019 RP\R1\191132的支持。作者还感谢Daniel Mitchellsignbsl.com网站网页可用。