概述




这项工作的目标是检测和识别在英国手语(BSL)中使用手指拼写签名的字母序列。以前的指纹识别方法并没有将重点放在BSL上,BSL与美国手语(ASL)有着非常不同的手语字母表(例如,双手而非单手)。他们还使用手动注释进行培训。与以前的方法相比,我们的方法只使用字幕中的弱注释进行训练。我们使用一种简单的特征相似度方法定位潜在的指纹拼写实例,然后通过查询字幕词并从签名者处搜索相应的发音线索来自动标注这些实例。我们提出了一种适用于此任务的Transformer架构,具有多假设CTC损失函数,以学习其他注释可能性。我们采用多阶段训练方法,在再次重新训练之前,我们使用训练模型的初始版本来扩展和增强训练数据,以获得更好的性能。通过广泛的评估,我们验证了我们的自动注释方法和模型体系结构。此外,我们还提供了一个由人类专家注释的测试集5公里用于评估BSL指纹识别方法以支持手语研究的视频剪辑。

测试集示例

下面显示了我们的指纹拼写模型的一些结果。
注意:为了可视化目的,视频会放慢速度。







致谢

这项工作得到了牛津大学-谷歌DeepMind研究生奖学金、EPSRC Ex-Tol奖学金、皇家学会研究教授和ANR项目CorVis ANR-21-CE23-0003-01的支持。HB感谢Annelies Braffort和Michèle Gouiffès的支持。