在这项工作中,我们提出了一个框架,可以收集大规模、多样的手语数据集,用于训练自动手语识别模型。这项工作的第一个贡献是SDTrack,这是一种用于野外签名者跟踪和日记的通用方法。我们的第二个贡献是展示如何使用SDTrack自动注释90小时的英国手语(BSL)内容,这些内容涵盖了广泛的签名者,包括采访、独白和辩论。使用SDTrack,该数据用35K个活动签名轨道、相应的视频级签名者标识符和字幕以及40K个自动本地化的签名标签进行注释。
这项工作得到了EPSRC Grant EXTol EP/R03298X/1的支持。