第一段视频对工作进行了两分钟的简要总结,说明了所提议的方法、定性结果和应用(无旁白)。第二段视频提供了一个更详细的五分钟叙事描述,包括配音、BSL翻译和英文字幕。
我们提供改进的I3D模型(100MB)使用700K稀疏符号注释(有关性能,请参阅本文的表1)。请参阅代码发布我们的ECCV’20论文使用此模型。
通过从5K个单词的词汇表中使用M+D+A注释对该模型进行微调,可以进一步改进:此型号(136MB)可用于预处理或提取视频特征。