唇读数据集
轻轨车辆、轻轨S2、轻轨S3

LRW、LRS2和LRS3是从在野外视频。

600万+

单词实例

800 +

小时

5,000 +

身份


下载

数据集由两个版本组成,LRW和LRS2。每个版本都有自己的训练/测试划分。对于每一个,我们都提供了裁剪的人脸轨迹和相应的字幕。这两个版本之间没有重叠。


LRW(英国广播公司)

多达1000个500个不同单词的话语

LRS2(英国广播公司)

来自英国电视台的1000条自然语句

LRS3(TED)

TED和TEDx视频中的1000个自然句子

出版物

如果您使用数据集,请引用以下内容。

[1]J.S.Chung,A.齐瑟曼
2016年亚洲计算机视觉大会

[2]J.S.Chung,A.高级,O.葡萄酒,A.齐瑟曼
2017年IEEE计算机视觉和模式识别会议

[3]J.S.Chung,A.齐瑟曼
2017年英国机器视觉大会

应用

视听数据集可用于多种应用,包括:

鸣谢

这项工作得到了EPSRC计划拨款的支持参见bibyte EP/M013774/1:大数据时代的可视化搜索。我们非常感谢英国广播公司研发部的Rob Cooper和Matt Haynes在提供LRW和LRS2数据集方面提供的帮助。