VGG唇读数据集

LRW、LRS2和LRS3是从在野外视频。

600万+
单词实例

800 +
小时

5,000 +
身份

下载

数据集由两个版本组成，LRW和LRS2。每个版本都有自己的训练/测试划分。对于每一个，我们都提供了裁剪的人脸轨迹和相应的字幕。这两个版本之间没有重叠。

LRW（英国广播公司）

多达1000个500个不同单词的话语

LRS2（英国广播公司）

来自英国电视台的1000条自然语句

LRS3（TED）

TED和TEDx视频中的1000个自然句子

出版物

如果您使用数据集，请引用以下内容。

[1]J.S.Chung，A.齐瑟曼

野外唇读

2016年亚洲计算机视觉大会

Biptex公司|PDF格式|全部

@诉讼中{Chung16，author=“Chung，J.~S.和Zisserman，A.”，title=“野外唇读”，booktitle=“亚洲计算机视觉会议”，year=“2016”，}

[2]J.S.Chung，A.高级，O.葡萄酒，A.齐瑟曼

野外唇读句子

2017年IEEE计算机视觉和模式识别会议

Biptex公司|PDF格式|全部

@诉讼中{Chung17，author=“Chung，J.~S.和Senior，A.，以及Vinyals，O.和Zisserman，A.”，title=“狂野中的唇读句子”，booktitle=“IEEE计算机视觉和模式识别会议”，year=“2017”，}

[3]J.S.Chung，A.齐瑟曼

侧面唇读

2017年英国机器视觉大会

Biptex公司|PDF格式|全部

@诉讼{Chung17a，author=“Chung，J.~S.和Zisserman，A.”，title=“侧面唇读”，booktitle=“英国机器视觉会议”，year=“2017”，}

600万+
单词实例

800 +
小时

5,000 +
身份

下载

LRW（英国广播公司）

LRS2（英国广播公司）

LRS3（TED）

出版物

如果您使用数据集，请引用以下内容。

应用

视听语音识别

语音分离

人脸合成

鸣谢

这项工作得到了EPSRC计划拨款的支持参见bibyte EP/M013774/1：大数据时代的可视化搜索。我们非常感谢英国广播公司研发部的Rob Cooper和Matt Haynes在提供LRW和LRS2数据集方面提供的帮助。

600万+ 单词实例

800 + 小时

5,000 + 身份

下载

LRW（英国广播公司）

LRS2（英国广播公司）

LRS3（TED）

出版物

如果您使用数据集，请引用以下内容。

应用

视听语音识别

语音分离

人脸合成

鸣谢

这项工作得到了EPSRC计划拨款的支持参见bibyte EP/M013774/1：大数据时代的可视化搜索。我们非常感谢英国广播公司研发部的Rob Cooper和Matt Haynes在提供LRW和LRS2数据集方面提供的帮助。

600万+
单词实例

800 +
小时

5,000 +
身份