视觉几何组-牛津大学

2024

Y.Bhalgat公司,I.莱娜，J.F.亨里克,A.维达尔迪，A.齐瑟曼

2024年欧洲计算机视觉会议

@在诉讼中{Bhalgat24，author=“Yash Bhalgat and Iro Laina and Joao ~ F.Henriques and Andrea Vedaldi and Andrew Zisserman”，title=“{N2F2}:嵌套神经特征场的分层场景理解”，booktitle=“欧洲计算机视觉会议”，年=“2024”，}

J.白垩,J.嗯,哈萨克斯坦东部，A.齐瑟曼，D.达门

TIM：一种用于视听动作识别的时间间隔机器

2024年IEEE计算机视觉和模式识别会议

Biptex公司|摘要|PDF格式|代码|项目页面|arXiv公司|全部

@会议记录{Chalk24a，author=“Jacob Chalk、Jaesung Huh、Evangelos Kazakos、Andrew Zisserman和Dima Damen”，title=“TIM:用于视听动作识别的时间间隔机器”，booktitle=“IEEE计算机视觉和模式识别会议”，年=“2024”，}

M.汉密尔顿,A.齐瑟曼，J.R.好时，W.T.弗里曼

将“Chirp”与“Chat”分离：声音和语言的自我监督视觉基础

2024年IEEE计算机视觉和模式识别会议

Biptex公司|摘要|PDF格式|项目页面|阿尔西夫|代码|全部

@会议记录{哈密尔顿24，author=“马克·汉密尔顿（Mark Hamilton）、安德鲁·齐瑟曼（Andrew Zisserman）、约翰·赫尔希（John R.Hershey）和威廉·弗里曼（William T.Freeman）”，title=“将“唧唧声”从“聊天”中分离出来：声音和语言的自我监督视觉基础”，booktitle=“IEEE计算机视觉和模式识别会议”，年=“2024”，}

T.韩,M.贝恩,A.纳格拉尼,G.瓦罗尔,谢伟东（W.Xie）,A.齐瑟曼

AutoAD III：前传——回到像素

2024年IEEE计算机视觉和模式识别会议

Biptex公司|摘要|PDF格式|项目页面|阿尔西夫|代码|全部

@诉讼中{Han24，author=“Tengda Han和Max Bain以及Arsha Nagrani和G{”u}l Varol和Weidi Xie以及Andrew Zisserman“，title=“{AutoAD III}:前传--回到像素”，booktitle=“IEEE计算机视觉和模式识别会议”，年=“2024”，}

J.嗯,J.S.钟,A.纳格拉尼,A.布朗,J.Jung（荣格）,D.加西亚-罗默罗,A.齐瑟曼

VoxCele演讲者识别挑战：回顾

IEEE/ACM音频、语音和语言处理汇刊，第32卷，第3850-38662024页

@第{Huh24条，author=“Jaesung Huh、Joon Son Chung、Arsha Nagrani、Andrew Brown、Jee-weon Jung、Daniel Garcia-Romero和Andrew Zisserman”，title=“VoxCele演讲者识别挑战：回顾”，journal=“IEEE/ACM音频、语音和语言处理事务”，volume=“32”，pages=“3850--3866”，年=“2024”，publisher=“IEEE”，keywords=“说话人识别，说话人日记”，doi=“10.1109/TASLP.2024.344456”，}

V.拉欣,谢伟东（W.Xie）,E.拉赫图,A.齐瑟曼

Synchformer：稀疏线索的高效同步

2024年声学、语音和信号处理国际会议

Biptex公司|摘要|PDF格式|项目页面|代码|全部

@诉讼中{Iashin24a，author=“弗拉基米尔·拉欣（Vladimir Iashin）、谢伟迪（Weidi Xie）、埃萨·拉图（Esa Rahtu）和安德鲁·齐瑟曼（Andrew Zisserman）”，title=“Synchformer：稀疏线索的高效同步”，booktitle=“声学、语音和信号处理国际会议”，年=“2024”，组织=“IEEE”，}

B.科尔巴,J.嗯,A.齐瑟曼

看、听和识别：角色软件视听字幕

2024年声学、语音和信号处理国际会议

Biptex公司|摘要|PDF格式|项目页面|全部

@诉讼中{Korbar24，author=“Bruno Korbar和Jaesung Huh以及Andrew Zisserman”，title=“看、听和识别：角色软件视听字幕”，booktitle=“声学、语音和信号处理国际会议”，年=“2024”，}

B.科尔巴,Y.Xian，A.托尼奥尼，A.齐瑟曼，F.汤巴里

用于长格式视频理解的文本条件重采样

2024年欧洲计算机视觉会议

Biptex公司|摘要|PDF格式|全部

@诉讼中{Korbar24a，author=“Bruno Korbar和Yongqin Xian以及Alessio Tonioni和Andrew Zisserman以及Federico Tombari”，title=“用于长格式视频理解的文本条件重采样器”，booktitle=“欧洲计算机视觉会议”，年=“2024”，}

A.昂塞斯库,J.F.亨里克,A.齐瑟曼，S.奥尔巴尼,A.S.科普克

一种可靠的方法：使用大型语言模型生成音频描述，用于以自我为中心的文本音频检索

2024年声学、语音和信号处理国际会议

Biptex公司|摘要|PDF格式|全部

@诉讼中{Oncescu24，author=“安德烈亚·马里亚·昂塞斯库（Andreea-Maria Oncescu）和若奥·F·亨利克斯（Joao~F.Henriques）、安德鲁·齐瑟曼（Andrew Zisserman）、塞缪尔·阿尔巴尼（Samuel Albanie）和A.索菲亚·科普克（A，title=“声音方法：使用大型语言模型生成音频描述，用于以自我为中心的文本音频检索”，booktitle=“声学、语音和信号处理国际会议”，年=“2024”，}

K.R.Prajwal公司,T.阿福拉斯,A.齐瑟曼口腔

语音识别模型是强大的唇读器

2024年国际演讲

Biptex公司|摘要|PDF格式|项目页面|全部

@会议记录{Prajwal24，author=“K R Prajwal and Triantafyllos Afouras and Andrew Zisserman”，title=“语音识别模型是强大的唇读器”，booktitle=“INTERSPEECH”，年=“2024”，keywords=“唇读，asr”，}

显示完整列表（516份出版物）

1 2 三 4 5 6 7 8 9 10 11 12 13 14 15 »