“在数百万视频中提取视觉语言模型。”
岳照 , 龙照 , 周兴义 , 吴嘉林 , Chun-Te Chu先生 , 回族苗族 , 弗洛里安·施罗夫 , 哈特维格·亚当 , 刘婷(Ting Liu) , 博清宫 , 菲利普·克雷恩布尔(Philipp Krähenbühl) , 梁哲源 :
在数百万视频中提取视觉语言模型。 CoRR公司 abs/2401.06129 ( 2024 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。