MMPT@ICMR 2021年:台湾台北
贝柳 , 傅建龙 , 陈士哲 , 秦进 , 亚历山大·豪普特曼 , 永瑞 :
MMPT@ICMR2021 :2021年多媒体理解多模式预培训研讨会论文集,台湾台北,2021年8月21日。 ACM公司 2021 ,国际标准图书编号 978-1-4503-8530-5 王利民(Limin Wang) :
用于视频理解的跨模式预训练和匹配。 1-2 宋瑞华 :
文澜:基于真实世界数据的高效大规模多模态预训练。 三 黄玉盘 , 曾兆阳 , 宇通路 :
具体点,明确点:场景引导变压器桥接机器和人工字幕。 4-13 谢燕伟 , 刘大庆 , 陈学进 , 郑俊查 :
用于指称表达式理解的语言条件区域建议和检索网络。 14-22 刘敖之 , 张丽佩 , 亚奇梅 , 韩宝强 , 蔡紫峰 , 朱兆华 , 京晓 :
基于单声道乐谱的端到端光学音乐识别的剩余递归CRNN。 23-27 李婷婷 , 赵欢 , 宋王 , Jing Huang(黄晶) :
多领域风格引导的图像到图像转换。 28-36 Gullal S.Cheema公司 , 谢尔佐德·哈基莫夫 , 埃里克·米勒-巴达克 , 拉尔夫·埃沃思 :
多模态推文情感分析方法的公平全面比较。 37-45 马蒂亚斯·斯普林斯坦 , 埃里克·米勒-巴达克 , 拉尔夫·埃沃思 :
使用具有自我注意的生成对手网络生成手写公式的无监督训练数据。 46-54