MMM 2024,荷兰阿姆斯特丹-第一部分
斯特万·鲁迪纳克 , 阿兰·汉贾利奇 , 辛西娅·C·S·列姆 , 马塞尔·沃林 , 比约恩?约森 , 贝柳 , 山田洋子 :
多媒体建模-第30届国际会议,MMM 2024,荷兰阿姆斯特丹,2024年1月29日至2月2日,会议记录,第一部分。 计算机科学课堂讲稿 14554, 施普林格 2024 ,国际标准图书编号 978-3-031-53304-4 陈志宇 , Pu Ching先生 , 黄佩欣 , 民春田 :
偏见在哪里? 利用虚假特征可视化进行对手借记。 1-14 徐梦莹 , 赖汉江 , 建银 :
具有类别语义的跨模式散列检索。 15-27 李敏(音) , 李凤发 , 薄梦 , 白汝文 , 任俊星 , 黄子豪 , 高成华 :
用于视频识别的时空表示增强ViT。 28-40 邱克迪 , 首东市 , 赵天祥 , 叶永芳 :
SCFormer:一种分通道坐姿识别视觉变换器。 41-52 李泽斌 , 罗建平 :
在单幅图像去模糊中采用粗到精的策略。 53-65 杨余杭 , 肖燕 , 张三元 :
TICondition:扩展多模式条件下文本到图像生成的控制功能。 66-79 浙江 , 能高 , 张一飞 , 刘玉涵(音) :
通过多空间约束和自适应集成增强生成性广义零炮学习。 80-93 陈小黄 , 吴家麟 :
神经压缩潜在表示中的联合图像数据隐藏和速率失真优化。 94-108 Jixuan Hong(吉轩红) , 谢晶晶 , 何雪芹 , 杨晨辉 :
GSUNet:一种基于3D Ghost Shuffle U-Net的脑肿瘤分割方法。 109-120 王有凯 , 岳虎 , 吴万森 , 刘婷(Ting Liu) , 永鹏 :
ACT:对象导航的动作关联和目标相关表示。 121-133 丁宇 , 方兆彦 , 永江 :
用于精细视觉分类的前景特征增强和峰值与背景抑制。 134-146 金玉石 , 吴文杰 :
YOLOv5-SRR:增强YOLOv 5以实现有效的水下目标检测。 147-158 刘永奇 , 周家双 , 杜晓琴 :
HDGMVAE-I图像聚类与生成。 159-171 张安琪(Anqi Zhang) , 高广宇 , 吕卓成 , 于坤安 :
“汽车还是公共汽车?”CLearSeg:CLIP-增强相似类之间的区分,以实现少量语义分割。 172-186 刘婷(Ting Liu) , 岳虎 , 吴万森 , 王友凯 , 徐凯(Kai Xu) , 尹全军 :
PANDA:基于提示的上下文和室内软件视觉和语言导航预训练。 187-200 甘文君 , 刘佳伟 , 朱阳春 , 吴勇 , 赵国志 , 郑俊查 :
基于文本的人员搜索的跨模式语义对齐学习。 201-215 刘新玥老师 , 威廉·Y·王 , 蔡平平 :
通过可学习内存库进行点云分类。 216-229 威廉·Y·王 , 刘新玥老师 , 蔡平平 :
对抗性规则化微光图像增强。 230-243 袁洲 , Xin Chen(新晨) , 郭彦荣(Yanrong Guo) , 于军(Jun Yu) , Richang Hong公司 , 齐天 :
通过语义引导的关系对齐和调整推进增量少快照语义分割。 244-257 郑业深 , 广通路 , 钱乔 , 李凡章 :
PMGCN:保存测量映射原型图形校准网络,用于少量快照学习。 258-272 李子拓 , 孙建斌 , 秦宇奇 , 伦浩居 , 杨克伟 :
ARE-CAM:一种基于CAM定量评估深层模型对抗稳健性的可解释方法。 273-285 贝柳 , 张健(Jian Zhang) , 天文苑 , 彭黄 , 冯成伟 , 李明和 :
SSK-Yolo:全球特征驱动的图像小目标检测网络。 286-299 子轩红 , 曹伟鹏 , 徐志武 , 陈真如 , 西涛 , 钟明 , 曹楚青(Chuqing Cao) , 梁正 :
MetaVSR:一种用于任意放大的视频超分辨率新方法。 300-313 潘叶红 , 王健(Jian Wang) , 刘桂红 , 吴秋硕 , Yazi Zheng公司 , 新兰 , 梁微 , 吕建成 , 袁丽(音) :
从头骨到面部:真实感三维颅面重建的深度生成框架。 314-326 刘伟(音译) , 王佳欢 , 王超(Chao Wang) , 严鹏 , 谢绍荣 :
用于图文匹配的结构感知自适应混合交互模型。 327-341 瓦比哈夫·穆加尔 , 王庆阳 , 洛林·斯威尼 , 艾伦·F·斯梅顿 :
使用显著性和裁剪来提高视频的可记忆性。 342-355 王帅伟 , 赵柳 , 杰雷 , 尊磊·冯 , 胡安·徐 , 李轩 , 梁荣华 :
具有自适应偏差的上下文增强用于少量快照视频对象分割。 356-369 冯晨 , 新松 , 梁祝 :
用于图像超分辨率的轻量级本地注意网络。 370-384 李秋林 , Junhao Qiang先生 , 群阳 :
基于自我监督学习和对抗训练的说话人验证领域自适应。 385-395 钱曹 , 张东东 , 孙成玉 :
基于神经表示的高质量可伸缩视频编码。 396-409 林子建 , 罗建平 :
用于改进视频压缩的分层双向时间上下文挖掘。 410-421 刘永裕 , 林国良 , 汉江莱 , 燕磐 :
MAMixer:通过多轴混合进行多元时间序列预测。 422-435 Kun Zhang(张坤) , 高春玲(Chunling Gao) , 杨双源 :
一种基于自定义GAN的鲁棒医学图像水印算法。 436-447 李晓婷 , 首红丸 , 张汉涛 , 裴全金 :
一种用于遥感目标检测的详细制导多源融合网络。 448-461 李秋仙 , 周泉兴 , 宏发鼎 :
通用可组合框架下的安全公平联合学习协议。 462-474 康毅 , 唐浩然 , 白红玉 , 王银杰(音) , 景旭 , 李萍 :
RGB-D显著目标检测的双向交互和密集聚集网络。 475-489 郭思政 , 杨浩哲 , 林贤明 :
通过纹理和显著性增强进行面部伪造检测。 490-502