MMM 2023,挪威卑尔根-第二部分
邓恩圭公爵 , Cathal Gurrin公司 , 玛莎·A·拉尔森 , 艾伦·F·斯梅顿 , 斯特万·鲁迪纳克 , 明子刀 , 克里斯托夫·特拉特纳 , 菲比·陈 :
多媒体建模——第29届国际会议,MMM 2023,挪威卑尔根,2023年1月9日至12日,会议记录,第二部分。 计算机科学课堂讲稿 13834, 施普林格 2023 ,国际标准图书编号 978-3-031-27817-4
多媒体处理与应用
Shuo Chen(陈硕) , 迪丽 , 波波居 , 林华江 , 东方赵 :
基于仿真热图引导和上下文空间注意的透明目标检测。 3-15 陈天润 , 傅成龙 , 英藏 , 朱兰云 , 贾章 , 毛爸爸 , 孙凌云 :
Deep3DSketch+:从单个自由手草图进行快速三维建模。 16-28 杨一亭 , 魏塔楚 :
基于漫画特定数据增强的漫画文本检测及其在情感分析中的应用。 29-40 中山 , 吴绍文 , 秦靖惠 :
SPEM:用于图像识别的自适应池增强注意模块。 41-53 帕特里克·维塞尔(Patrik Vesel) , 拉迪斯拉夫·佩斯卡 :
少即是多:基于内容的视频检索的相似性模型。 54-65 王万良 , 方森星 , 陈家诚 , 航遥图 :
用于MR图像超分辨率的边缘辅助非对称卷积网络。 66-78 陈伟彦 , 朱长建 , 单张 , Sen Xiang先生 :
光场信号频谱分析的遮挡模型。 79-90 天兴峰 , Zhe Zhang(张哲) , 熊凯强 , 王荣刚(音) :
具有深度反向投影的上下文引导多视图立体声。 91-102 王伟 , 彭璐 , 彭旭军 , 王音 , 赵冉赵 :
RLSCNet:用于消失点检测的残留线型卷积网络。 103-114 欧阳佳君 , 吕清轩 , 舒张(Shu Zhang) , 董俊宇 :
无监督领域适应的能量传递对比网络。 115-126 邓旭然 , 刘传斌 , 卢志英 :
用于细粒度视觉分类的重构视觉转换器体系结构。 127-138 Ming Gao公司 , 吴世联(Shilian Wu) , 王增福 :
一种用于多语言文本识别的长度敏感的语言界限识别网络。 139-150 袁张(音) , 向天 , Ziyang Zhang公司 , 徐向敏 :
用于面部表情识别的轻量级多级信息融合网络。 151-163 邓恩圭公爵 , Vegard Velle Sjöen公司 , 晚餐-海乐 , 添朴道 , 安都庄 , Minh-Triet Tran公司 :
公共社交媒体平台和照片存储服务如何处理上传图像的实际分析。 164-176 Kai Ye公司 , 《好琴记》 , 袁丽(音) , 王磊(Lei Wang) , 刘鹏(音) , 沈林林 :
CCF-Net:一个基于级联中心的高效人体零件检测框架。 177-189 李余杭 , 蔡飞凡 , 涂逸飞 , 丁友东 :
非均匀黑暗下的微光图像增强。 190-201 福彩宫 , 谢雨晨 , 乐江 , 陈克明(Keming Chen) , 刘云欣 , 叶小舟 , 叶欧阳 :
一种改进的带有对比学习的少快照嵌入模型。 202-214 徐浩琪 , 侯健 , 华强元 :
基于内部评价的加权多视图聚类。 215-227 Zhiqi Yan先生 , 双良 :
BENet:用于显著目标检测的边界增强网络。 228-239 Trong-Hieu Nguyen Mau村 , Quoc-Hui Trinh公司 , Nhat-Tan Bui公司 , Phuoc Thao Vo Thi府 , 明-凡-阮 , 曹宣南 , Minh-Triet Tran公司 , 海棠阮 :
PEFNet:用于息肉分割的位置嵌入特征。 240-251 丹尼尔·洛伦齐 , 法扎德·塔什塔里亚尔 , 哈迪·阿米尔普尔 , 克里斯蒂安·蒂默勒 , 赫尔曼·赫尔瓦格纳 :
MCOM-Live:实时流媒体边缘的多码优化模型。 252-264 郭金鑫 , 张嘉强 , 张晓静 , 马铭(Ming Ma) :
LAE-Net:用于压缩视频动作识别的轻型高效网络。 265-276 李云红 , 帅丽 , 余振华 :
DARTS-PAP:通过实例复杂性加权体系结构参数的极化进行差异化神经体系结构搜索。 277-288 宋晨 , 王冲(Chong Wang) , 刘伟杰 , 叶正杰 , 邓嘉诚 :
用于少镜头目标检测的伪标签多样性利用。 289-300 谢新佳(Xinjia Xie) , 刘峰(音) , 顺改 , 甄煌 , 胡明浩 , 王安坤 :
HSS:一种用于密集检索的层次语义相似性硬负抽样方法。 301-312 井森芳 , 首东市 , 易芳 , 郑火 :
嵌入式设备上的实时坐姿识别。 313-324 乔治·卢帕斯 , 西奥多拉·皮斯托拉 , 双孢苏提里斯 , Konstantinos Ioanidis公司 , 斯特凡诺斯·弗罗基迪斯 , Kompatsiaris约阿尼斯 :
基于视频的希腊民间舞蹈自动识别深度学习技术的比较。 325-336 傅英南 , 舒正 , 蔡文元 , Ming Gao公司 , 车庆金 , 周奥英 :
结构图像内容识别的动态特征选择。 337-349 柯东 , 郝鹏 , 杰车 :
语音情感识别的动态-静态交叉注意特征融合方法。 350-361 艾美·东 , 刘思迪(Sidi Liu) :
基于注意和特征融合方法的多任务语义分割研究。 362-373 郑敏艳 , 罗建平 :
时空视频超分辨率3D变压器。 374-385 Despoina Touska公司 , Konstantinos Gkountakos公司 , 西奥多拉·齐克里卡 , Konstantinos Ioanidis公司 , 斯特凡诺斯·弗罗基迪斯 , Kompatsiaris约阿尼斯 :
多目标跟踪中基于图形的数据关联:综述。 386-398 超群牛 , 袁丽(音) , 王健(Jian Wang) , 周继哲 , 涂雄 , 董瑜(Dong Yu) , 郭慧丽(音) , 林章(Lin Zhang) , Weibo Liang(微博梁) , 吕建成 :
使用条件对抗网从胸部X射线进行多视角自适应骨激活。 399-410 魏洛 , 徐梦莹 , 赖汉江 :
情感分析中模态缺失问题的多模态重构和对齐网络。 411-422 冯萍(Ping Feng) , 张汉云(Hanyun Zhang) , 孙莹莹 , 唐振军 :
基于知识提取和优化传输的轻量级图像散列人脸检索。 423-434 赵胜伟(Shengwei Zhao) , 刘玉英 , 杜少义 , 田志强 , 曲婷 , 徐林海 :
CMFG:用于文本视频检索的交叉模型细粒度特征交互。 435-445 刘晓琼 , 林月伟 , 青杨 , 恒帆 :
点云中三维目标跟踪的可转移对抗攻击。 446-458 香旗甘 , 朱长建 , 白梦琴 , 应伟 , 陈伟彦 :
用于优化光场渲染质量的光谱相关深度分层模型。 459-470 泾阳 , 陈俊文 , Keiji Yanai先生 :
基于变压器的跨模态配方嵌入与大批量训练。 471-482 Yuanhang尹 , 杨华 , 陶松 , 马如辉 , 海冰关 :
具有周期一致性的自我监督多目标跟踪。 483-495 林志伟 , 陈忠生 , 黄秀萍 , 杨素慧(Suhui Yang) :
基于视频的双尺度时空卷积神经网络降水强度识别。 496-509 Elissavet Batziou女士 , Konstantinos Ioanidis公司 , Ioannis Patras公司 , 斯特凡诺斯·弗罗基迪斯 , Kompatsiaris约阿尼斯 :
基于U-Net和Haar小波池的微光图像增强。 510-522 维杰·约翰 , 川崎康夫 :
基于人属性的声光传感器融合框架对人识别中缺少的视觉模式具有鲁棒性。 523-535 张欣欣 , 潘善良 , 钱成武 , 嘉东苑 :
利用全球-地方关系编码网络在社交媒体上进行谣言检测。 536-548 吴金萌 , 彭成书 , 韩宇虹 , 李兴勋 , 雷马 , 张耀宗 , 朱颖(音) , 王磊(Lei Wang) :
用于异常预测任务的无监督编解码模型。 549-561 韩红峰 , 《芝罘路》 , 纪荣文 :
CTDA:用于动作分割的对比时域自适应。 562-574 赵勇艳 , 马丽燕 , 骆向峰 , 孙燕 :
具有傅里叶空间损失的多尺度多级去训练网络。 575-586 高文华 , 张兰菊 , 郝阳 , 袁张(音) , 金耀燕 , 陶林 :
DHP:一种用于短视频流的联合视频下载和动态比特率自适应算法。 587-598 Ting Pan公司 , 王飞(音译) , 谢俊洲 , 刘伟峰 :
通过语义指导生成新绘画。 599-610 玛丽亚·西奥比 , 乔戈斯·科尔多帕蒂斯·齐洛斯 , 多时相慈善 , Kompatsiaris约阿尼斯 , 西蒙·帕帕佐普洛斯 :
一种用于图像拼接定位的多流融合网络。 611-622 亚历山德鲁斯·奥伊科诺米迪斯 , 玛丽亚·佩吉亚 , 阿纳斯塔西亚·穆姆齐杜 , 伊利亚斯·贾兰普基迪斯 , 斯特凡诺斯·弗罗基迪斯 , Kompatsiaris约阿尼斯 :
基于自监督学习的多分类器融合在卫星图像变化检测中的应用。 623-634 Kazutoshi Shinoda公司 , 竹泽由纪夫 , 铃木正弘 , 岩川优介 , 松本裕隆(Yutaka Matsuo) :
用神经符号学方法改进交互式教学跟踪对对象和指令变化的鲁棒性。 635-646 林佳琴 , 杜少义 , 刘玉英 , 田志强 , 汀曲 , 南宁郑 :
基于分层症状表征的驾驶员疲劳评估。 647-658 Ly-Duyen Tran公司 , 聂东云 , 周立亭 , Binh T.Nguyen先生 , Cathal Gurrin公司 :
VAISL:生活日志中语义位置的视觉识别。 659-670 赵欣(音译) , 任志航 :
多尺度高斯差分预处理和双流CNN变换器混合网络用于皮肤损伤分割。 671-682 董培杰 , 新牛 , 子棉卫 , 潘恒悦 , 李东生 , 甄煌 :
AutoRF:具有空间池的自动学习接收字段。 683-694 吴志宏 , 西文区 , 黄军(Jun Huang) , 吴宣沟 :
基于注意卷积递归网络的空中手写中文文本识别。 695-707
BNI公司: 大胆的新想法
Thu Nguyen先生 , 安德烈亚·斯托拉斯 , 瓦吉拉·坦巴维塔 , 史蒂文·亚历山大·希克斯 , 波尔·哈沃森 , 迈克尔·里格勒 :
多媒体数据集:挑战和未来的可能性。 711-717 Zhengyu Zhao(赵征宇) , 吴丹 , 玛莎·A·拉尔森 :
图像解读的重要性:现实世界对手图像中的语义误分类模式。 718-725
Research2Biz研究
弗雷德里克·哈兰德·延森 , 奥达·埃利斯·诺德伯格 , 安迪·欧宝 , 拉尔斯·奈尔 :
学生负责气候传播。 729-735
演示
胡一波 , 严诚浩 , 曹晨雨 , 王浩瑞 , 吴斌(Bin Wu) :
无边框视频上的社会关系图生成。 739-744 乔纳森·格芬 :
在Roblox游戏中改进父母与孩子的合作。 745-750 维克多·阿德里尔·德·热苏斯·奥利维拉 , 格诺·罗特曼 , 马格达莱娜·鲍彻 , 斯蒂芬·格里巴赫(Stefanie Größbacher) , 彼得·贾德迈耶 , 沃纳·巴勒 , 乔治·塔林格 , 托马斯·库尔茨 , 雅各布·弗兰克 , 克里斯托夫·鲍尔 , 加布里埃尔·弗罗斯科尔 , 迈克尔·巴特洛格 :
Taylor-音频内容文档和搜索的人工智能模拟。 751-757 清水大吉 , Keiji Yanai先生 :
考虑视频会议时间一致性的虚拟试运行。 758-763