2020年3月26日:韩国大田
龙曼洛 , 文焕成 , 金俊模(Junmo Kim) , 魏塔楚 , 彭翠 , 郑文彩 , 胡敏春 , 韦斯利·德内夫 :
多媒体建模——第26届国际会议,MMM 2020,韩国大田,2020年1月5-8日,会议记录,第二部分。 计算机科学课堂讲稿 11962, 施普林格 2020 ,十亿 978-3-030-37733-5
海报环节
陈鹏飞 , 袁明磊 , 桐庐 :
用于少镜头学习的多尺度比较网络。 3-13 宋嘉玉 , 徐庆华 , 刘伟 , 悦然祖 , 陈梦东 :
语义和形态学信息指导中文文本分类。 14-26 杜克·V·阮 , Huyen T.T.Tran公司 , Truong Cong Thang公司 :
用户设备计算约束下的云游戏延迟软件适配框架。 27-38 东标河 , Jinlei Jiang(姜金磊) , 塞德里克·韦斯特法尔 , 杨广文 :
高效边缘缓存可实现高质量360度视频传输。 39-51 苏平周 , 佳佳 , 张龙(Long Zhang) , 王岩峰(Yanfeng Wang) , 魏晨 , 孟凡波 , 费余 , 沈嘉烈 :
真实语音数据的推断重点:一种专注的多模态神经网络方法。 52-62 西阳 , Yeo-Jin Kim先生 , 米歇尔·陶布 , 罗杰·阿泽夫多 , 敏驰(Min Chi) :
PRIME:智能教学系统中多模式的模块化任务处理。 63-75 杨宇伟(Yuwei Yang) , 范曼·孟 , 李洪亮 , 吴庆波 , 徐小龙 , 陈帅 :
一种新的用于少镜头分割的局部变换模块。 76-87 吴明杰 , 张永飞 , 张天宇 , 张文琪 :
用于车辆重新识别的背景分割。 88-99 乔安娜·洪 , 李洪珠 , 叶林·金 , 龙曼洛 :
面部表达细节:通过面部动作单元生成全面的面部表情句子。 100-111 杨旺(Yang Wang) , 叶倩 , 贾浩石 , 冯苏 :
视频文本定位的深度卷积去模糊检测神经网络。 112-124 魏厚 , 王大奎 , 陈晓军 :
为私有图像分类生成具有模糊属性的图像。 125-135 《小忠记》 , 吴一瑞 , 桐庐 :
具有单图像超分辨率提升门的上下文软件残差网络。 136-147 徐晓宇(Xiaoyu Xu) , 简茜 , 李煜 , 盛菊玉 , 郝涛 , 冉珠 :
用于单图像超分辨率的紧凑型深度神经网络。 148-160 黄凯(Kai Huang) , 李建军 , 程世超 , 洁余 , 田万勇 , 赵露露 , 胡俊峰 , 秦振昌 :
TSG-RNN网络人脸表情识别的有效算法。 161-174 李一鸣 , 杨晓山 , 许昌生 :
结构化神经模型:通过增强上下文解析场景图。 175-188 端正关 , 李登石 , 蔡雪蓓 , 王晓晨 , 胡瑞敏 :
基于三重扬声器的虚拟声源感知定位。 189-200 宋晓歌 , 吴一瑞 , 王文海 , 桐庐 :
TK-Text:通过实例分割的多形状场景文本检测。 201-213 加藤弘太郎 , 平山高寿 , 伊德一郎 , Keisuke Doman先生 , 川崎康夫 , 德沟大辅 , Hiroshi Murase公司 :
用于精细步态描述的更自然的模拟词生成。 214-225 赵莹(音) , 罗志伟 , 长秦泉 , 刘殿超 , 王刚(Gang Wang) :
用于多人姿势估计的Lite沙漏网络。 226-238
特别会议文件//SS1: AI驱动的3D视觉
孙云涵 , 金龙石 , 白素琴 , 羌倩 , 孙正兴 :
基于自监督稠密卷积网络的单视图深度估计。 241-253 张梦翰(Menghan Zhang) , 云波饶 , 江苏浦 , 罗迅 , 王奇飞 :
用于建筑物大规模重建的多数据无人机图像。 254-266 Sen Xiang先生 , 刘琼(音) , 邓惠平 , 金武 , 李煜 :
基于SVM的变形相位预测用于结构光深度生成。 267-278 王亮(Liang Wang) , 严碧莹 , 段福清 , 科鲁 :
使用能量最小化从点云中提取多类多实例几何图元。 279-290 孙香玉 , 刘琼(音) , 尤阳(You Yang) :
用于交互式动作识别的相似图卷积构造网络。 291-303 陈子豪 , 徐旺 , 于舟 , 邹龙浩 , 江建民 :
通过深度Q学习为全景图像投影内容软件立方体图。 304-315 滕湾 , 杜少义 , 崔文婷 , 谢七星 , 刘玉英 , 李左勇 :
基于相关熵和双向距离的稳健RGB-D数据配准。 316-326 Hui Cao公司 , 海口杜 , 张思玉 , 沈彩 :
InSphereNet:一种3D对象的简明表示和分类方法。 327-339 崔文婷 , 杜少义 , 滕湾 , 刘燕(Yan Liu) , 刘玉英 , 杨扬 , 清南牟 , 蒙其汗 , 郭玉成 :
基于配准算法的三维口腔形状检索。 340-349 Yu Wang(王宇) , 陶璐 , 徐若波 , 张彦铎 :
通过学习多视图纹理补偿实现人脸超分辨率。 350-360 张俊林 , 徐旺 :
基于混合先验的光场显著目标检测。 361-372
第2部分: 多媒体分析: 视角、工具和应用
维尔纳·拜勒 , Maarten Wijnants公司 , 亨德里克·利文斯 , 砂质粘土 :
多媒体分析创建交互式广播内容的挑战和机遇。 375-387 伊瓦·戈尼什卡 , 斯特万·鲁迪纳克 , 马赛尔·沃林 :
使用多模式嵌入在讨论论坛中进行交互式搜索和探索。 388-399 吴锡勋 , 滨亨松 , 王志祥 , 春园 :
用于零炮学习的带有流形对齐的逆映射。 400-411 阿伦·杜安 , Cathal Gurrin公司 :
传统和虚拟现实生活日志检索系统的基线分析。 412-423 艾卡捷琳·卡马达 , 乔治·卡尔帕基斯 , 西奥多拉·齐克里卡 , 斯特利奥斯·安德烈亚迪斯 , 斯特凡诺斯·弗罗基迪斯 , Ioannis Kompatsiaris公司 :
一个可扩展的框架,用于在线来源的大规模异构多媒体信息的交互式实时可视化。 424-435
第三季度: 可重复实验多媒体数据集(MDRE)
安德烈亚斯·莱贝塞德 , 萨布丽娜·克莱茨 , 克劳斯·肖夫曼 , 西蒙·凯克斯坦 , 约格·凯克斯坦 :
GLENDA:妇科腹腔镜子宫内膜异位症数据集。 439-450 德贝什·贾伊 , 皮亚·斯梅德斯鲁德 , 迈克尔·里格勒 , 波尔·哈沃森 , 托马斯·德兰格 , 达格·约翰森 , Håvard D.约翰森 :
Kvasir-SEG:分段息肉数据集。 451-462 弗兰克·霍普加特纳 , Cathal Gurrin公司 , Hideo Joho先生 :
重新思考个人自我追踪数据的测试收集方法。 463-474 格雷厄姆·希利 , 王正伟 , 托马斯·沃德 , 艾伦·F·斯梅顿 , Cathal Gurrin公司 :
收集新型多媒体脑电数据集的经验和见解。 475-486
第四季度: MMAC公司: 大规模多媒体数据的多模式情感计算
刘志磊 , 董家辉 , 张翠翠 , 王龙彪 , 党建武 :
基于图卷积网络的面部动作单元检测关系建模。 489-501 关健 , 李明贤 , 孙建国 , 舒汉琪 , 王轩 , 清辽 :
通过目标检测和人体姿势估计增强凝视跟踪。 502-513 刘志磊 , 刘迪(Diyi Liu) , 吴云鹏 :
面部动作单元的基于区域的对抗合成。 514-526 刘志磊 , 李乐 , 吴云鹏 , 张翠翠 :
基于改进图卷积网络的面部表情恢复。 527-539 郭晓娜 , 魏忠 , 龙叶 , 李芳 , 阎恒 , 秦章 :
基于互补视听特征的全局情感视频内容回归。 540-550
第五季: MULTIMED2020: 医学领域和普及环境中的多媒体和多模态分析
Henning Müller公司 , 文森特·安德里亚奇克 , 奥斯卡·阿方索·希门内斯·德尔·托罗 , 安贾尼·德兰加德里亚 , 罗杰·谢尔 , 曼弗雷多·阿佐里 :
研究开放获取文献和社会网络中的公共医学图像,以进行模型培训和知识提取。 553-564 吴军 , 姚张(音) , 王杰(音译) , 赵建春 , 大勇鼎 , 陈宁江 , 王玲玲 , 陈轩 , 姜春晖 , 邹璇 , Xing Liu(刘星) , 慧晓 , 袁田 , 宗江上 , 王凯伟 , 李西荣 , 杨刚(音译) , 建平风扇 :
注意网:OCT图像中基于深度注意的视网膜疾病分类。 565-576 托比亚斯·鲍尔 , 新浪克劳森 , 亚历山大·海默尔 , 弗洛里安·林恩费尔瑟 , 卢茨 , 伊丽莎白·安德烈 :
NOVA:解释性多模态行为分析工具及其在心理治疗中的应用。 577-588 萨布丽娜·克莱茨 , 克劳斯·肖夫曼 , 安德烈亚斯·莱贝塞德 , 珍妮·贝诺伊斯·皮诺 , 海因里希·赫斯林 :
腹腔镜技术技能评估中的仪器识别。 589-600 Giannakeris巴拿马球虫 , 乔治·梅迪茨科斯(Georgios Meditskos) , Konstantinos Avgerinakis公司 , 斯特凡诺斯·弗罗基迪斯 , Ioannis Kompatsiaris公司 :
基于三维关节运动和Fisher编码的日常动作实时识别。 601-613 阿提娜·查努萨 , 安杰洛斯·查齐米歇(Angelos Chatzimichail) , 乔治·梅迪茨科斯(Georgios Meditskos) , 斯特凡诺斯·弗罗基迪斯 , Ioannis Kompatsiaris公司 :
多传感器数据的基于模型和基于类的融合。 614-625 纳塔莉亚·索科洛娃 , 克劳斯·肖夫曼 , 马里奥·塔施沃 , 多丽丝·普兹格鲁伯·阿达米奇 , 优素福·埃尔·沙布拉维 :
评价白内障手术视频中仪器分类的泛化性能。 626-636
6春夏: 智能多媒体安全
徐亚军 , 毛振东 , 张鹏 , Bin Wang(王斌) :
用于图像语义分割的紧凑位置-器具注意网络。 639-650 刘传斌 , 田友良 , 谢洪涛 :
法律就是秩序:用博弈论和机制设计保护多媒体网络传输。 651-668 李秋仙 , 田友良 :
基于信息论和博弈论方法的合理委托计算。 669-680 薛成宁 , 杨晓山 , 许昌生 :
多跳交互式跨模式检索。 681-693
演示文件
马克·卡斯特纳 , 伊德一郎 , 川崎康夫 , 平山高寿 , 德沟大辅 , Hiroshi Murase公司 :
使用心理语言背景浏览视觉情感数据集。 697-702 Chih-Yao Chang先生 , Bo-I Chuang公司 , 池春霞 , 陈文成 , 胡敏春 :
混合现实中多人运动传感游戏的框架设计。 703-708 易宇 , 弗洛里安·哈斯科特 , 西蒙·卡纳斯 , 古鲁纳特·雷迪M , 苏华堂 , 姜俊君 :
Lyrics-条件神经旋律生成。 709-714 阿卜杜拉·阿法拉杰 , 马泽瑜 , Seon Ho Kim先生 , Yeonsoo公园 , 赛鲁士·萨哈比 :
基于Web的航空图像三维空间覆盖测量可视化工具。 715-721 孙忠博 , 王延南(Yannan Wang) , 李曹 :
一种用于语音增强的基于注意力的非特定人视听深度学习模型。 722-728 无限映画 , Jaeyoung Choi先生 , 杰拉尔德·弗里德兰 :
DIME:跨模式检索模型可视化比较的在线工具。 729-733 郑文彩 :
使用线阵列系统实时演示个人音频和3D音频渲染。 734-738 金永宇(Yongwoo Kim) , Jae-Seok Choi先生 , Jaehyup Lee先生 , 蒙丘尔·金 :
基于CNN的4K/8K超高清应用FPGA多尺度超分辨率体系结构。 739-744 阿卜杜勒·穆基特 , 宋和贝 :
深度神经网络中混合残差模块的超分辨率有效利用。 745-750
VBS论文
安德烈亚斯·莱贝塞德 , 伯恩德·穆泽尔 , 尤尔根·普里默斯 , 萨布丽娜·克莱茨 , 克劳斯·肖夫曼 :
diveXplore4.0:VBS2020的ITEC深度交互式视频探索系统。 753-759 洛里斯·索特 , 马赫纳兹·阿米里·帕里安 , 拉尔夫·加斯尔 , 席尔文·海勒 , 卢卡·罗塞托 , 海科·舒尔特 :
将布尔检索和多媒体检索结合在玻璃卷中用于大规模视频搜索。 760-765 阮康乐 , Dieu-Hien Nguyen先生 , Minh-Triet Tran公司 :
一个交互式视频搜索平台,用于具有高级概念的多模式检索。 766-771 阮富安 , 吴嘉欣 , Chong-Wah Ngo村 , 丹尼·弗朗西斯 , 贝诺伊特·休特 :
VIREO@Video Browser Showdown 2020。 772-777 斯特利奥斯·安德烈亚迪斯 , 阿纳斯塔西亚·穆姆齐杜 , 康斯坦蒂诺斯·阿波斯托利迪斯 , Konstantinos Gkountakos公司 , 达米亚诺斯·加拉诺普洛斯 , 埃马努伊尔·米歇尔 , 伊利亚斯·贾兰普基迪斯 , 斯特凡诺斯·弗罗基迪斯 , Vasileios Mezaris公司 , Ioannis Kompatsiaris公司 :
VBS 2020中的VERGE。 778-783 雅库布·洛科克 , 格雷戈·科瓦利克 , 托马斯·苏切克 :
病毒在视频浏览器决战2020。 784-789 米罗斯拉夫·克拉托奇维尔 , 帕特里克·维塞尔(Patrik Vesel) , 弗兰提塞克·梅兹利克 , 雅库布·洛科克 :
SOM-Hunter:视频浏览与SOM反馈回路相关。 790-795 比约恩?约森 , 奥马尔·沙巴兹·汗 , 丹尼斯·C·科尔马 , 斯特万·鲁迪纳克 , 马赛尔·沃林 , 扬·扎尔卡 :
2020年视频浏览器决战中的精品。 796-802 Byoungjun Kim先生 , Ji Yea Shim先生 , 米荷公园 , 龙曼洛 :
使用对象关系和相关音频类的基于深度学习的视频检索。 803-808 Sungjune公园 , Jaeyub宋 , 米荷公园 , 龙曼洛 :
IVIST:VBS 2020中的交互式视频搜索工具。 809-814