2018年3月23日:泰国曼谷
克劳斯·舍夫曼 , Thanarat H.Chalidabhongse公司 , Chong-Wah Ngo村 , Supavadee Aramvith公司 , 诺埃尔·E·奥康纳 , 尤松浩(Yo-Sung Ho) , 蒙塞夫·加布吉 , 艾哈迈德·埃尔加马尔 :
多媒体建模-第24届国际会议,MMM 2018,泰国曼谷,2018年2月5-7日,会议记录,第一部分。 计算机科学课堂讲稿 10704, 施普林格 2018 ,国际标准图书编号 978-3-319-73602-0
接受口头陈述的完整论文
Shurong Sheng先生 , 阿帕娜·努拉尼·文基塔苏布拉曼尼亚(Aparna Nurani Venkitasubramanian) , 玛丽·弗朗辛·莫恩斯 :
基于马尔可夫网络的文化遗产领域多模态问答通道检索方法。 3-15 恩施 , 钱丽 , 大全顾 , 赵章明 :
基于卷积神经网络的天气雷达回波外推方法。 16-28 康斯坦蒂诺斯·阿波斯托利迪斯 , 埃夫兰皮奥斯·阿波斯托利迪斯 , Vasileios Mezaris公司 :
一种用于用户生成视频的细粒度时间分割的运动驱动方法。 29-41 魏良磊 , 吴一瑞 , 王文海 , 桐庐 :
一种用于视频内容分析的新型三维人体动作识别框架。 42-53 多里安·米绍德 , 蒂埃里·乌鲁蒂 , 弗朗索瓦·莱切利埃 , 菲利普·卡雷 :
使用信息增益和显著性的自适应图像表示:在文化遗产数据集中的应用。 54-66 彭瑶 , 华章 , 薛燕兵 , 陈胜勇(Shengyong Chen) :
AGO:加速全球优化以实现精确的立体匹配。 67-80 万兆阳 , 土卫平 , 郑家喜 , 熊章 , 杨玉红 , 宋玉成 :
一种用于混合音频编码器的基于RNN的语音识别方法。 81-92 姜朱 , 魏翟 , 杨曹 , 郑俊查 :
用于彩色引导深度图超分辨率的共现结构边缘检测。 93-105 徐开平 , 郑琴 , 王国龙 , 黄凯(Kai Huang) , 叶树雄 , 张慧迪 :
用于人类轨迹预测的无碰撞LSTM。 106-116 李泰坤 , 维萨姆·J·巴达尔 , Seong Tae Kim先生 , 龙曼洛 :
高效浅层CNN的对数滤波器组卷积。 117-129 赵俊杰 , 彭玉欣 :
细粒度图像分类的成本敏感深度度量学习。 130-141 孟伟 , 余康 , 宋卫国 , 杨曹 :
基于多尺度递归卷积神经网络的人群分布估计。 142-153 贾玉华 , 梁白 , 王鹏(音译) , 郭金林 , 谢玉祥 :
用于图像和句子关联的深度卷积神经网络。 154-165 孔伟杰 , 李南南 , 托马斯·H·李 , 葛丽 :
使用上下文信息和多层次特征的深度行人检测。 166-177 华远 , 周媛媛 , 云生 , 张桂旭 :
使用RGBD图像对的双向引导深度图像内画。 178-189 Ryosuke Furuta公司 , 井上直人 , 山崎俊彦 :
高效交互式空间语义图像检索。 190-202 萨布丽娜·克莱茨 , 安德烈亚斯·莱贝塞德 , 克劳斯·舍夫曼 :
视频浏览器决战中支持Ad-Hoc视频搜索任务的视觉内容描述符评估。 203-215 索米亚·拉瓦特 , 悉达多·盖罗拉 , 拉吉维·沙阿 , P.J.纳拉亚南 :
为我找一个天空:一种用于颜色一致的天空搜索和替换的数据驱动方法。 216-228 王益智 , 连周慧 , 唐英民 , 肖建国 :
通过转移学习实现自然图像中的字体识别。 229-240 曼弗雷德·尤根·普里默斯 , 多丽丝·普兹格鲁伯·阿达米奇 , 马里奥·塔施沃 , 伯恩德·穆泽尔 , 优素福·埃尔·沙布拉维 , LászlóBöszörményi , 克劳斯·舍夫曼 :
白内障手术视频中基于帧的手术阶段分类。 241-253 Jong-Hee回来 , 金善浩(Sunho Kim) , 尤松浩(Yo-Sung Ho) :
使用RANSAC和随机选取拒绝的高精度3D粗配准。 254-266 慧迪坊 , 崔朝然 , 向登 , 聂秀山 , 木卫健 , 尹一龙 :
基于全卷积网络的图像审美分布预测。 267-278 劳拉·佩雷斯·梅奥斯 , 费德里科·苏克诺 , 利奥·瓦纳 :
通过优化训练材料的注释来提高视频到语言模型的质量。 279-290 宋莫飞 , 孙正兴 , 李波(Bo Li) , 胡佳高 :
大型图像采集的迭代主动分类。 291-304 阿蒙蒂普·帕里翁 , 王成宪 , 志义昭 :
学习在大型数据集中建立索引。 305-316 周建社 , 图亚·纳伦 , Xianyu Chen先生 , 马一科 , 刘杰(音译) , 冯代 :
基于散焦和对应的光场前景蒙版。 317-328 彭成 , 吴刘 , 张一凡 , 马化东 :
LOCO:基于局部上下文的快速R-CNN,用于小型交通标志检测。 329-341 张永飞 , 李哲 :
HEVC中基于多原型的整帧丢失错误隐藏。 342-354 吕真娜 , 吴刘 , 周丽丽(Lili Zhou) , 吴斌(Bin Wu) , 马化东 :
视频社会关系识别的多流融合模型。 355-368 吉尔特·卢格滕贝格 , 沃尔夫冈·赫斯特 , 尼娜·罗莎 , 克里斯蒂安·桑德 , 亚历山大·普洛普斯基 , Takafumi Taketomi公司 , 加藤弘子 :
多模态增强现实-增强听觉-活动反馈以改变对厚度的感知。 369-380 李建军 , 徐兰兰(Lanlan Xu) , 李浩杰 , 秦振昌 , 朦胧的太阳 :
基于NR-IQA和CNN的去噪算法的参数选择。 381-392 伊特萨拉·维查卡姆 , 提拉蓬·潘布恩尤恩 , Udomcharoenchaikit能 , Peerapon Vateekul先生 :
使用压缩的全卷积网络对结肠镜视频帧进行实时息肉分割。 393-404 Yuxin Yuan元 , 彭玉欣 :
用于跨媒体检索的联合关注递归金字塔网络。 405-416 齐正 , 陈军(Jun Chen) , 姜俊君 , 胡瑞敏 :
加强对小规模数据集的行人分析。 417-427 刘香玉 , 王云红 , 刘清杰 :
基于双流融合网络的遥感图像融合。 428-439 吴鹏(音) , 狄黄 , 王云红 :
REVT:通过区域卷积回归网络进行稳健高效的视觉跟踪。 440-452 黄冬梅 , Yan Wang(王燕) , 魏松 , 让·塞奎拉 , 塞巴斯蒂安·马夫罗马蒂斯 :
基于自适应参数获取的相对全局直方图拉伸的浅水图像增强。 453-465 郭临洮 , 猎人数量 , 尼古拉斯·兰姆 , 本杰明·洛维特 , 肖恩·班纳吉 , Natasha Kholgade Banerjee公司 :
多视图时间段视频中老化水果的时空3D模型。 466-478 杨克伟 , 孙正兴 , 王爽(音译) , 李波(Bo Li) :
使用稀疏建模的基于缝合的线程艺术图像样式化。 479-492 李洪珠 , 维萨姆·J·巴达尔 , Hak Gu Kim先生 , Seong Tae Kim先生 , 龙曼洛 :
紧凑型面部地标检测网络的师生联合学习。 493-504 秦正才 , 吴斌(Bin Wu) , 孟莉(Meng Li) :
通过强度极值优先进行文本图像去模糊。 505-517 Dries Hulens公司 , Bram Aerts公司 , Punarjay Chakravarty公司 , 阿里·迪巴 , 图恩·戈德美 , 汤姆·罗塞尔 , 杰伦·泽格斯 , Tinne Tuytelaars公司 , 吕克·范·艾肯 , 吕克·范·古尔 , 雨果·范·哈姆 , Joost Vennekens公司 :
CAMETRON演讲录制系统:高质量视频录制和编辑,很少有人监督。 518-530 马占凯然湾 , 约翰·西 , Lai-Kuan Wong先生 :
面向基于人口统计学的肖像摄影美学预测。 531-543 齐晓宇(Xiaoyu Qi) , 杨德顺 , 陈晓鸥 :
用于音乐版本识别的三重卷积网络。 544-555 陈宇静(Yujing Chen) , 京晓 , 詹将军 , 徐旺 , 王中原 :
用于现场ABR流的基于两级分段的比特率控制。 556-564 陈建军 , 谢洪涛 , 岳虎 , 严成钢 :
快速成分检测的维语文本定位。 565-577
不锈钢: 多媒体分析: 视角、技术和应用
拉什米·古普塔 , Cathal Gurrin公司 :
可视化生活日志数据的事件分割方法。 581-593 马苏德·马祖鲁 , 伊利亚娜·帕皮 , 马赛尔·沃林 :
类别特定的岗位人气预测。 594-607 胡飞燕 , 艾伦·斯梅顿 :
从生活日志中选择记忆关键帧的图像美学和内容。 608-619 沃纳·巴勒 :
基于深度学习的云服务结果的可追溯性。 620-631 斯特万·鲁迪纳克 , 大圣蔡 , 尼古拉斯·迪亚斯·费雷拉 , 杰拉尔德·弗里德兰 , 塔贾娜·戈诺斯塔哈 , 贝诺伊特·休特 , 里安娜·卡普坦 , 克里斯特·林登 , 玛丽·弗朗辛·莫恩斯 , Jaakko Peltonen公司 , 米里亚姆·雷迪 , 马库斯·谢德尔 , 大卫·A·沙玛 , 艾伦·斯梅顿 , 谢乐兴 :
反思现代社交多媒体的总结和故事讲述。 632-644