ICMR 2017:罗马尼亚布加勒斯特
博格丹·伊奥内斯库 , 赛比 , 贾世峰 , 玛莎·A·拉尔森 , 雷纳·连哈特 , 塞斯·斯诺克 :
2017年ACM多媒体检索国际会议论文集,2017年6月6日至9日,罗马尼亚布加勒斯特,ICMR 2017。 ACM公司 2017 ,国际标准图书编号 978-1-4503-4701-3
主题演讲1
主题演讲2
阿尔贝托·德尔·宾博 :
与智能伴侣进行文化访问。 2
教程
乔治·阿瓦德 , Duy-Dinh Le餐厅 , Chong-Wah Ngo村 , Vinh Tiep Nguyen(阮永铁) , 乔治·奎诺特 , 塞斯·斯诺克 , Shin’ichi佐藤 :
视频索引、搜索、检测和描述,重点关注TRECVID。 3-4
口头会议1: 视觉和语言(口头陈述)
陈士哲 , 贾晨 , 秦进 :
生成带有主题指导的视频描述。 5-13 克里斯蒂安·安德烈亚斯·海宁 , 拉尔夫·埃沃思 :
估计文本和视觉表征之间的信息差距。 14-22 Kan Chen(音译) , 拉马·科夫武里 , 济阳高 , 拉姆·内瓦提亚 :
MSRC:多模态空间回归与短语基础的语义上下文。 23-31 梁俊伟 , 吕江 , 孟德玉(Deyu Meng) , 亚历山大·豪普特曼 :
利用多模先验知识在噪声Web数据中进行大规模概念学习。 32-40
口头会议1: 视觉和语言(聚焦演讲)
邢旭 , 沈福民 , 杨扬 , 杰绍 , 紫煌 :
零镜头学习的直观语义嵌入。 41-49 里卡多·卡拉皮索 , 伊莎贝尔·吉马朗斯 , 玛格丽达·格里洛 , 索菲亚·卡瓦科 , 乔安·马加莱斯 :
语音和语言治疗中用于决策支持的3D面部视频检索和管理。 50-57 托马斯·门辛克 , 托马斯·琼斯特拉 , 帕斯卡·米特斯 , 塞斯·G·M·斯诺克 :
使用二次分配的音乐引导视频摘要。 58-64
特别口头会议: 超越语义: 主观属性的多模态理解
达尔山·桑塔尼 , 萨尔瓦多·鲁伊兹·科雷亚 , 丹尼尔·加蒂卡·佩雷斯 :
内部人士和外部人士:比较不同人群的城市印象。 65-71 克劳迪奥·贝奇 , 提比里奥·乌里奇奥 , 贝尔蒂尼 , 阿尔贝托·德尔·宾博 :
情感视频分析的语境和面孔的深层情感特征。 72-77 加瑞高 , 傅燕伟(Yanwei Fu) , 余光江 , 薛向阳 :
框架变换器情感分类网络。 78-83
口头会议: 大胆的新想法
Jaeyoung Choi先生 , 玛莎·A·拉尔森 , 李新超 , 李凯文 , 杰拉尔德·弗里德兰 , 阿兰·汉贾利奇 :
流行照片增强的地理隐私奖金。 84-92 爱德华多·尼格里 , 奥根·阿兰杰洛维奇 :
开普勒飞船收集数据的光曲线分析。 93-98 Nitish Nag公司 , 瓦比哈夫·潘迪 , 拉梅什·贾恩 :
健康多媒体:基于不同观察结果的生活方式建议。 99-106
口头会议: 开放式软件
卢卡斯·帕斯科蒂·瓦莱姆 , 丹尼尔·卡洛斯·吉马良斯·佩德罗内特 :
用于多媒体检索的无监督远程学习框架。 107-111 康斯坦丁·波戈列洛夫 , 迈克尔·里格勒 , 波尔·哈沃森 , 卡斯滕·格里沃兹 :
ClusterTag:用于大图像集合的交互式可视化、聚类和标记工具。 112-116 克里斯·马特曼 , 马达夫·沙兰 :
基于Hadoop的Deep Web大视频数据的可扩展池时间序列。 117-120 费德里科·巴托利 , 朱塞佩·利桑蒂 , 洛伦佐·塞德纳里 , 阿尔贝托·德尔·宾博 :
PACE:用于拥挤环境的基于预测的注释。 第121页至第124页
口头会议2: 多媒体索引(口头演示)
拉奥·穆罕默德·安沃 , 法哈德·沙巴兹·汗 , Joost van de Weijer公司 , Jorma Laaksonen公司 :
TEX-Nets:用于纹理识别的二进制模式编码卷积神经网络。 125-132 杰林 , 奥利维尔·莫雷 , 安托万·维拉德 , 凌玉端 , 吴汉林(Hanlin Goh) , 维贾伊·钱德拉塞卡 :
用于图像实例检索的DeepHash:获得正则化、深度和精细调整权限。 133-141 安德烈·莫朗 , 乔安·马加莱斯 :
分布式媒体冗余索引的平衡搜索空间分区。 142-149 吴大雁 , 郑琳 , 李波(Bo Li) , 叶明珍 , 王卫平 :
用于多标签和大尺度图像检索的深度监督哈希算法。 150-158
口头会议2: 多媒体索引(聚焦演示)
法比安·安德烈 , 安娜·马利·科尔马雷克 , 尼古拉·勒斯科瓦内克 :
使用快速ADC加速最近邻搜索。 159-166 克里斯蒂安·艾格特 , 丹泽查 , 斯蒂芬·布雷姆 , 雷纳·连哈特 :
改进公司徽标检测的小对象建议。 167-174 瑞阳(Rui Yang) , 石玉良 , 许新顺 :
用于有效图像检索的离散多视图散列。 175-183 奥马尔·塞达蒂 , 圣埃芬·杜邦 , 萨伊德·马哈茂迪 :
基于草图的图像检索的四重网络。 184-191
口头会议3: 多媒体应用(口头演示)
卡西克·雅达蒂 , 辛西娅·C·S·列姆 , 玛莎·A·拉尔森 , 阿兰·汉贾利奇 :
关于常见活动音乐的自动识别。 192-200 马丁·皮科尔 , 伊娃·赞格尔 , Günther Specht公司 :
改进上下文软件音乐推荐系统:超越预过滤方法。 201-208 米查尔·科珀斯基 , 斯拉沃米尔烤肉 , 彼得·卡尔 :
使用时间上下文重新标识组。 209-217年 Ionut C.Duta公司 , 博格丹·伊奥内斯库 , 清朝爱泽 , 赛比 :
视频动作识别中局部深层特征的简单、高效和有效编码。 218-225
口头会议4: 多媒体应用程序(聚焦演示)
奥尔加·斯利佐夫斯卡亚 , 艾米莉亚·戈麦斯 , 格洛丽亚·哈罗 :
使用多模态卷积神经网络结构的用户生成视频中的乐器识别。 226至232 吉斯·奥弗古尔 , 马苏德·马祖鲁 , 马赛尔·沃林 , 罗伯特·里特维尔 , 威廉·范·多伦 :
品牌知名度预测的时空类别表示。 233-241 米里亚姆·雷迪 , 弗兰克·Z·刘 , 尼尔·奥黑尔 :
弥合审美鸿沟:网络图像的野性之美。 242至250
口头会议5: 最佳论文候选人
穆罕默德·索莱马尼 , 迈克尔·里格勒 , Pål哈尔沃尔森 :
图像搜索意图的多模态分析:从用户行为和视觉内容识别图像搜索中的意图。 251-259 奥利维尔·莫雷 , 杰林 , 安托万·维拉德 , 凌玉端 , 维杰·钱德拉塞卡 , 西红柿A.Poggio :
用于图像实例检索的嵌套不变量池和RBM哈希。 260-268 Yusuke Uchida公司 , 永井有喜 , 坂泽茂(Shigeyuki Sakazawa) , Shin’ichi佐藤 :
将水印嵌入深度神经网络。 269-277 克里斯蒂娜·博伊迪杜 , 西蒙·帕帕佐普洛斯 , 拉扎罗斯Apostolidis , Yiannis Kompatsiaris公司 :
学习检测推特上的误导性内容。 278-286
特别口头会议: 识别和链接大型视听库中的有趣内容
Zhi-Qi Cheng先生 , 张浩 , 小吴 , Chong-Wah Ngo村 :
视频超链接的锚和目标选择。 287-293 佩特拉·加卢沙科娃 , 米查尔·巴特科 , 扬·切赫 , 吉里·马塔斯 , 大卫·诺瓦克 , 巴维尔·佩西纳 :
视频超链接方法中的视觉描述符。 294-300 雷米·博伊斯 , 纪尧姆·格雷维尔 , 埃里克·贾梅特 , 艾曼纽尔·莫林 , 马克西姆·罗伯特 , 帕斯卡尔·塞比略 :
链接多媒体内容以实现高效的新闻浏览。 301-307 杨柳 , 顾中磊 , Yiu-ming Cheung(张耀铭) , 建安华 :
媒体趣味性预测的多视图流形学习。 308-314 库尔蒂斯 , 加雷思·琼斯 , 尼克·坎贝尔 :
在学术报告总结中使用高级特征。 315-321
口头会议4: 跨媒体检索(口头报告)
Aliaksander Siarohin公司 , 格洛丽亚·禅 , Cveta Majtanovic公司 , 泽维尔·阿拉梅达·皮内达 , 伊丽莎·里奇 , 赛比 :
如何使图像更令人难忘 深度风格转换方法。 322-329 费比安·容克特 , 马库斯·埃伯特 , 阿德里安·乌尔吉斯 , 乌尔里希·施瓦内克 :
基于神经传递学习的跨模式图像图形检索。 330-337 萨梅特·希桑梅斯 , 纳明·萨梅特 , 法迪姆·塞纳 , 皮纳尔·迪古鲁 :
绘图:识别儿童书籍插图艺术家风格的深度网络。 338-346 伊内斯·查米 , 尤塞夫·塔马佐斯蒂 , 埃尔维·勒博涅 :
AMECON:文本插图的抽象元概念功能。 347-355
口头会议4: 跨媒体检索(聚焦演示)
Elaheh Momeni公司 , 雷萨·拉瓦西扎德 , 伊坦·阿达尔 :
利用语义方面对社会评论进行自适应排名。 356-364 王占雄 , 柯克和 , 傅燕伟(Yanwei Fu) , 瑞丰 , 余光江 , 向阳雪 :
用于联合人脸识别和人脸属性预测的多任务深度神经网络。 365-374 王奎奎 , 陆洋 , 杨公平 , 新罗 , Kun Su(苏坤) , Yilong Yin尹一龙 :
基于编码尺度变化超像素特征的手指静脉图像检索。 375-382 皓月石 , 贾晨 , 亚历山大·豪普特曼 :
在线视频地理定位中使用图像区域的联合显著性估计和匹配。 383-391
海报
艾哈迈特·伊斯肯 , 乔戈斯·托利亚斯 , Yannis Avrithis公司 , 泰迪·弗隆 , Ondrej Chum公司 :
用于位置识别的全景到全景匹配。 392-396 达米亚诺斯·加拉诺普洛斯 , Foteini Markatopoulou公司 , Vasileios Mezaris公司 , Ioannis Patras公司 :
用于零示例事件检测的概念语言模型和基于事件的概念数选择。 397-401 林士伦 , 熊鹏飞 , 刘海龙 :
用于移动图像样式化的微型变换网络。 402-406 Foteini Markatopoulou公司 , 达米亚诺斯·加拉诺普洛斯 , Vasileios Mezaris公司 , Ioannis Patras公司 :
针对Ad-hoc视频搜索的查询和关键帧表示。 407-411 魏塔楚 , 李伟伟 :
Manga FaceNet:基于深度神经网络的Manga人脸检测。 412-415 维德兰·武科蒂奇 , 克里斯蒂安·雷蒙德 , 纪尧姆·格雷维尔 :
视频超链接中多模式表示学习的生成性对抗网络。 416-419 朱塞佩·阿马托 , 法比奥·卡拉拉 , 法布里奇奥·法尔基 , 克劳迪奥·根纳罗 :
使用全文搜索引擎对卷积的区域最大激活数进行高效索引。 420-423 张俊康 , 夏思雨 , 明绍 , 云浮 :
通过多实例学习进行家庭照片识别。 424-428 孙珊 , 王峰(音) , 戚亮 , 梁河 :
太极:精细动作识别数据集。 429-433 Keiji Yanai先生 , Ryosuke Tanno公司 :
有条件快速传输网络。 434-437 阿努瓦布·达特 , 丹尼斯·佩勒林 , 乔治·奎诺特 :
使用粗标签和细标签改进图像分类。 438-442 Mridula Verma公司 , 考沙尔·库马尔·舒克拉 :
快速多模式统一稀疏表示学习。 443-447 魏塔楚 , 塞缪尔·司图曼 :
基于时空和笔划特征的羽毛球视频分析。 448至451
演示
安德烈亚·塞罗尼 , 瓦西里奥斯·索拉希迪斯 , 克劳迪娅·尼德雷 , 奥尔加·帕帕佐普鲁 , Vasileios Mezaris公司 :
世博会:一个以期望为导向的系统,用于从个人收藏中选择重要照片。 452至456 卢卡·罗塞托 , 伊万·詹雷科(Ivan Giangreco) , 克劳迪乌·塔纳斯 , 海科·舒尔特 :
2017 IMOTION系统的多模式视频检索。 457-460年 卡希夫·艾哈迈德 , 迈克尔·里格勒 , 安斯·里亚斯 , 尼古拉·康奇 , 邓恩圭公爵 , 波尔·哈沃森 :
JORD系统:将天空和社交多媒体数据与自然灾害联系起来。 461-465 马蒂亚斯·卢克斯 , 迈克尔·里格勒 , 波尔·哈沃森 , 格伦·麦克斯特拉维奇 :
LireSolr:可视化信息检索服务器。 466-469 克莱萨·科利达 , 埃夫兰皮奥斯·阿波斯托利迪斯 , 亚历山德罗斯·普尔纳拉斯 , Foteini Markatopoulou公司 , Vasileios Mezaris公司 , Ioannis Patras公司 :
VideoAnalysis4ALL:一个在线工具,用于自动分段和基于概念的注释,以及视频的交互式探索。 470-474 Kai Uwe Barthel公司 , 尼科·赫泽尔 , 克劳斯·荣格 :
使用图像图直观浏览数百万张图像。 475-479年
口头会议: 博士生论坛
钱生生 , 张天柱 , 许长生 :
社会事件分析的通用框架。 480-483 斯特凡·佩施加尼格(Stefan Petscharnig) :
腹腔镜手术视频相关片段的半自动检索。 484-488 亚什·加格 , 西尔维斯特罗·罗伯托·波契亚 :
关于多变量感官数据中相似搜索距离度量的有效性:相似搜索距离测度的有效性。 489-493 卡里姆·阿德格尔 , 珍妮·贝诺伊斯·皮诺 , 卡里姆·阿夫德尔 :
应用CNN诊断阿尔茨海默病的sMRI分类:具有2D+?的单一暹罗网络? ADNI的方法与融合。 494-498
行业主题
黄晓正 :
随着5G的到来,为8亿QQ用户服务的音视频技术将如何带来新的创意。 499 马泰·斯特罗拉 :
从HERE Technologies丰富定位服务的多传感器数据中检索信息。 500 王长虎 :
智能地将人们与信息联系起来。 501
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)