计算机科学››2022,第49卷››问题(9): 123-131.数字对象标识:10.11896/jsjkx.220600011
•计算机图形和多媒体• 以前的文章 下一篇文章
曹小文、梁美佑、卢康康
收到:
修订过的:
在线:
出版:
关于作者:
支持单位:
摘要:跨媒体哈希算法以其优越的搜索效率和较低的存储成本在跨媒体搜索任务中受到广泛关注。然而,现有的方法无法充分保持多媒体数据的高层语义相关性和多标签性。为了解决上述问题,本文提出了一种基于细粒度语义推理的跨媒体双向对抗哈希学习模型(SDAH),该模型通过最大化不同媒体之间的细粒度的语义关联,生成紧凑一致的跨媒体统一高效的哈希语义表示。首先,提出了一种基于跨媒体协作注意机制的细粒度跨媒体语义关联学习和推理方法。跨媒体注意机制协同学习图像和文本的细粒度隐含语义关联,获得图像和文本显著的语义推理特征。然后,建立一个跨媒体双向对抗性哈希网络,联合学习模式内和模式间语义相似性约束,通过双向对抗性学习机制更好地对齐不同媒体哈希码的语义分布,它生成了质量更高、更具区分性的跨媒体统一哈希表示,促进了跨媒体语义融合过程,提高了跨媒体搜索性能。在两个公共数据集上的实验结果与现有方法进行了比较,验证了该方法在各种跨媒体搜索场景中的性能优势。
关键词: 语义推理, 散列学习, 跨媒体搜索, 对抗性学习, 跨媒体语义融合
CLC编号:
曹小文、梁美佑、卢康康。基于细粒度语义推理的跨媒体双向对抗哈希学习模型[J]。计算机科学,2022,49(9):123-131。
0 / / 推荐
添加到引文管理器 尾注|样板客户经理|项目|BibTeX公司|参考Works
网址: https://www.jsjkx.com/EN/10.11896/jsjkx-220600011
https://www.jsjkx.com/EN/Y2022/V49/I9/123
引用