多模态位置估计

位置估计是估计数字媒体中记录内容的地理坐标的任务。伯克利多模位置估计项目旨在利用网络上可用的GPS标记媒体作为自动位置估计器的训练集。其想法是,视觉和听觉线索可以缩小给定图像、视频或音频曲目的可能录制位置。我们还研究了位置估计的人类基线,即人类与计算机相比表现如何?

这是与ICSI的计算机视觉小组以及加州大学伯克利分校BASiCS小组(伯克利视听信号处理和通信系统)的合作。

有关此项目的更多信息,请访问http://multimedia.icsi.berkeley.edu/multimodal-location-eestimation网站.