×

使用三重网络学习航空图像相似性。 (英语) Zbl 07250753号

谢尔盖耶夫、雅罗斯拉夫D.(编辑)等人,《数值计算:理论和算法》。第三届国际会议,2019年6月15日至21日,意大利克罗托内,NUMTA 2019。修改选定的论文。第二部分。查姆:斯普林格。莱克特。注释计算。科学。11974, 195-207 (2020).
概述:无人飞行器(UAV)在卫星导航系统被拒绝的环境中面临定位挑战。从车载摄像机拍摄的图像可用于与正射影像图进行比较,以支持视觉定位算法。通过计算各种相似性度量可以实现图像相似性估计。在我们的实验中,皮尔逊相关被认为是评估区域图像相似性的最佳选择。Still对由飞机框架移动引起的图像位移不具有鲁棒性。我们提出了一种新的三重神经网络结构来学习图像相似性度量。该架构包含VGG16网络基础层。作者提出的顶层结构、损失函数和性能指标。图像与卫星照片中的地图相匹配。将所提出的神经网络结构的匹配结果与Pearson相关性进行了比较和评估。
关于整个系列,请参见[Zbl 1435.65017号].

MSC公司:

65-XX年 数值分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andreeva,E.,Ignatov,D.I.,Grachev,A.,Savchenko,A.V.:通过深度学习提取视觉特征以推荐产品。收录人:van der Aalst,W.M.P.等人(编辑)AIST 2018。LNCS,第11179卷,第201-210页。查姆施普林格(2018)。https://doi.org/10.1007/978-3-030-11027-7_20 ·doi:10.1007/978-3-030-11027-7_20
[2] 阿瑟诺,M.O.:三连冠失利。暹罗NN的更有效损失函数(2018)
[3] Banerjee,P.,Bhunia,A.K.,Bhattacharyya,A.,Roy,P.P.,Murala,S.:局部邻域强度模式:用于图像检索的新纹理特征描述符。CoRR(2017)
[4] Bojanowski,P.,Grave,E.,Joulin,A.,Mikolov,T.:用子单词信息丰富单词向量。arXiv预印arXiv:1607.04606(2016)
[5] Boyd,S.:应用线性代数向量、矩阵和最小二乘简介。剑桥大学出版社,剑桥(2018)·Zbl 1406.15001号 ·doi:10.1017/9781108583664
[6] Chang,Y.,Hsieh,C.,Chang,K.,Ringgaard,M.,Lin,C.:通过线性SVM训练和测试低阶多项式数据映射。J.马赫。学习。第11号决议,1471-1490(2010年)·Zbl 1242.68210号
[7] Church,K.W.,Hanks,P.:词汇关联规范,相互信息和词典编纂。计算。语言学家。16(1),22-29(1990)
[8] Dalal,N.,Triggs,B.:人体检测定向梯度直方图。摘自:计算机视觉与模式识别国际会议(CVPR 2005),第1卷,第886-893页。IEEE计算机学会(2005)
[9] Deng,J.,Dong,W.,Socher,R.,Li,L.J.,Li,K.,Fei Fei,L.:ImageNet:一个大规模的分层图像数据库。In:CVPR 2009(2009)
[10] Hadsell,R.,Chopra,S.,LeCun,Y.:通过学习不变映射降低维数。在:2006年IEEE计算机学会计算机视觉和模式识别会议(CVPR 2006),第2卷,第1735-1742页。IEEE(2006)
[11] He,K.,Zhang,X.,Ren,S.,Sun,J.:图像识别的深度剩余学习。CoRR(2015)
[12] He,K.,Zhang,X.,Ren,S.,Sun,J.:图像识别的深度剩余学习。摘自:IEEE计算机视觉和模式识别会议记录,第770-778页(2016)
[13] Huang,G.B.,Mattar,M.,Berg,T.,Learnd-Miller,E.:野外标记人脸:研究无约束环境中人脸识别的数据库。In:“现实生活”图像中的人脸:检测、对齐和识别研讨会(2008年)
[14] Jurevicius,R.,Marcinkevius,V.:基于视觉的粒子滤波和视觉里程计在无人机定位中的应用。收录于:WSCG 2017:《简短通信会议记录:2016年中欧第25届计算机图形、可视化和计算机视觉国际会议》,与EUROGRAPHICS合作:西波西米亚大学,Plzen,捷克共和国,2017年5月29日至6月2日,第67-71页。Václav Skala-联合国机构(2017年)
[15] Jurevičius,R.、Marcinkevićius、V.、Šeibokas,J.:使用粒子滤波和视觉里程计对无人机进行稳健的GNSS增强定位。机器。视觉。申请。30(7-8), 1181-1190 (2019). https://doi.org/10.1007/s00138-019-01046-4。ISSN 0932-8092。eISSN 1432-1769·doi:10.1007/s00138-019-01046-4
[16] Koch,G.,Zemel,R.,Salakhutdinov,R.:用于一次性图像识别的暹罗神经网络。In:ICML深度学习研讨会,第2卷(2015)
[17] Krizhevsky,A.,Sutskever,I.,Hinton,G.E.:基于深度卷积神经网络的Imagenet分类。摘自:Pereira,F.、Burges,C.J.C.、Bottou,L.、Weinberger,K.Q.(编辑)《神经信息处理系统进展》25,第1097-1105页。纽约Curran Associates公司(2012年)
[18] Lowe,D.G.等人:从局部尺度不变特征识别物体。收录于:ICCV,第99卷,第2期,第1150-1157页(1999年)
[19] Mikolov,T.、Sutskever,I.、Chen,K.、Corrado,G.S.、Dean,J.:单词和短语的分布式表示及其组成。摘自:Burges,C.J.C.、Bottou,L.、Welling,M.、Ghahramani,Z.、Weinberger,K.Q.(编辑)《神经信息处理系统进展》26,第3111-3119页。纽约Curran Associates公司(2013年)
[20] Pennington,J.,Socher,R.,Manning,C.D.:手套:单词表示的全局向量。致:EMNLP(2014)
[21] Schroff,F.,Kalenichenko,D.,Philbin,J.:脸网:人脸识别和聚类的统一嵌入。CoRR(2015)
[22] Sergeyev,Y.D.,Kvasov,D.E.,Mukhametzhanov,M.S.:关于自然启发元启发式在预算有限的昂贵全局优化中的效率。科学。代表8,第453条(2018年)
[23] Szegedy,C.等人:卷积更深入。CoRR(2014)
[24] Taylor,G.W.,Spiro,I.,Bregler,C.,Fergus,R.:通过模仿学习不变性。收录于:CVPR 2011,第2729-2736页。IEEE(2011)
[25] Ustinova,E.,Lempitsky,V.:学习直方图丢失的深度嵌入。收录:Lee,D.D.,Sugiyama,M.,Luxburg,U.V.,Guyon,I.,Garnett,R.(编辑)《神经信息处理系统进展》29,第4170-4178页。Curran Associates,Inc.,纽约(2016)
[26] Wang,J.等:通过深度排名学习细粒度图像相似性。CoRR(2014)
[27] Wolf,L。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。