×

兹马思-数学第一资源

噪声图像的元解释学习。(英语) Zbl公司 06976228
摘要:统计机器学习在图像分类中有着广泛的应用。然而,大多数技术(1)需要许多图像来获得高精度,(2)不支持分类级别以下的推理,因此无法支持二次推理,例如图像外部的光源和其他物体的存在和位置。本文描述了一种称为逻辑视觉的归纳逻辑编程方法,它克服了这些局限性。LV采用元解释学习(MIL)结合低层提取图像高对比度点,学习描述图像的递归逻辑程序。在已发表的工作中,LV被证明能够高精度地预测类,如正多边形从少量图像中,支持向量机和卷积神经网络在某些情况下给出了近乎随机的预测。到目前为止,LV只应用于无噪声、人工生成的图像。本文通过(a)寻址扩展LV分类噪声使用新的噪声telerant版本的MIL系统Metagol,(b)寻址属性噪波使用原始水平的统计估计器来识别真实图像中的子对象,(c)使用更广泛的背景模型来表示经典的二维形状,如圆和椭圆,(d)以简单但通用的光反射递归理论的形式提供更丰富的可学背景知识。在我们的实验中,我们考虑了在自然科学环境和机器人足球比赛环境中噪声图像。自然科学设置涉及到在望远镜和显微镜图像中识别光源的位置,而RoboCup设置涉及识别球的位置。我们的结果表明,对于真实图像,新的噪声鲁棒性版本的左心室使用一个单一的例子(即一次左心室)收敛到一个精度至少可与三十次统计机器学习者在这两个预测在科学环境和机器人足球中隐藏的光源。此外,我们还证明了一个一般的背景递归光理论本身可以用LV来发明,并用于识别物体的凹凸性的模糊性,比如科学设置中的陨石坑,以及机器人足球的部分模糊性。

理学硕士:
68T05型 人工智能中的学习与自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
68N17 逻辑程序设计
68吨40 机器人学的人工智能
68T45型 机器视觉与场景理解
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 阿干塔尔;沙吉,A;史密斯,K;卢卡奇,A;Fua,P;Susstrunk,S,SLIC超级像素与最新超级像素方法的比较,IEEE模式分析与机器智能汇刊,342274-2282,(2012)
[2] 手推车,汞柱;Tenenbaum,JM,将线条图解释为三维曲面,人工智能,17,75-116,(1981)
[3] 布拉斯基,G(2000年)。Opencv库. http://opencv.org/。
[4] 布雷曼,L.,弗里德曼,J。H、 ,奥尔申,R。A、 ,&Stone,C。J(1984年)。分类和回归树. 沃兹沃斯·Zbl公司 541.62042
[5] 张,C-C;林,C-J,LIBSSVM:支持向量机库,智能系统与技术ACM交易,2,27:1-27:27,(2011)
[6] 科恩,A。G、 ,霍格,D。C、 ,贝内特,B.,加拉塔,A.,马吉,D。R、 和桑托斯,P(2006年)。在:认知视觉:符号定性表征与计算机视觉的整合(第221-246页)。柏林:斯普林格。
[7] Cox,D.we understand high-level vision?,《神经生物学当前观点》,25187-193,(2014)
[8] Cropper,A.和Muggleton,S。H(2015年)。元解释学习中元规则的逻辑最小化。第24届归纳逻辑程序设计国际会议论文集(第65-78页)。LNAI 9046。斯普林格。
[9] Cropper,A.和Muggleton,S。H(2016年)。通过抽象和发明学习高阶逻辑程序。第25届人工智能国际联席会议论文集(IJCAI 2016)(第1418-1424页)。伊卡。
[10] Dai,W.-Z.,Muggleton,S。H、 和周,Z.-H(2015年)。逻辑视野:简单几何概念的元解释学习。第25届归纳逻辑程序设计国际会议论文集(第1-16页)。库尔。
[11] Dalal,N.和Triggs,B(2005年)。用于人体检测的定向梯度直方图。在:第13届IEEE计算机学会计算机视觉与模式识别会议论文集,加利福尼亚州圣地亚哥(第886-893页)。IEEE计算机协会。
[12] Duan,K.,Parikh,D.,克兰德尔,D。J、 ,格拉曼,K(2012年)。发现用于细粒度识别的本地化属性。第25届IEEE计算机视觉与模式识别会议论文集,普罗维登斯,RI(第3474-3481页)。IEEE计算机协会。
[13] 法里德,R;Sammut,C,《使用关系学习的基于平面的对象分类》,机器学习,94,3-23,(2014)
[14] Farid,R.和Sammut,C(2014年b)。使用关系学习的基于区域的对象分类。2014年大奖赛:人工智能趋势(第8862卷,第1106-1114页)。莱奈。斯普林格。
[15] 伽利略,G(2004年)。星光使者. 1610年,爱德华·斯塔福德·卡洛斯(Edward Stafford Carlos)译英文,里文顿,伦敦,1880年;彼得巴克编辑,拜占庭出版社。
[16] 格雷戈里,R。L(1974年)。知觉的概念和机制. 伦敦:达克沃斯。
[17] 格雷戈里,R。L(1998年)。眼与脑:视觉心理学. 牛津:牛津大学出版社。
[18] 希思,D.和文图拉,D(2016年)。计算机在画画之前,必须先学会看。在:第七届计算创造力国际会议论文集(第172-179页)。
[19] Hogg,D.,《基于模型的视觉:一个看到行走的人的程序》,图像和视觉计算,1,5-20,(1983)
[20] 喇叭,B。K。P.P(1989年)。从着色信息获取形状. 马萨诸塞州剑桥:麻省理工学院出版社。
[21] Hu,R.,Xu,H.,Rohrbach,M.,Feng,J.,Saenko,K.和Darrell,T(2016年)。自然语言对象检索。第29届IEEE计算机视觉与模式识别会议进展,内华达州拉斯维加斯(第4555-4564页)。IEEE计算机协会。
[22] 哈夫曼,达州;梅尔策,B(编辑);Michie,D(编辑),《不可能的物体作为无意义的句子》,第6期,295-323,(1971年),爱丁堡
[23] Krizhevsky,A;萨茨克弗,我;Hinton,GE,Imagenet分类与深卷积神经网络,神经信息处理系统进展,251106-1114,(2012)
[24] 莱克,B。M、 ,Salakhutdinov,R.,Gross,J.和Tenenbaum,J。B(2011年)。简单视觉概念的一次性学习。在:认知科学学会第33届年会论文集(第2568-2573页)。
[25] 兰伯特,CH;尼基什,H;Harmeling,S,《零镜头视觉对象分类的基于属性的分类》,IEEE模式分析与机器智能汇刊,36453-465,(2014)
[26] Li,Z.,Gavves,E.,Mensink,T.和Snoek,C。G。M(2014年)。属性对分段对象有意义。在:第十三届欧洲计算机视觉会议论文集第四部分,瑞士苏黎世(第350-365页)。斯普林格。
[27] Lin,D.,Dechter,E.,Ellis,K.,Tenenbaum,J。B、 和Muggleton,S。H(2014年)。一次函数归纳的偏差重构。第23届欧洲人工智能会议论文集(ECAI 2014),阿姆斯特丹(第525-530页)。IOS出版社。
[28] 《尺度不变关键点的独特图像特征》,国际计算机视觉杂志,60,91-110,(2004)
[29] Mensink,T.,Verbeek,J。J、 和克苏尔卡,G(2011年)。学习交互式图像标记的结构化预测模型。第24届IEEE计算机视觉与模式识别会议,科罗拉多州斯普林斯市(第833-840页)。IEEE计算机协会。
[30] 麻瓜顿,S。H、 ,Lin,D.,Chen,J.和Tamaddoni Nezhad,A(2014年a)。Metabayes:使用高阶随机求精的贝叶斯元解释学习。以G表示。扎维鲁卡,V。桑托斯科斯塔酒店。Marins Paes(编辑),第23届归纳逻辑程序设计国际会议论文集(ILP 2013),柏林。LNAI 8812(第1-17页)。斯普林格·Zbl公司 1319.68185
[31] 麻瓜顿,SH;林,D;巴列维,北;Tamaddoni Nezhad,A,元解释学习:语法推理的应用,机器学习,94,25-49,(2014)·Zbl公司 1319.68121
[32] 麻瓜顿,SH;林,D;Tamaddoni Nezhad,A.高阶并元数据记录的元解释学习:谓词发明再探讨,机器学习,10049-73,(2015)·Zbl公司 1346.68119
[33] 麻瓜顿,SH;雷德,L;普尔,D;布拉科,我;Flach,P;《未来机器学习与挑战》,Inoue,2011年,第23-23页)·Zbl公司 1243.68014
[34] 奥贾拉,T;皮蒂凯宁,M;äenp公司ää, T、 基于局部二值模式的多分辨率灰度和旋转不变纹理分类,模式分析与机器智能IEEE汇刊,24971-987,(2002)·Zbl公司 977.68853
[35] 《最大化探地雷达的信息反馈》,应用地球物理学杂志,43175-187,(2000)
[36] Palatucci,M.,Pomerleau,D.,Hinton,G.和Mitchell,T。M(2009年)。基于语义输出码的零镜头学习。在:神经信息处理系统的研究进展(第22卷,第1410-1418页)。柯兰联合公司。
[37] Rautaray,党卫军;Agrawal,A,《人机交互中基于视觉的手势识别:调查》,人工智能评论,43,1-54,(2015)
[38] Redmon,J.,Divvala,S.,Girshick,R.和Farhadi,A(2016年)。你只看一次:统一的、实时的对象检测。在:IEEE计算机视觉与模式识别会议(CVPR)(第779-788页)。
[39] Rofer,T.,Laue,T.,Richter Klug,J.和Thielke,F(2016年)。B-机器人足球赛2016年和2016年的人类团队描述。http://www.robocup2016.org/media/symposium/Team-Description-Papers/StandardPlatform/RoboCup_2016_SPL_TDP_B-Human.pdf。
[40] Simonyan,K.和Zisserman,A(2015年)。用于大规模图像识别的非常深的卷积网络。在:第三届学习表征国际会议论文集,加利福尼亚州圣地亚哥。
[41] Suriani,V.,Albani,D.,Youssef,A.,Del Duchetto,F.,Nania,A.,Bloisi,D.D.等人(2016年)。SPQR RoboCup 2016标准平台联盟团队说明文件,2016年。http://www.robocup2016.org/media/symposium/Team-Description-Papers/StandardPlatform/RoboCup_2016_SPL_TDP_SPQR.pdf。
[42] 韦达尔迪,A.和富尔克森,B(2008年)。VLFeat:一个开放的可移植的计算机视觉算法库。http://www.vlfeat.org/。
[43] 维尼尔斯,O.,布伦代尔,C.,利利克拉普,T。P、 ,Kavukcuoglu,K.和Wierstra,D(2016年)。匹配网络进行一次性学习。在:神经信息处理系统的研究进展(第29卷,第3630-3638页)。麻省理工学院出版社。
[44] 冯·赫尔姆霍兹,H(1962年)。生理光学专论(第三卷)。纽约:多佛出版社。(1825年原版德语).
[45] 华尔兹,D。L(1980年)。将场景描述理解为事件模拟。在:计算语言学协会第十八届年会论文集(第7-11页)。计算语言学协会。
[46] 威斯梅克,J;Schrijvers,T;特里斯卡,M;拉格,T,SWI-prolog,逻辑程序设计理论与实践,12,67-96,(2012)·Zbl公司 1244.68023
[47] 张,R;泰,PS;哭,杰;Shah,M.Shah,M.Shah,M.Shah,Shah,M.调查,模式分析与机器智能IEEE汇刊,21670-706,(1999)·Zbl公司 1316.94019
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。