文件Zbl 1483.68284-zbMATH Open

室内环境中物体识别的镜像条件随机场模型。（英语） Zbl 1483.68284号

信息科学。 551, 291-303 (2021).

摘要：传统的目标识别算法基于一个普遍采用的闭集假设，假设训练中给出的知识是完整的。然而，实际情况往往是开放的和非静态的，在这种情况下，模型只在训练阶段获得不完整的知识。本文提出了一种新的条件随机场（CRF）模型来解决一种特殊的不完全知识情况，在这种情况下，某些对象的视觉外观在训练和测试之间发生了显著变化，从而从红-绿-蓝深度（RGB-D）中提取了某些一元特征（单个对象的特征）图像不再可靠。在标准CRF模型的基础上，将镜像节点引入到体系结构中，构建了镜像条件随机场（Mirror-CRF）模型，该模型集成了两类对象节点：原始节点和镜像节点。镜像节点没有一元特征，只有成对特征，它们描述两个对象之间的关系，在外观变化的情况下，比一元特征更可靠。实验结果表明，Mirror-CRF模型减少了某些对象外观显著变化的影响，提高了在知识不完全的情况下的对象识别能力。

MSC公司：

68T05型	人工智能中的学习和自适应系统
68吨10	模式识别、语音识别
68T45型	机器视觉和场景理解

关键词：

条件随机场；不完全知识；学习系统；物体识别；场景理解

软件：

纽约大学深度

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	I.Athanasiadis，P.Mousouliotis，L.Petrou，嵌入式系统对象检测中的迁移学习框架。CoRR，2018，abs/1811.04863。网址：http://arxiv.org/abs/1811.04863。arXiv:1811.04863。
[2]	博兹坎，I。；Oymak，Y。；Alemdar等。Z。；Kalkan，S.，场景中有什么（缺失或错误）？用于情境化场景建模的混合deep-boltzmann机器，（2018 IEEE机器人与自动化国际会议（ICRA）（2018）），1-6
[3]	陈，H。；郑毅。；Zhang，Y。；Sun，F。；黄毅，基于对象-对象支持语义关系的室内红-绿-蓝深度分割，控制理论应用。，36，579-588（2019），DOI:10.7641/CTA.2018.70825·Zbl 1438.68234号
[4]	陈，Y。；潘·D。；潘，Y。；刘，S。；顾，A。；Wang，M.，通过单目RGB-D图像了解室内场景，Inf.Sci。，320，361-371（2015），DOI:10.1016/j.ins.2015.03.023
[5]	丁·L。；李，H。；胡，C。；张伟。；Wang，S.，Alexnet面向对象分类的特征提取和多核学习，ISPRS-Int.Arch。照片。，遥感空间信息科学。，XLII-3，277-281（2018）
[6]	弗洛雷斯，C.F。；Gonzalez-Garcia，A。；van de Weijer，J。；Raducanu，B.，在训练数据稀少的领域中细粒度对象识别的显著性，模式识别。，94, 62-73 (2019)
[7]	C.Geng，S.Huang，S.Chen，开放集识别的最新进展：一项调查。CoRR，2018年，abs/1811.08581。网址：http://arxiv.org/abs/1811.08581。arXiv:1811.08581。
[8]	J.Hammersley，P.Clifford，有限图和格上的Markov域，1971。未发表的手稿
[9]	He，K。；张，X。；Ren，S。；Sun，J.，图像识别的深度剩余学习，（IEEE计算机视觉和模式识别会议论文集（2016）），770-778
[10]	Huynh，D。；Elhamifar，E.，通过密集的基于属性的注意力进行细粒度广义零快照学习，（IEEE/CVF计算机视觉和模式识别会议论文集（2020）），4483-4493
[11]	Janoch，A。；卡拉耶夫，S。；贾毅。；Barron，J.T。；弗里茨，M。；Saenko，K。；Darrell，T.，《类别级三维对象数据集：使用kinect》，ICCV计算机视觉消费者深度相机研讨会（2011年）
[12]	M.Kaboli，《迁移学习算法综述》。技术报告hal-01575126慕尼黑理工大学，2017年。网址：https://hal.archives-overtes.fr/hal-01575126。
[13]	Kasaei，S.H.，《进一步认识：学习开放式3D对象识别的共享主题和特定类别词典》，（2019年IEEE/RSJ智能机器人和系统国际会议（2019）），5438-5443
[14]	Khan，S.H。；本纳蒙，M。；Sohel，F。；托涅里，R。；Naseem，I.，《使用rgbd图像整合几何上下文以对室内场景进行语义标记》，国际计算机杂志。愿景，117，1-20（2016），网址：10.1007/s11263-015-0843-8·Zbl 1398.68584号
[15]	J.D.Lafferty，A.McCallum，F.C.N.Pereira，条件随机场：分割和标记序列数据的概率模型，收录于：《第十八届机器学习国际会议论文集》，2001年，Morgan Kaufmann Publishers Inc.，美国加利福尼亚州旧金山，第282-289页。网址：http://dl.acm.org/citation.cfm？id=645530.655813。
[16]	H.Ma，R.Xiong，Y.Wang，S.Kodagoda，L.Shi，《面向三维点云中的开放集语义标记：未知类的分析》，神经计算275（2018）1282-1294。网址：http://www.sciencedirect.com/science/article/pii/S0925231217315904。doi:10.1016/j.neucom.2017.09.071。
[17]	P.R.Mendes-Junior，J.Wainer，A.Rocha，开放集识别的专用支持向量机。CoRR，2016年，abs/1606.03802。网址：http://arxiv.org/abs/1606.03802。arXiv:1606.03802。
[18]	欧，X。；Yan，P。；Zhang，Y。；Tu，B。；张，G。；吴杰。；Li，W.，复杂场景中通过resnet-18和编码器-解码器结构的运动目标检测方法，IEEE Access，7108152-108160（2019）
[19]	Pham，T。；库马尔，V.B.G。；Do，T.-T。；卡内罗，G。；Reid，I.，开放集世界中的贝叶斯语义实例分割，（欧洲计算机视觉会议（ECCV）（2018）），3-18，URL:https://arxiv.org/abs/1806.00911。
[20]	Pham，T.T。；Do，T。；Sünderhauf，N。；Reid，I.，Scenect:室内场景的联合几何和对象分割，（2018 IEEE机器人与自动化国际会议（ICRA）（2018）），1-9
[21]	卡西姆，H。；Verma，A。；Feinzimer，D.，大数据场所图像识别的压缩残差-vgg16 cnn模型，（2018年IEEE第八届计算与通信研讨会（CCWC）（2018年），IEEE），169-175
[22]	齐，X。；廖，R。；贾，J。；菲德勒，S。；Urtasun，R.，用于rgbd语义分割的三维图形神经网络，IEEE国际计算机视觉会议（ICCV）（2017）
[23]	J.-R.Ruiz-Sarmiento，C.Galindo，J.Gonzalez-Jimenez，无向图形模型学习方法调查。应用于场景对象识别，国际期刊近似原因。83 (2017) 434-451. 网址：http://www.sciencedirect.com/science/article/pii/S0888613X16302043。doi:10.1016/j.ijar.2016.10.009·兹伯利1404.68116
[24]	Ruiz-Sarmiento，J.R。；Günther，M。；加林多，C。；González-Jiménez，J。；Hertzberg，J.，移动机器人的在线基于上下文的对象识别，（2017 IEEE自主机器人系统和竞赛国际会议（ICARSC）（2017）），247-252
[25]	N.Silberman，D.Hoiem，P.Kohli，R.Fergus，从rgbd图像中进行室内分割和支持推理，见：A.Fitzgibbon，S.Lazebnik，P.Perona，Y.Sato，C.Schmid（编辑），计算机视觉-ECCV 20122012，施普林格，柏林-海德堡，柏林，海德堡，第746-760页。DOI:10.1007/978-3-642-33715-4_54。
[26]	K.Simonyan，A.Zisserman，《用于大规模图像识别的极深卷积网络》，2014年。arXiv预打印arXiv:1409.1556。
[27]	Song，S。；Lichtenberg，S.P。；Xiao，J.，Sun rgb-d：一个rgb-d场景理解基准套件，IEEE计算机视觉和模式识别会议（CVPR）（2015）
[28]	X.Song，S.Jiang，L.Herranz，C.Chen，学习场景识别的有效RGB-D表示，IEEE Trans。图像处理。28 (2019) 980-993. 网址：doi:10.1109/TIP.2018.2872629https://www.wikidata.org/entity/Q57066513。DOI:10.1109/TIP.2018.2872629·Zbl 1409.94557号
[29]	Sünderhauf，N。；O.布鲁克。；谢尔，W。；哈德塞尔，R。；福克斯，D。；莱特纳，J。；Upcroft，B。；Abbeel，P。；伯加德，W。；米尔福德，M。；Corke，P.，《机器人深度学习的局限性和潜力》，国际机器人杂志。研究，37，405-420（2018），URL:10.1177/0278364918770733。arXiv:https://doi.org/10.1177/0278364918770733
[30]	Wainwright，M.J。；Jordan，M.I.，《图形模型、指数族和变分推理》，Found。趋势马赫数。学习。，1，1-305（2008），URL:10.1561/220000001·Zbl 1193.62107号
[31]	魏毅。；潘，X。；秦，H。；欧阳，W。；Yan，J.，《量化模拟：朝向用于物体检测的极小cnn》，（欧洲计算机视觉会议（ECCV）（2018）论文集），267-283
[32]	吴振中，潘石屹，陈凤，龙国龙，张振中，俞敏洪，图神经网络综合综述。CoRR，2019年，abs/1901.00596。网址：http://arxiv.org/abs/1901.00596。arXiv:1901.00596。
[33]	西安，Y。；兰伯特，C.H。；Schiele，B。；Akata，Z.，《零次学习——对好的、坏的和丑陋的综合评估》，IEEE Trans。模式分析。机器。智力。，41, 2251-2265 (2018)
[34]	肖，J。；A.欧文斯。；Torralba，A.，Sun3d：使用sfm和对象标签重建的大空间数据库，IEEE国际计算机视觉会议（ICCV）（2013）
[35]	肖，L。；王，R。；戴，B。；方，Y。；刘，D。；Wu，T.，基于混合条件随机场的道路检测摄像融合，信息科学。，543-558 (2017)
[36]	张，H。；朗，Y。；杨伟（Yang，W.）。；Shao，L.，零快照学习的双重验证网络，信息科学。，470, 43-57 (2019)
[37]	张，L。；杨，J。；张，D.，用于跨域图像分类的基于域类一致性的转移学习，信息科学。，418, 242-257 (2017)
[38]	张，Z。；乔·S。；谢，C。；沈伟（Shen，W.）。；王，B。；Yuille，A.L.，《具有丰富语义的单快照对象检测》（IEEE计算机视觉和模式识别会议论文集（2018）），5813-5821
[39]	科尔特斯，C。；Vapnik，V.，Support-Vector Networks，（机器学习，20（1995），Kluwer/Springer:Kluwer-Springer USA），273-297·Zbl 0831.68098号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

室内环境中物体识别的镜像条件随机场模型。（英语） Zbl 1483.68284号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

室内环境中物体识别的镜像条件随机场模型。 （英语） Zbl 1483.68284号

MSC公司：

关键词：

软件：

参考文献：

室内环境中物体识别的镜像条件随机场模型。（英语） Zbl 1483.68284号