×

遗留人工智能系统的一次试验修正和随机分离定理。 (英语) Zbl 1448.68369号

摘要:我们考虑对现有或遗留人工智能(AI)系统进行有效“动态”调整的问题。遗留人工智能系统可以是任意类,尽管它们用于计算临时或最终决策响应的数据应该具有高维拓扑实向量空间的底层结构。我们建议的调优方法可以在不需要重新训练系统的情况下处理错误。在遗留系统中添加了一个简单的感知机节点级联,而不是重新训练。增加的级联调节人工智能遗留系统的决策。如果反复应用,该过程将产生一个调整规则的网络,“修饰”现有人工智能系统并提高其性能。该方法背后的数学原理是基于高维空间中测量集中的基本性质。该方法以微调深度卷积网络的例子进行了说明,该网络已经过预处理,用于检测图像中的行人。

MSC公司:

68T01型 人工智能的一般主题
60D05型 几何概率与随机几何
60欧元15 不平等;随机排序
68T05型 人工智能中的学习和自适应系统
68T07型 人工神经网络与深度学习
68T09号 数据分析和大数据的计算方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德森,J。;贝尔金,M。;戈亚尔,N。;拉德马赫,L。;Voss,J.,《越多越好:学习大型高斯混合的维数的好处》,J.Mach。学习。研究:研讨会和会议记录,。,35, 1-30 (2014)
[2] Ball,K.,《现代凸几何的初步介绍》,Flavors Geom。,31, 1-58 (1997) ·Zbl 0901.5202号
[3] Bennett,K.,《遗留系统:应对成功》,IEEE Softw。,12, 1, 19-23 (1995)
[4] Bisbal,J。;Lawless,D。;吴,B。;Grimson,J.,《遗留信息系统:问题和方向》,IEEE Softw。,16, 5, 103-111 (1999)
[5] 布拉马,P.P。;Wu,D。;她,Y.,《为什么深度学习有效:从多角度解开纠缠》,IEEE Trans。神经网络。学习。系统。,27, 10, 1997-2008 (2016)
[6] R.Burton,诺丁汉视频,2016年,通过动作摄像机从诺丁汉街道拍摄的行人检测测试视频。;R.Burton,诺丁汉视频,2016年,通过动作摄像机从诺丁汉街道拍摄的行人检测测试视频。
[7] T.Chen,M.Li,Y.Li,M.Lin,N.Wang,M.Wang(https://github.com/dmlc/mxnetT.Chen,M.Li,Y.Li,M.Lin,N.Wang,M.Wang(https://github.com/dmlc/mxnet
[8] 达拉,N。;Triggs,B.,人类检测定向梯度直方图,Proc。IEEE计算机视觉和模式识别会议,886-893(2005)
[9] 埃斯·A。;Leibe,B。;辛德勒,K。;van Gool,L.,用于鲁棒多人跟踪的移动视觉系统,Proc。IEEE计算机视觉和模式识别会议,1-8(2008)
[10] 风扇,R.-E。;Chang,K.-W。;谢长杰。;王,X.-R。;Lin,C.-J.,Liblinear:大型线性分类库,J.Mach。学习。1871-1874年第9号决议(2008年)·Zbl 1225.68175号
[11] Fricker,R.J.,从统计角度看,假阳性是不可避免的,《科学》,351569-570(2016)
[12] 齿轮,C。;Kevrekidis,I.,《约束定义流形:低维计算的遗留代码方法》,J.Sci。计算。,25, 1, 17-28 (2005) ·Zbl 1203.37005号
[13] Gibbs,J.,《统计力学基本原理,特别参考热力学的理性基础开发》(1960(1902)),多佛出版社:纽约多佛出版社
[14] 格洛罗,X。;Bengio,Y.,《理解深度前馈神经网络训练的困难》,Proc。第十三届国际人工智能与统计会议(AISTATS),9,249-256(2010)
[15] Gorban,A.,《有序-有序分离:几何修正》,Physica A,374,85-102(2007)
[16] Gorban,A。;丘金,I。;普罗霍罗夫,D。;Sofeikov,K.,随机基近似:Pro-et-Contra,Inf.Sci。,364-365, 129-145 (2016) ·Zbl 1427.68361号
[17] A.Gorban,I.Tyukin,I.Romanenko,《维数的祝福:热力学极限中的分离定理》,2016b,2016年TFMST第二届IFAC数学系统理论热力学基础研讨会上的演讲。2016年9月28日至30日,西班牙维戈。;A.Gorban,I.Tyukin,I.Romanenko,《维数的祝福:热力学极限中的分离定理》,2016b,2016年TFMST第二届IFAC数学系统理论热力学基础研讨会上的演讲。2016年9月28日至30日,西班牙维戈。
[18] Gromov,M.,黎曼和非黎曼空间的度量结构。附录由M.Katz、P.Pansu和S.Semmes编写。肖恩·穆夏尔·贝茨(Sean Muchael Bates)(1999)译自法语,伯克豪泽:马萨诸塞州波士顿伯克豪塞·Zbl 0953.5302号
[19] Gromov,M.,《腰围等高线和地图浓度》,GAFA,Geomter。功能。分析。,13, 178-215 (2003) ·Zbl 1044.46057号
[20] Halmos,P.,有限维向量空间,数学本科生教材(1974年),施普林格·Zbl 0288.15002号
[21] Hansen,L.K。;Salamon,P.,《神经网络集成》,IEEE Trans。模式分析。机器。智力。,1993年10月12日至1001日(1990年)
[22] He,K。;张,X。;任,S。;Sun,J.,图像识别的深度残差学习,Proc。IEEE计算机视觉和模式识别会议,770-778(2016)
[23] Ho,T.K.,《随机决策森林》,Proc。第三届国际文献分析与识别会议,993-1001(1995)
[24] Ho,T.K.,构建决策森林的随机子空间方法,IEEE Trans。模式分析。机器。智力。,20, 8, 832-844 (1998)
[25] Ison,M。;Quian Quiroga,R。;Fried,I.,《人脑单个神经元对新记忆的快速编码》,《神经元》,87,1,220-230(2015)
[26] Jackson,D.,《主成分分析中的停止规则:启发式和统计方法的比较》,生态学,74,8,2204-2214(1993)
[27] Y.Jia,Caffe:一种用于快速特征嵌入的开源卷积架构,2013年(http://caffe.berkeleyvision.org/); Y.Jia,Caffe:一种用于快速特征嵌入的开源卷积架构,2013年(http://caffe.berkeleyvision.org/)
[28] 约翰逊,W.B。;Lindenstrauss,J.,Lipschitz映射到Hilbert空间的扩展,Contemp。数学。,26, 1, 189-206 (1984) ·Zbl 0539.46017号
[29] Krein,M。;Milman,D.,关于正则凸集的极点,StudiaMath,9,133-138(1940)·Zbl 0063.03360号
[30] Krizhevsky,A。;Sutskever,I。;Hinton,G.,用深度卷积神经网络进行Imagenet分类,(Pereira,F.;Burges,C.J.C.;Bottou,L.;Weinberger,K.Q.,《神经信息处理系统进展》25(2012),Curran Associates,Inc.),1097-1105
[31] 库兹涅佐娃,A。;黄禹锡。;罗森哈恩,B。;Sigal,L.,《扩展对象检测器视野:视频中对象检测的增量学习框架》,Proc。IEEE计算机视觉和模式识别会议(CVPR),28-36(2015)
[32] Lévy,P.,Problèmes Concrets d’analysis Fonctionnelle(1951年),《Gauthier-Villars:Gauthier Villars Paris》·Zbl 0043.32302号
[33] Macarthur,R.,《鸟类物种相对丰度》,Proc。国家。阿卡德。科学。,43, 3, 293-295 (1957)
[34] 米尔曼,V.D。;Schechtman,G.,有限维赋范空间的渐近理论:黎曼流形中的等周不等式,数学讲义,1200(2009),Springer
[35] 米斯拉,I。;Shrivastava,A。;Hebert,M.,《视频中物体探测器的半监督学习》,Proc。IEEE计算机视觉和模式识别会议(CVPR),3594-3602(2015)
[36] Nguyen,A。;Yosinski,J。;Clune,J.,深度神经网络很容易被愚弄:无法识别图像的高置信预测,Proc。IEEE计算机视觉和模式识别会议(CVPR),427-436(2015)
[37] Prest,A。;Leistner,C。;西维拉,J。;施密德,C。;Ferrari,V.,从弱注释视频中学习对象类检测器,Proc。IEEE计算机视觉和模式识别会议(CVPR),3282-3289(2012)
[38] Quian Quiroga,R.,《概念细胞:陈述性记忆功能的构建块》,《神经科学自然评论》。,2012年8月13日,第587-597页
[39] Quian Quiroga,R。;雷迪,L。;Kreiman,G。;科赫,C。;Fried,I.,《人脑单个神经元的不变视觉表征》,《自然》,435,7045,1102-1107(2005)
[40] Rudin,W.,《函数分析》,《国际纯数学和应用数学丛书》(1991年),麦格劳-希尔出版社·Zbl 0867.46001号
[41] 俄勒冈州Russakovsky。;邓,J。;苏,H。;克劳斯,J。;Satheesh,S。;马,S。;黄,Z。;Karpathy,A。;科斯拉,A。;伯恩斯坦,M。;A.C.Berg。;Fei-Fei,L.,Imagenet大规模视觉识别挑战,国际计算机杂志。视觉。,1-42 (2014)
[42] 斯卡达潘,S。;Wang,D.,《神经网络中的随机性:概述》,Wiley Interdiscip。版次:7、2、e1200(2017)
[43] Schaefer,H.,拓扑向量空间(1999),Springer:Springer New York·Zbl 0983.46002号
[44] Simonyan,K。;Zisserman,A.,《用于大规模图像识别的超深卷积网络》,学习表征国际会议(2015)
[45] 塞格迪,C。;Zaremba,W。;Sutskever,I。;布鲁纳,J。;Erhan,D。;古德费罗,I.J。;Fergus,R.,神经网络的有趣特性,Proc。国际学习代表大会(ICLR)(2014年)
[46] D.D.团队,《Deeplearning4j:jvm的开源分布式深度学习》,2016年,(Apache Software Foundation License 2.0)。http://deeplearning4j.orgD.D.团队,《Deeplearning4j:jvm的开源分布式深度学习》,2016年,(Apache Software Foundation License 2.0)。http://deeplearning4j.org
[47] Vapnik,V.,《统计学习理论的本质》(2000年),斯普林格-Verlag·Zbl 0934.62009号
[48] Vapnik,V。;Chapelle,O.,支持向量机的误差期望界,神经计算。,12, 9, 2013-2036 (2000)
[49] 维斯科塔斯,I。;Quian Quiroga,R。;Fried,I.,人类内侧颞叶神经元优先对个人相关图像做出反应,Proc。美国国家科学院。科学。,106, 50, 21329-21334 (2009)
[50] Wang,D.,编辑:神经网络训练的随机算法,信息科学。,364-365, 126-128 (2016) ·Zbl 1427.68017号
[51] 郑S。;Song,Y。;Leung,T。;Goodfellow,I.,《通过稳定性训练提高深度神经网络的鲁棒性》,Proc。IEEE计算机视觉和模式识别会议(CVPR)(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。