×

遗留人工智能系统校正集合的快速构建:算法和案例研究。 (英语) 兹比尔1448.68370

摘要:本文提出了一种新的方法,用于构造简单且计算效率高的通用人工智能(AI)系统改进,包括多层和深度学习神经网络。这些改进是在现有人工智能架构的基础上增加的小型网络集成。该方法的理论基础是基于随机分离定理和测度集中的思想。我们表明,根据原始人工智能系统内部信号统计特性的温和技术假设,该方法能够快速消除人工智能的错误,概率接近于数据集上的错误,数据集的维数可能是指数级的。通过数值例子和美国手语中数字识别的案例研究来说明该方法。

MSC公司:

68T01型 人工智能的一般主题
60F05型 中心极限和其他弱定理
2017年10月68日 人工神经网络与深度学习
第68页第42页 Agent技术与人工智能
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德森,J。;贝尔金,M。;戈亚尔,N。;拉德马赫,L。;Voss,J.,《越多越好:学习大型高斯混合的维数的好处》,J.Mach。学习。研究,35,1-30(2014)
[2] 亚瑟·D·。;Vassilvitskii,S.,k-means++:仔细播种的优势,第十八届ACM-SIAM离散算法年会论文集,1027-1035(2007),工业和应用数学学会·Zbl 1302.68273号
[3] 亚瑟·D·。;Vassilvitskii,S.,k-means方法的速度有多慢?,第二十二届计算几何年会论文集,144-153(2006),ACM·Zbl 1153.68385号
[4] Ball,K.,《现代凸几何的初步介绍》,《几何的味道》。,31, 1-58 (1997) ·Zbl 0901.5202号
[5] Barron,A.R.,σ函数叠加的通用近似界,IEEE Trans。Inf.理论,39,3,930-945(1993)·兹伯利0818.68126
[6] R.Beene、A.Levin、E.Uber新车碰撞测试中未设置刹车,2018年(https://www.bloomberg.com/news/articles/2018-05-24/uber-self-driving-system-saw-pedestrian-killed-but-dindn-t-stop; R.Beene、A.Levin、E.Uber新车碰撞测试中未设置刹车,2018年(https://www.bloomberg.com/news/articles/2018-05-24/uber-self-driving-system-saw-pedestrian-killed-but-dindn-t-stop
[7] 贝达,V。;Radpour,D.,使用深度卷积网络进行美国手语手势识别(2017,),arXiv预印本arXiv:11710.06836
[8] 布拉马,P.P。;Wu,D。;她,Y.,《为什么深度学习有效:多方面的解纠缠视角》,IEEE Trans。神经网络。学习。系统。,1997-2008年10月27日(2016年)
[9] Chapelle,O.,在原始神经计算中训练支持向量机。,19, 5, 1155-1178 (2007) ·兹比尔1123.68101
[10] Chen,T。;古德费罗,I。;Shlens,J.,Net2net:通过知识转移加速学习,ICLR 2016(2015),arXiv预印本arXiv:1511.05641
[11] Cucker,F。;Smale,S.,《学习的数学基础》,布尔。美国数学。《社会学杂志》,39,1,1-49(2002)·Zbl 0983.68162号
[12] Donoho,D.,《高维数据分析:维度的诅咒和祝福》,AMS数学挑战Lect。,1, 2000, 32 (2000)
[13] Draelos,T.J。;Miner,N.E。;兰姆,C.C。;C.M.葡萄园。;卡尔森,K.D。;C.D.詹姆斯。;Aimone,J.B.,神经发生深度学习,IEEE国际神经网络联合会议(IJCNN),526-533(2017),IEEE
[14] Fahlman,S.E。;Lebiere,C.,级联相关学习体系结构,神经信息处理系统进展,524-532(1990)
[15] C.福克斯,人脸识别警察工具“极其不准确”,2018年(http://www.bbc.co.uk/news/technology-44089161; C.福克斯,人脸识别警察工具“极其不准确”,2018年(http://www.bbc.co.uk/news/technology-44089161
[16] 弗伦德,Y。;Schapire,R.E.,《在线学习的决策理论推广及其在助推中的应用》,J.Compute。系统。科学。,55, 1, 119-139 (1997) ·Zbl 0880.68103号
[17] 伽马,J。;Braddil,P.,级联推广,马赫。学习。,41, 3, 315-343 (2000) ·Zbl 0966.68180号
[18] Gibbs,J.,《统计力学基本原理,特别参考热力学的理性基础》(1960(1902)),多佛出版社:纽约多佛出版社·JFM 33.0708.01号文件
[19] Gorban,A.N.,《有序-有序分离:几何修正》,Phys。A、 37485-102(2007)
[20] Gorban,A.N。;Tyukin,I.Y.,随机分离定理,神经网络。,94, 255-259 (2017) ·Zbl 1429.68217号
[21] Gorban,A.N。;Tyukin,I.Y.,《维度的祝福:数据统计物理学的数学基础》,Philos。事务处理。R.Soc.A,376(2018)·Zbl 1470.82004年
[22] 戈尔班,A.N。;伯顿,R。;罗曼年科,I。;Tyukin,I.Y.,《遗留人工智能系统和随机分离定理的一次试验修正》,Inf.Sci。,484, 237-254 (2019) ·Zbl 1448.68369号
[23] Gorban,A.N。;Golubkov,A。;格雷丘克,B。;Mirkes,E.M。;Tyukin,I.Y.,《用线性判别法校正人工智能系统:概率基础》,《信息科学》。,466、303-322(2018)·Zbl 1441.68201号
[24] Gromov,M.,黎曼和非黎曼空间的度量结构。附录由M.Katz、P.Pansu和S.Semmes编写。肖恩·穆夏尔·贝茨(Sean Muchael Bates)(1999)译自法语,伯克豪泽:马萨诸塞州波士顿伯克豪塞·Zbl 0953.5302号
[25] Gromov,M.,《腰围等高线和地图浓度》,GAFA,Geom。功能。分析。,13, 178-215 (2003) ·Zbl 1044.46057号
[26] Hartigan,J.A。;Wong,M.A.,《k均值聚类算法》,J.R.Stat.Soc.Ser。C(应用统计学),28,1,100-108(1979)·兹比尔0447.62062
[27] He,K。;张,X。;任,S。;Sun,J.,图像识别的深度剩余学习,2016年IEEE计算机视觉和模式识别会议(CVPR),770-778(2016)
[28] Hoeffing,W.,有界随机变量和的概率不等式,美国统计协会,58,301,13-30(1963)·Zbl 0127.10602号
[29] F.N.兰多拉。;韩,S。;Moskewicz,M.W。;阿什拉夫,K。;Dally,W.J。;Keutzer,K.,SqueezeNet:Alexnet级精度,参数少50倍,模型大小小于0.5 mb(2016,),arXiv预打印arXiv:1602.07360
[30] Jackson,D.,《主成分分析中的停止规则:启发式和统计方法的比较》,生态学,74,8,2204-2214(1993)
[31] Kainen,P.C.,《利用高维几何异常:当复杂性使计算更容易时,控制和信号处理中的计算机密集型方法》,283-294(1997),Springer·Zbl 0906.68126号
[32] Kainen,P.C。;Kurkova,V.,欧氏空间的拟正交维数,应用。数学。莱特。,6, 3, 7-10 (1993) ·Zbl 0783.05030号
[33] 库兹涅佐娃,A。;黄,S。;罗森哈恩,B。;Sigal,L.,扩展对象检测器的视野:视频中对象检测的增量学习框架,Proc。IEEE计算机视觉和模式识别会议(CVPR),28-36(2015)
[34] Lévy,P.,Problèmes concrets d’analysis fonctionnelle(1951年),《高铁维拉斯:高铁维纳斯巴黎》·兹比尔0043.32302
[35] 米斯拉,I。;Shrivastava,A。;Hebert,M.,视频中物体检测器的半监督学习,Proc。IEEE计算机视觉和模式识别会议(CVPR),3594-3602(2015)
[36] Pratt,L.,神经网络之间基于可辨别性的传输,高级神经信息处理。,5, 204-211 (1992)
[37] Prest,A。;Leistner,C。;西维拉,J。;施密德,C。;Ferrari,V.,从弱注释视频中学习对象类检测器,Proc。IEEE计算机视觉和模式识别会议(CVPR),3282-3289(2012)
[38] Rokach,L.,基于集成的分类器,Artif。智力。版本,33,1-2,1-39(2010)
[39] Rosenblatt,F.,《神经动力学原理:感知器和大脑机制理论》(1962年),斯巴达书籍·Zbl 0143.43504号
[40] 俄勒冈州Russakovsky。;邓,J。;苏,H。;克劳斯,J。;Satheesh,S。;马,S。;黄,Z。;Karpathy,A。;科斯拉,A。;伯恩斯坦,M。;A.C.Berg。;Fei-Fei,L.,Imagenet大规模视觉识别挑战,国际计算机杂志。视觉。,1-42 (2014)
[41] 斯卡达潘,S。;Wang,D.,《神经网络中的随机性:概述》,Data Min.Knowl。发现。,7, 2 (2017)
[42] 塞格迪,C。;刘伟。;贾毅。;Sermanet,P。;里德,S。;安格洛夫,D。;Erhan,D。;Vanhoucke,V。;Rabinovich,A.,《卷积深入研究》,IEEE计算机视觉和模式识别会议论文集,1-9(2015)
[43] Vapnik,V。;Chapelle,O.,支持向量机的误差期望界,神经计算。,12, 9, 2013-2036 (2000)
[44] Vapnik,V。;Izmailov,R.,《支持向量机和神经网络中的知识转移》,《数学年鉴》。Artif公司。智力。,1-17 (2017)
[45] 王,D。;Cui,C.,具有异构特征的随机配置网络集成用于大规模数据分析,信息科学。,417, 55-71 (2017)
[46] 王,D。;Li,M.,具有普遍近似性质的深度随机配置网络(2017)
[47] 王,D。;Li,M.,《随机配置网络:基础和算法》,IEEE Trans。赛博。,47, 10, 3466-3479 (2017)
[48] Yosinski,J。;克吕恩,J。;Y.本吉奥。;Lipson,H.,深度神经网络中的特征如何传递?,神经信息处理系统的进展,3320-3328(2014)
[49] 郑S。;Song,Y。;Leung,T。;Goodfellow,I.,《通过稳定性训练提高深度神经网络的鲁棒性》,Proc。IEEE计算机视觉和模式识别会议(CVPR),4480-4488(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。