×

通过消除路径依赖性来构造基本路径集。 (英语) Zbl 1502.68249号

摘要:新出现的(mathcal{G})-SGD算法只能在简单的神经网络中启发式地找到基路径集,因此它的推广受到了阻碍。从图论的角度来看基本路径集搜索提出了在复杂的全连通神经网络中寻找基路径集的问题。本文提出了DEAH算法来分层求解基本路径集搜索通过消除路径依赖项来解决问题。为此,作者发现了两个独立子结构之间路径依赖的根本原因。提出了路径细分链,以有效消除链内和链间的路径依赖。给出了算法DEAH的理论证明和时间复杂度分析。因此,本文提供了一种在通用实用的神经网络中寻找基路径集的方法。

理学硕士:

68兰特 计算机科学中的图论(包括图形绘制)
05C38号 路径和循环
68T07型 人工神经网络与深度学习
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Wu S、Dimakis A G和Sanghavi S,单层ReLU网络生成的学习分布,第33届神经信息处理系统会议(NeurIPS 2019),加拿大温哥华,2019年。
[2] Wang,Y。;Liu,Y.T。;Ma,Z.M.,神经网络注意层的尺度变分空间,神经计算,392,1-10(2020)·doi:10.1016/j.neucom.2020.01.090
[3] Neeyshabur B、Salakhutdinov R R和Srebro N,Path-sgd:深度神经网络中的路径归一化优化,NIPS 15《第28届神经信息处理系统国际会议论文集》,2015年,2422-2430。
[4] 郑世新,孟强,张海生,等,基于基本路径范数的ReLU神经网络容量控制,第三十三届AAAI人工智能会议(AAAI2019),2019。
[5] 孟Q,郑世兴,张海生,等,G-SGD:在正尺度-内变空间中优化ReLU神经网络,国际学习表征会议(ICLR2019),2019。
[6] Rumelhart,D.E。;辛顿,G.E。;Williams,R.J.,《通过反向传播错误学习表征》,《自然》,3236088533-536(1986)·Zbl 1369.68284号 ·数字对象标识代码:10.1038/323533a0
[7] 风扇,F。;熊,J。;Li,M.,《人工神经网络的可解释性:一项调查》,IEEE辐射与血浆医学学报,5,6,741-760(2021)·doi:10.1109/TRPMS.2021.3066428
[8] 关C,王X,张Q,等,《深入统一理解NLP中的深层神经模型》,第36届机器学习国际会议论文集,美国加利福尼亚州长滩,2019年。
[9] Hooker S、Erhan D、Kidermans P等人,《深度神经网络中可解释方法的基准》,第33届神经信息处理系统会议(NeurIPS 2019),加拿大温哥华,2019年。
[10] Inoue K,两个或多个隐层ReLU神经网络的表示数,2019年第七届国际计算与网络研讨会(CANDARW 2019),2019。
[11] 张清生,曹荣明,施发,等,通过解释图解读CNN知识,第三十二届AAAI人工智能大会,2018,4454-4463。
[12] 吴,M。;Wicker,M。;Ruan,W.,《具有可证明保证的深度神经网络的基于游戏的近似验证》,《理论计算机科学》,807298-329(2020)·Zbl 1436.68199号 ·doi:10.1016/j.tcs.2019.05.046
[13] 签名,D。;内维尔,S。;Paul,A.,《通过(组)不变量解释神经网络的复杂性》,《理论计算机科学》,808,74-85(2020)·Zbl 1436.68320号 ·doi:10.1016/j.tcs.2019.11.012
[14] Xing R T,Xiao M,Zhang Y Z,et al.,具有多个时间延迟的(n+M)神经元双环神经网络模型的稳定性和Hopf分支分析,系统科学与复杂性杂志,2021,DOI:DOI:10.1007/s11424-021-0108-2·Zbl 1494.34164号
[15] Zhu,J.P。;孟,Q。;Chen,W.,《解释神经网络中的基路径集》,《系统科学与复杂性杂志》,33,1,1-13(2020)
[16] Corberan A和Laporte G,电弧布线问题、方法和应用,工业和应用数学学会,2015年·Zbl 1322.90006号
[17] 詹森,J.B。;Gutin,G.Z.,有向图:理论、算法和应用(2009),纽约:Springer,纽约·Zbl 1170.05002号 ·doi:10.1007/978-1-84800-998-1
[18] Korte,B。;Vygen,J.,《组合优化,理论与算法》(2012),纽约:Springer,纽约·Zbl 1237.90001号
[19] 巴布,C.S。;Diwan,A.A.,《图的细分:路和圈的推广》,《离散数学》,308,19,4479-4486(2008)·Zbl 1159.05032号 ·doi:10.1016/j.disc.2007.08.045
[20] Bondy J A和Murty U S R,图论,第10.1节,2008年。
[21] 德特拉夫,M。;Raczek,J。;Yero,I.G.,广义日冕图中的边细分和边多亚细分与一些支配相关参数,Opuscula Mathematica,36,5,575-588(2016)·Zbl 1426.05129号 ·doi:10.7494/OpMath.2016.36.5575
[22] Chaieb,M。;杰迈,J。;Mellouli,K.,《组合优化问题建模的层次分解框架》,《Procedia Computer Science》,60,478-487(2015)·doi:10.1016/j.procs.2015.08.169
[23] Chang,Y。;Tang,H。;Cheng,Y.,基于组合优化的无线传感器网络动态分层节能方法,Sensors,17,7,1665(2017)·数字对象标识代码:10.3390/s17071665
[24] 奥奇艾,H。;金泽,T。;Tamura,K.,基于解空间层次结构的组合优化方法,日本电子与通信,99,18,25-37(2016)·doi:10.1002/ecj.11833
[25] Racke H,网络拥塞最小化的最优层次分解,第40届ACM计算理论年会论文集,2008,255-264·Zbl 1231.68051号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。