Fast Finite Width Neural Tangent Kernel

Novak, Roman; Sohl-Dickstein, Jascha; Schoenholz, Samuel S.

计算机科学>机器学习

arXiv公司：2206.08720（cs）

【于2022年6月17日提交】

标题：快速有限宽度神经切线核

作者：罗曼·诺瓦克,贾沙·索尔·迪克斯坦（Jascha Sohl-Dickstein）,塞缪尔·肖恩霍尔茨

查看PDF

摘要：神经切线核（NTK），定义为$\Theta_\Theta^f（x_1，x_2）=\left[\partial f（\Theta，x_1）\big/\partial\Theta\right]\left[\partical f（\ttheta，x_2，big/\ partial\T Theta\right]^T$，其中$\left[\partial-f（\tea，\cdot）\big/\partial/Theta\right]$是一个神经网络（NN）雅可比，已成为深度学习的中心研究对象。在无限宽度限制下，NTK有时可以解析计算，有助于理解神经网络体系结构的训练和泛化。在有限宽度下，NTK还用于更好地初始化NN、比较模型之间的条件、执行架构搜索和进行元学习。不幸的是，有限宽度NTK的计算成本非常昂贵，这严重限制了它的实用性。我们首次深入分析了有限宽度网络中NTK计算的计算和内存需求。利用神经网络的结构，我们进一步提出了两种新的算法，可以改变有限宽度NTK的计算和内存需求指数，从而显著提高效率。我们的算法可以以黑盒的方式应用于任何可微函数，包括那些实现神经网络的函数。我们在Neural Tangents包中开源了我们的实现(arXiv:1912.02803号)在此https URL.

评论：	作为会议文件在ICML 2022上发布
学科：	机器学习（cs.LG）; 人工智能；机器学习（stat.ML）
引用为：	arXiv公司：2206.08720【cs.LG】
	（或 arXiv:2206.08720v1【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2206.08720

提交历史记录

发件人：Roman Novak[查看电子邮件]
[第1版]2022年6月17日星期五12:18:22 UTC（3308 KB）

计算机科学>机器学习

标题：快速有限宽度神经切线核

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

标题：快速有限宽度神经切线核

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目