×

改革者

swMATH ID: 45339
软件作者: Nikita Kitaev,Łukasz Kaiser,Anselm Levskaya
描述: 改革者:高效的变压器。大型变压器模型通常会在许多任务中获得最先进的结果,但训练这些模型可能成本高昂,尤其是在长序列中。我们介绍了两种提高变压器效率的技术。首先,我们用一种使用位置敏感散列的方法来代替网络产品关注,将其复杂性从O(L2)更改为O(LlogL),其中L是序列的长度。此外,我们使用可逆残差层代替标准残差,它允许在训练过程中只存储激活一次,而不是N次,其中N是层数。由此产生的模型Reformer的性能与Transformer模型相当,同时在长序列上具有更高的内存效率和更快的速度。
主页: https://arxiv.org/abs/2001.04451
源代码:  https://github.com/lucidrains/reformer-pytorch
相关软件: 张紧器2传感器;GPT-3级;Linformer公司;合成器;朗福雷特;FMM成型机;Nyströmformer公司;ViT公司;伯特;音乐变压器;神经CDE;小队;阳极;火炬差异;DARPA时间;变压器-XL;PixelCNN(像素有线电视新闻网)++;火炬;github;RMS公司
引用于: 3文件

按年份列出的引文