@进行中{irie-etal-2023-实际,title=“线性变压器及其递归和自引用扩展的实际计算能力”,author={Irie、Kazuki和Csord{\'a}s、R{\'o}bert和施密杜贝尔,J{“u}rgen},editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.588”,doi=“10.18653/v1/2023.emnlp-main.588”,pages=“9455--9465”,abstract=“最近对递归神经网络(RNN)计算能力的研究揭示了给定实时和有限精度假设的RNN体系结构层次。在这里,我们研究线性关注的自回归变换器,即线性变换器(LT)或快速加权程序设计器(FWP).LT的特殊之处在于,它们相当于具有固定大小状态的类RNN序列处理器,同时也可以表示为现在流行的自关注网络。我们表明,标准变压器的许多著名结果直接传递到LT/FWP。我们的正式语言识别实验表明,最近提出的FWP扩展(如递归FWP和自参考权重矩阵)成功地克服了LT的某些限制,例如,允许对奇偶问题进行泛化。我们的代码是公开的。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“irie-etal-2023-实用”><标题信息>线性变压器及其递归和自引用扩展的实际计算能力</titleInfo><name type=“personal”>川崎Irie(Irie)<角色>作者</角色></name><name type=“personal”>Róbert(罗贝特)索尔达斯<角色>作者</角色></name><name type=“personal”>Jürgen(吉尔根)施密杜贝尔<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达<namePart type=“family”>Bouamor</namePart><角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”>卡利卡语巴厘岛<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>新加坡</place></originInfo>会议出版物</relatedItem>最近对递归神经网络(RNN)计算能力的研究揭示了RNN体系结构的层次结构,给出了实时和有限精度的假设。在这里,我们研究具有线性注意力的自回归变压器,即线性变压器(LT)或快速加权程序员(FWP)。LT的特殊之处在于,它们相当于具有固定大小状态的类RNN序列处理器,同时也可以表示为现在流行的自关注网络。我们表明,标准变压器的许多著名结果直接传递到LT/FWP。我们的正式语言识别实验表明,最近提出的FWP扩展(如递归FWP和自参考权重矩阵)成功地克服了LT的某些限制,例如,允许对奇偶问题进行泛化。我们的代码是公开的</摘要><identifier type=“citekey”>irie-etal-2023-实用</identifier>10.18653/v1/2023.emnlp-main.588<位置><网址>https://aclantology.org/2023.emnlp-main.588</url></位置><部分>2023-12年<扩展单元=“page”><start>9455</start><end>9465</范围></部分></mods></modsCollection>
%0会议记录%线性变压器的实用计算能力及其递归和自参考扩展%A Irie,Kazuki公司%A Csordás,罗伯特%Jürgen施密杜贝尔%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%鸢尾-etal-2023-实用%X最近对递归神经网络(RNN)计算能力的研究揭示了给定实时和有限精度假设的RNN体系结构层次。在这里,我们研究具有线性注意力的自回归变压器,即线性变压器(LT)或快速加权程序员(FWP)。LT的特殊之处在于,它们相当于具有固定大小状态的类RNN序列处理器,同时也可以表示为现在流行的自关注网络。我们表明,标准变压器的许多著名结果直接传递到LT/FWP。我们的正式语言识别实验表明,最近提出的FWP扩展(如递归FWP和自参考权重矩阵)成功地克服了LT的某些限制,例如,允许对奇偶问题进行泛化。我们的代码是公开的。%R10.18653/v1/2023.emnlp-main.588%U型https://aclantology.org/2023.emnlp-main.588%U型https://doi.org/10.18653/v1/2023.emnlp-main.588%电话:9455-9465
降价(非正式)
[线性变压器的实际计算能力及其递归和自参考扩展](https://aclantology.org/2023.emnlp-main.588)(Irie等人,EMNLP 2023)
国际计算语言学协会
- Kazuki Irie、Róbert Csordás和Jürgen Schmidhuber。2023线性变压器的实用计算能力及其递归和自参考扩展.英寸2023年自然语言处理实证方法会议记录,第9455–9465页,新加坡。计算语言学协会。