@正在进行{zhang-sennrich-2019-轻量级,title=“用于序列建模的轻量级递归网络”,author=“张彪里科·森里奇“,editor=“Korhonen、Anna和Traum、David和M{\`a}rquez,Llu{\'i}s“,booktitle=“计算语言学协会第57届年会会议记录”,月=七月,year=“2019”,address=“意大利佛罗伦萨”,publisher=“计算语言学协会”,url=“https://aclantology.org/P19-1149”,doi=“10.18653/v1/P19-1149”,pages=“1538--1548”,抽象=“递归网络在复杂递归单元的帮助下,在各种顺序任务上取得了巨大成功,但由于弱并行性,计算效率严重低下。缓解这个问题的一个方向是将大量计算转移到递归之外。在本文中,我们提出了一种轻量级递归网络LRN使用输入和遗忘门处理长程依赖关系以及渐变消失和爆炸,所有与参数相关的计算都不考虑递归。LRN中的递归仅操作分配给每个令牌的权重,将LRN与自关注网络紧密连接。我们将LRN应用于几个神经序列模型中现有递归单元的替换。在六个NLP任务上的大量实验表明,LRN在模型性能几乎没有损失的情况下获得了最佳的运行效率。",}
<?xml版本=“1.0”编码=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“zhang-sennrich-2019-lightweight”><标题信息><title>用于序列建模的轻量级递归网络</titleInfo><name type=“personal”><namePart type=“given”>彪<namePart type=“family”>张<角色>作者</角色></name><name type=“personal”>Rico(Rico)Sennrich<角色>作者</角色></name><originInfo>发布日期:2019-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会第57届年会会议记录</titleInfo><name type=“personal”>安娜Korhonen公司<角色>编辑器</角色></name><name type=“personal”>大卫<namePart type=“family”>创伤</namePart><角色>编辑器</角色></name><name type=“personal”>路易斯Márquez(Már quez)<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>意大利佛罗伦萨</place></originInfo>会议出版物</relatedItem>递归网络在复杂递归单元的帮助下,在各种顺序任务上取得了巨大成功,但由于并行性较差,计算效率严重低下。缓解此问题的一个方向是将大量计算转移到递归之外。在本文中,我们提出了一种轻量级递归网络,即LRN。LRN使用输入和遗忘门来处理长期依赖性以及梯度消失和爆炸,所有与参数相关的计算都不考虑递归。LRN中的递归只操纵分配给每个令牌的权重,将LRN与自注意网络紧密连接起来。我们将LRN应用于几个神经序列模型中现有递归单元的替换。在六个NLP任务上的大量实验表明,LRN在模型性能几乎没有损失的情况下获得了最佳的运行效率</摘要><identifier type=“citekey”>zhang-sennrich-2019-lightweight10.18653/v1/P19-1149<位置><网址>https://aclantology.org/P19-1149</url></位置><部分>2019-07年7月<扩展单元=“page”><开始>1538</开始>1548年</范围></部分></mods></modsCollection>
%0会议记录%序列建模的轻量级递归网络%张彪%A Sennrich,里科%Y Korhonen,安娜%大卫·Y·特拉姆%Y Márquez,Lluís%计算语言学协会第57届年会论文集%D 2019年%7月8日%计算语言学协会%C意大利佛罗伦萨%F zhang-sennrich-2019-轻量级%X递归网络在复杂递归单元的帮助下,在各种顺序任务上取得了巨大成功,但由于并行性较差,计算效率严重低下。缓解此问题的一个方向是将大量计算转移到递归之外。在本文中,我们提出了一种轻量级递归网络,即LRN。LRN使用输入和遗忘门来处理长期依赖性以及梯度消失和爆炸,所有与参数相关的计算都不考虑递归。LRN中的递归仅操作分配给每个令牌的权重,将LRN与自关注网络紧密连接。我们将LRN应用于几个神经序列模型中现有递归单元的替换。在六个NLP任务上的大量实验表明,LRN在模型性能几乎没有损失的情况下获得了最佳的运行效率。%10.18653/v1/P19-1149兰特%U型https://aclantology.org/P19-1149%U型https://doi.org/10.18653/v1/P19-1149%电话:1538-1548
降价(非正式)
[用于序列建模的轻量级递归网络](https://aclcollectory.org/P19-1149)(Zhang&Sennrich,ACL 2019)
国际计算语言学协会
- 张彪和里科·森里奇。2019用于序列建模的轻量级递归网络.英寸计算语言学协会第57届年会会议记录,第1538-1548页,意大利佛罗伦萨。计算语言学协会。