学习通过反复反向传播在延长的时间间隔内存储信息需要很长时间,主要是因为错误回流不足、衰减。我们简要回顾了Hochreiter(1991)对这个问题的分析,然后介绍了一种新的、高效的、基于梯度的方法,称为长短期记忆(LSTM)。在不造成损害的情况下截断梯度,LSTM可以通过在特定单元内的恒定误差转盘中强制恒定误差流,学会跨越超过1000个离散时间步长的最小时间滞后。乘法门单元学习打开和关闭对恒定误差流的访问。LSTM在空间和时间上是局部的;每个时间步长和权重的计算复杂度为O(运行). 1. 我们对人工数据的实验涉及局部、分布式、实值和噪声模式表示。与实时递归学习、时间反向传播、递归级联相关、Elman网和神经序列组块相比,LSTM可以获得更多成功的运行,并且学习速度更快。LSTM还解决了以前递归网络算法从未解决过的复杂、人工长时间滞后任务。

此内容仅以PDF格式提供。
您当前无权访问此内容。