重返

广义递归神经网络的可扩展训练框架是一种基于现代神经网络结构的TeaNo/TySoFalm实现。在多GPU环境下,对递归神经网络的快速可靠训练进行了优化。特点包括:前馈神经网络的小批量训练;基于序列块的递归训练;神经网络;包括我们自己的快速CUDA内核的长短期记忆递归神经网络;多维LSTM(GPU只,没有CPU版本);大数据集的内存管理;跨工作分布。多个设备,灵活和快速的架构,允许各种编码器注意解码器模型。