-
THUMT-PyTorch火炬 :使用开发的新实现 PyTorch公司 它实现了Transformer模型( 变压器 ) ( Vaswani等人,2017年 ). -
THUMT-张力流 :使用开发的实现 TensorFlow公司 它实现了序列到序列模型( 序号2Seq ) ( Sutskever等人,2014年 ),标准的基于注意力的模型( RNN搜索 ) ( Bahdanau等人,2014年 )和Transformer模型( 变压器 ) ( Vaswani等人,2017年 ). -
THUMT剧院 :与开发的原始项目 西雅娜 ,不再更新,因为MLA结束了 西雅娜 .它实现了标准的基于注意力的模型( RNN搜索 ) ( Bahdanau等人,2014年 )、最低风险培训( 地铁 ) ( 沈等,2016 )针对评估指标优化模型参数,半监督训练( 不锈钢 ) ( Cheng等人,2016年 )利用单语语料库学习双向翻译模型和分层关联传播( 轻轨列车 ) ( 丁等人,2017年 )用于可视化和分析RNN搜索。
变压器( Vaswani等人,2017年 ) 多GPU训练和解码 多人分散培训 混合精度训练和解码 模型集合与平均 梯度聚集 用于可视化的TensorBoard
谭志兴、张嘉诚、黄宣成、陈刚、王朔、孙茂松、栾焕波、杨柳。 THUMT:一个用于神经机器翻译的开源工具包 AMTA 2020年。
张嘉诚、丁燕卓、沈世奇、郑勇、孙茂松、栾焕波、杨柳。 2017 THUMT:一个用于神经机器翻译的开源工具包 .arXiv:1706.06415。