释义识别、语义文本相似度、自然语言推理和问答的神经网络模型

武威兰,魏旭


摘要
本文分析了几种用于句子对建模的神经网络设计(及其变体),并在八个数据集上广泛比较了它们的性能,包括复述识别、语义文本相似度、自然语言推理和问答任务。尽管大多数模型都声称具有最先进的性能,但原始论文通常只报道了一到两个选定的数据集。我们提供了一项系统研究,并表明:(i)通过LSTM和内容间交互对上下文信息进行编码至关重要,而当可用数据较少时,成对单词交互模型的性能最佳。我们以开源工具包的形式发布我们的实现。
选集ID:
C18-1328号
体积:
第27届国际计算语言学会议论文集
月份:
八月
年份:
2018
地址:
美国新墨西哥州圣达菲
编辑:
艾米丽·本德,莱昂·德钦斯基,皮埃尔·伊莎贝尔
地点:
冷却
SIG公司:
出版商:
计算语言学协会
注:
页:
3890–3902
语言:
网址:
https://aclantology.org/C18-1328
内政部:
比比键:
引用(ACL):
无为岚和魏旭。2018释义识别、语义文本相似度、自然语言推理和问答的神经网络模型.英寸第27届国际计算语言学会议论文集,第3890–3902页,美国新墨西哥州圣菲。计算语言学协会。
引用(非正式):
释义识别、语义文本相似度、自然语言推理和问答的神经网络模型(兰和徐,COLING 2018)
复制引文:
PDF格式:
https://aclantology.org/C18-1328.pdf
代码
兰武伟/SPM_toolkit
数据
多NLI个人识别号SNLI公司TrecQA公司维基QA