LS伯特 swMATH ID: 33748 软件作者: Qiang Jipeng、Yun Li、Yi Zhu、Yunhao Yuan、Wu Xindong 描述: LSBert:一个用于词汇简化的简单框架。词汇简化(LS)的目的是将给定句子中的复杂词替换为具有同等意义的简单替代词,以简化句子。近年来,无监督的词汇简化方法仅依赖复词本身而不考虑给定句子生成候选替换,这将不可避免地产生大量虚假候选。在本文中,我们提出了一个基于预处理表示模型Bert的词汇简化框架LSBert,它能够(1)在检测需要简化的单词和生成替代候选词时利用更广泛的上下文,(2)在对候选词进行排序时考虑五个高质量的特征,包括伯特预测顺序、基于伯特的语言模型和复述数据库PPDB,以及其他LS方法中常用的词频和词相似度。我们表明,我们的系统输出的词汇简化在语法上正确,语义上适当,并且与这些基线相比取得了明显的改进,在三个著名的基准测试中,其准确度超过了最先进的29.8分。 主页: https://arxiv.org/abs/2006.14939 关键词: arXiv_cs。氯;信息检索;arXiv_cs。红外;词汇简化;BERT(误码率);无监督;预训练语言模型 相关软件: PPDB公司;BLEURT公司;捷运局;GPT-3级;列克逊斯坦;BERT(误码率) 引用于: 1文件 标准条款 1出版物描述软件 年份 LSBert:一个简单的词汇简化框架arXiv公司Qiang Jipeng、Yun Li、Yi Zhu、Yunhao Yuan、Wu Xindong 2020 全部的 前5名6位作者引用 1 李云 1 强、纪鹏 1 吴新东 1 袁云浩 1 朱世玉 1 朱,易 连载1篇 1 人工智能 在1个字段中引用 1 计算机科学(68至XX) 按年份列出的引文