×

胶水

swMATH ID: 30755
软件作者: Wang,A.、Singh,A.、Michael,J.、Hill,F.、Levy,O.、Bowman,S.R。
描述: 通用语言理解评估(GLUE)基准是用于训练、评估和分析自然语言理解系统的资源集合。GLUE包括:九个句子或句子对语言理解任务的基准,这些任务建立在已建立的现有数据集上,并被选择用于涵盖各种数据集大小、文本类型和难度,一个诊断数据集,用于评估和分析自然语言中广泛的语言现象方面的模型性能,一个用于跟踪基准性能的公共排行榜和一个用于可视化诊断集上模型性能的仪表板。GLUE基准的格式是模型识别的,因此任何能够处理句子和句子对并生成相应预测的系统都有资格参与。选择基准任务是为了支持使用参数共享或其他迁移学习技术跨任务共享信息的模型。GLUE的最终目标是推动开发通用且健壮的自然语言理解系统的研究。
主页: https://gluebenchmark.com/
相关软件: BERT(误码率);罗贝尔塔;小队;手套;XLNet公司;张紧器2传感器;艾伯特;AllenNLP公司;超级胶水;PyTorch公司;变压器;BLEU公司;spaCy公司;迪蒂尔伯特;TensorFlow公司;玛丽安;单词2vec;github;比赛;GPT-3级
引用于: 7文件

按年份列出的引文