胶水 swMATH ID: 30755 软件作者: Wang,A.、Singh,A.、Michael,J.、Hill,F.、Levy,O.、Bowman,S.R。 描述: 通用语言理解评估(GLUE)基准是用于训练、评估和分析自然语言理解系统的资源集合。GLUE包括:九个句子或句子对语言理解任务的基准,这些任务建立在已建立的现有数据集上,并被选择用于涵盖各种数据集大小、文本类型和难度,一个诊断数据集,用于评估和分析自然语言中广泛的语言现象方面的模型性能,一个用于跟踪基准性能的公共排行榜和一个用于可视化诊断集上模型性能的仪表板。GLUE基准的格式是模型识别的,因此任何能够处理句子和句子对并生成相应预测的系统都有资格参与。选择基准任务是为了支持使用参数共享或其他迁移学习技术跨任务共享信息的模型。GLUE的最终目标是推动开发通用且健壮的自然语言理解系统的研究。 主页: https://gluebenchmark.com/ 相关软件: BERT(误码率);罗贝尔塔;小队;手套;XLNet公司;张紧器2传感器;艾伯特;AllenNLP公司;超级胶水;PyTorch公司;变压器;BLEU公司;spaCy公司;迪蒂尔伯特;TensorFlow公司;玛丽安;单词2vec;github;比赛;GPT-3级 引用于: 7文件 全部的 前5名被30位作者引用 1 阿尔蒂尼西克,埃内斯 1 桑杰·查拉 1 Cruz,Meenalosini病毒 1 Parag Pravin,Dakle 1 塞尔达尔·卡迪奥格鲁 1 约翰内斯·克里贝尔 1 拉什洛·贾诺斯·拉基 1 刘伟 1 萨法·梅萨乌德 1 阿努帕马·南布鲁 1 倪明泽 1 P.,曼加尔拉杰 1 里贾纳波利蒂 1 南达·库马尔(Nandha Kumar) 1 普雷西·拉加万 1 赛克里希纳·拉拉班迪 1 S.、Sudhakar Ilango 1 Husrev Taha Sencar 1 西比·查卡拉瓦蒂(Sibi Chakkaravarthy) 1 沈洁 1 拉维苏塔·斯里尼瓦萨穆尔西 1 伦纳特·施蒂茨 1 Tripathy,贾汀·卡提克 1 卡提克乌普鲁里 1 维贾亚库马尔(Vijayakumar,Vaidehi) 1 王策 1 王静 1 杨子建Győz \337] 1 于,水 1 朱天清 引用于4个系列 三 机器学习 1 欧洲运筹学杂志 1 数学与信息年鉴 1 计算机科学评论 在3个字段中引用 7 计算机科学(68至XX) 1 运筹学、数学规划(90-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文