判决-BERT swMATH ID: 45148 软件作者: 尼尔斯·雷默斯(Nils Reimers)、艾丽娜·古列维奇(Iryna Gurevych) 描述: 句子-BERT:使用暹罗BERT-Networks进行句子嵌入。BERT(Devlin等人,2018年)和RoBERTa(Liu等人,2019年)在语义文本相似性(STS)等句子对回归任务上建立了最新的性能。然而,它需要将两个句子都输入网络,这会导致巨大的计算开销:在10000个句子集合中找到最相似的一对需要大约5000万次BERT推理计算(65小时)。BERT的构造使其不适合于语义相似性搜索以及聚类等无监督任务。在本出版物中,我们提出了句子BERT(SBERT),对预处理BERT网络进行了修改,使用连词和三元组网络结构导出语义有意义的句子嵌入,可以使用余弦相似性进行比较。这样,在保持BERT精度的同时,从BERT/RoBERTa的65小时到SBERT的约5秒,可以减少查找最相似对的工作量。我们在常见的STS任务和转移学习任务中评估了SBERT和SRoBERTa,其中它优于其他最先进的句子嵌入方法。 主页: https://arxiv.org/abs/1908.10084 源代码: https://github.com/UKPAb/sentence-transformers网站 相关软件: SBERT公司;BERT(误码率);罗伯塔;单词2vec;手套;张紧器2传感器;亚当;捷运局;BLEU公司;变压器;AlexNet公司;SimCLR(模拟清除);图像网络;GitHub公司;艾伯特;LSTM公司;迪蒂尔伯特;蟒蛇;BERTS核心;胭脂 引用于: 15文件 全部的 前5名66位作者引用 1 蒂莫西·鲍德温 1 冰心(Bing,Xin) 1 布尼亚,佛罗伦萨 1 Gyusam Chang公司 1 Cruz,Meenalosini病毒 1 董宜超 1 D'yakonov,A.G。 1 贝蒂娜·法辛加 1 安德烈亚·加拉西 1 高,王 1 A.V.格拉兹科娃。 1 杰里米·戈德瓦瑟 1 布里兰·希塔吉 1 金·桑皮尔 1 金,Sungjune 1 法伊里·库托 1 哈兰·克鲁姆霍尔茨。 1 刘杰翰 1 李钟武 1 Lee,Jung-Tae先生 1 李艾琳 1 李娟如 1 李一新 1 刘刚 1 吕云龙 1 马思奇 1 莫罗佐夫,D.A。 1 阿努帕马·南布鲁 1 穆罕默德·雅武兹(Muhammed Yavuz) 1 萨姆·奥雷 1 P.、Mangarlaj 1 杰西卡·潘 1 公园,霍根 1 Jan Wira Gotama,普特拉 1 梅纳·奎梅纳 1 南达·库马尔(Nandha Kumar) 1 Dragomir R.拉德夫。 1 卢武铉 1 本杰明·罗桑德 1 S.、Sudhakar Ilango 1 锡比·查卡拉瓦尔西·塞图拉曼 1 Natarajan Shankar 1 阿米纳特·绍桑 1 沈洁 1 Shtykov,P.D.博士。 1 大Neung Sohn 1 塞斯·斯特里马斯·马基 1 孙启斌 1 R.安德鲁·泰勒 1 西蒙·特乌费尔 1 Tokunaga、Takenobu 1 保罗·托罗尼 1 Tripathy,贾汀·卡提克 1 Ivor Wai-Hung曾 1 维玛、尼哈 1 维贾亚库马尔(Vijayakumar,Vaidehi) 1 阿佩利·武奥里宁 1 王静 1 王凯 1 马丁·韦坎普(Marten H.Wegkamp)。 1 Wong,Wai Pan先生 1 邢博文 1 严志正 1 是的,埃里克 1 Yun、Seongjun 1 张,Matthew S。 全部的 前5名10篇连载文章中引用 2 人工智能研究杂志 2 计算机科学评论 1 人工智能 1 统计年鉴 1 信息科学 1 排队系统 1 AI通信 1 机器学习 1 洛巴切夫斯基数学杂志 1 Prikladnaya Diskretnaya Matematika公司 在4个字段中引用 12 计算机科学(68至XX) 三 运筹学、数学规划(90-XX) 2 统计学(62-XX) 1 数理逻辑与基础(03-XX) 按年份列出的引文