内政部：10.18653/v1/2020查找-emnlp.428
语料库ID:216867622

TLDR：科学文献的极端总结

@文章{Cachola2020 TLDRES，title={TLDR:科学文献的极端总结}，作者={Isabel Cachola和Kyle Lo以及Arman Cohan和Daniel S.Weld}，日志={ArXiv}，年份={2020年}，体积={abs/2004.15011}，网址={https://api.semanticscholar.org/CorpusID:216867622}}

本文介绍了SCITLDR，一个新的多目标数据集，包含5.4K个TLDR，超过3.2K篇论文，并提出了CATTS，一种简单而有效的学习策略，用于生成TLDR，将标题作为辅助训练信号。

[PDF]语义阅读器

149条引文

极具影响力的引文

19

79

46

4

本文图表

话题

SCITLDR公司 TLDR公司 TalkSumm公司科学文献综述 ScisummNet公司极端总结自动度量人的评价

询问这篇论文
贝塔
AI供电

我们的系统试图限制本文中找到的信息。结果质量可能有所不同。了解更多信息关于我们如何产生这些答案。

反馈？

使用预训练变压器更好地进行铺层总结

Seungwon Kim先生

计算机科学

可持续发展计划

2020

本文提出了一种方法，即使用预训练和提取的间隙句来进行抽象摘要，以生成层摘要，并使用来自变形金刚的双向编码器表示和衡量句子可读性的可读性度量，将这些与提取摘要模型相结合，以进一步提高摘要的可读性提高总结的质量。

MSˆ2：医学研究的多文档综述

杰·德扬伊兹·贝尔塔基马德琳·范·祖伦贝利·奎尔露西·路·王

医学、计算机科学

自然…实证方法会议…

2021

这项工作发布了MSˆ2（医学研究的多文档摘要），这是一个由超过47000份文档和20K份摘要组成的数据集，这些文档和摘要来自科学文献，有助于开发能够评估和聚合多个研究中相互矛盾的证据的系统，是第一个大规模的，生物医学领域中公开可用的多文档摘要数据集。

84

[PDF]（PDF格式）

评论机器人：基于知识合成的可解释论文评论生成

王庆云齐曾黄立福凯文·奈特恒基纳兹尼·拉贾尼

计算机科学

国际自然语言会议…

2020

一个新颖的ReviewRobot可以自动为多个类别（如新颖性和有意义的比较）分配评审分数和写评论，并且可以作为论文审稿人、节目主持人和作者的助手。

31

[PDF]（PDF格式）

生物医学科学评论的非专业语言自动摘要

越国邱伟建王一忠T.科恩

医学、计算机科学

AAAI人工智能会议

2021

对自动生成生物医学科学评论的非专业语言摘要的各种挑战的分析表明，与专家为非专业公众开发的参考文献相比，使用当代神经架构生成的自动生成摘要可以实现有希望的质量和可读性。

46

[PDF]（PDF格式）

使用实时、位置敏感的术语和符号定义扩充科学论文

安德鲁·海德凯尔·洛马蒂·赫斯特

计算机科学

国际人类因素会议…

2021

这项工作介绍了ScholarPhi，这是一个增强的阅读界面，具有四个新颖的功能：工具提示，可显示论文中其他地方的位置敏感定义，对论文进行“整理”的过滤器，以揭示术语或符号在论文中的使用方式，并行显示多个定义的自动方程图，以及自动生成的重要术语和符号的词汇表。

[PDF]（PDF格式）

X-SCITLDR：学术文献的跨语言极端总结

武士太郎托马索·格林尼古拉斯·弗里德里希K.埃克特西蒙·保罗·蓬泽托

计算机科学、语言学

ACM/IEEE数字图书馆联合会议

2022

本文提出了一个针对学术领域四种不同语言的抽象跨语言摘要数据集，它使我们能够训练和评估处理英语论文并生成德语、意大利语、汉语和日语摘要的模型。

[PDF]（PDF格式）

引文摘要：引文文本引导的科学极端总结和有限监督下的领域改编

毛云宁明忠韩嘉伟

计算机科学

自然…实证方法会议…

2022

提出了一种简单而有效的方法，用于从引文文本中自动提取科学论文的TLDR摘要，并创建了一个新的基准CiteSum，该基准CiteSam没有人工注释，比以前的人工管理数据集SciTLDR大约30倍。

[PDF]（PDF格式）

引文摘要：引用文本引导的科学极端总结和低资源领域改编

毛云宁明忠韩嘉伟

计算机科学

arXiv.org网站

2022

提出了一种简单而有效的方法，可以从引文中自动提取科学论文的TLDR摘要，并创建了一个无需人工注释的新基准CiteSum，该基准比以前人工策划的数据集SciTLDR大约30倍。

PaperWeaver：通过将推荐论文与用户收集的论文联系起来，丰富专题论文提醒

Yoonjoo Lee（李允珠）Hyeonsu B Kang公司保香六露

计算机科学

arXiv.org网站

2024

用户研究表明，与呈现推荐论文相关工作部分的基线相比，使用PaperWeaver的参与者能够更好地理解推荐论文的相关性，并更自信地对其进行分类。

高度影响力

[PDF]（PDF格式）

学术文献的跨语言极端摘要

武士太郎托马索·格林尼克拉斯·弗里德里希K.埃克特西蒙·保罗·蓬泽托

计算机科学、语言学

国际数字图书馆杂志

2023

本文探讨了如何使用基于多语言编解码器架构的最新神经抽象摘要模型实现学术文本的跨语言极端摘要，并研究了如何在知识提取方法的基础上使该方法更有效。

科学论文摘要的监督方法

爱德华·科尼什伊莎贝尔·奥根斯坦S.里德尔

计算机科学、生物学

计算自然语言会议…

2017

本文通过利用大量作者提供的摘要资源，介绍了一个新的计算机科学出版物摘要数据集，并利用神经句子编码和传统使用的摘要特征，在该数据集上开发了模型。

88

[PDF]（PDF格式）

结合全局和局部上下文的长文档摘要提取

文晓G.卡列尼尼

计算机科学

自然…实证方法会议…

2019

一种新的针对长文档的神经单文档提取摘要模型，它结合了整个文档的全局上下文和当前主题中的局部上下文，其性能优于以前的工作，包括提取模型和抽象模型。

125

[PDF]（PDF格式）

PEGASUS：用提取的间隙句进行抽象总结的预先训练

张静清（音）姚钊穆罕默德·萨利赫彼得·J·刘

计算机科学

机器学习国际会议

2020

这项工作提出了在大规模文本语料库上用一个新的自我监督目标PEGASUS预训练大型基于Transformer的编码器-解码器模型，并证明它在所有12个下游数据集上都达到了最先进的性能，这些数据集由ROUGE分数衡量。

一种用于长文档摘要的语篇-软件注意模型

阿曼·科汉弗兰克·德农考特纳兹利·戈哈里安

计算机科学

美国…协会北美分会…

2018

这项工作提出了第一个对单个较长形式的文档（如研究论文）进行抽象摘要的模型，该模型由一个新的层次编码器和一个专注的话语感知解码器组成，该编码器对文档的话语结构进行建模，该解码器用于生成摘要。

590

[PDF]（PDF格式）

标题生成：从分解的文档标题中学习

奥列格·瓦西利耶夫汤姆·格雷克约翰·博哈农

计算机科学

arXiv.org网站

2019

提出了一种为非结构化文本文档生成标题的新方法，并给出了一项随机双盲试验的结果，在该试验中，受试者不知道哪些标题是人为或机器生成的。

9

[PDF]（PDF格式）

TalkSumm:一种基于会议讨论的科学论文摘要数据集和可缩放注释方法

盖·列夫Michal Shmueli-Scheuer先生乔纳森·赫齐格阿奇亚·杰比D.科诺普尼基

计算机科学

…协会年会…

2019

本文提出了一种新的方法，通过利用科学会议上的演讲视频自动生成科学论文摘要，并假设此类演讲构成了对论文内容的连贯而简洁的描述，可以构成良好摘要的基础。

49

[PDF]（PDF格式）

不要给我细节，只给我总结！用于极值总结的Topic-ware卷积神经网络

沙希·纳拉扬谢·科恩（Shay B.Cohen）米雷拉·拉帕塔

计算机科学

自然…实证方法会议…

2018

本文提出了一种新的抽象模型，该模型以文章的主题为条件，完全基于卷积神经网络，在自动评估和人工评估时，其性能优于oracle提取系统和最先进的抽象方法。

[PDF]（PDF格式）

使用预先训练的编码器进行文本摘要

杨柳米雷拉·拉帕塔

计算机科学

自然…实证方法会议…

2019

本文介绍了一种基于BERT的新型文档级编码器，该编码器能够表达文档的语义并获得其句子的表示，并提出了一种新的微调时间表，该时间表对编码器和解码器采用不同的优化器，以缓解两者之间的不匹配。

1,209

[PDF]（PDF格式）

数据驱动的科学文章摘要

尼古拉·尼科洛夫迈克尔·菲佛理查德·哈恩洛斯特

生物学、计算机科学

arXiv.org网站

2018

这项工作从科学论文中生成了两个新的多内容摘要数据集，并测试了大量现有的基于提取和抽象神经网络的摘要方法的适用性，证明科学论文适合于数据驱动的文本摘要。

39

[PDF]（PDF格式）

BART：用于自然语言生成、翻译和理解的去噪序列对序列预训练

M.刘易斯刘银汉（音）卢克·泽特莫耶

计算机科学、语言学

…协会年会…

2020

BART是一种用于序列到序列模型预处理的去噪自动编码器，它与RoBERTa在GLUE和SQuAD上的性能相匹配，并在一系列抽象对话、问答和摘要任务上取得了最新的最新结果。

[PDF]（PDF格式）