On Uncertainty Calibration and Selective Generation in Probabilistic Neural Summarization: A Benchmark Study

Zablotskaia, Polina; Phan, Du; Maynez, Joshua; Narayan, Shashi; Ren, Jie; Liu, Jeremiah

计算机科学>计算与语言

arXiv公司：2304.08653（个）

【于2023年4月17日提交】

标题：概率神经总结中的不确定性校准和选择性生成：一项基准研究

作者：波琳娜·扎博茨卡亚,杜潘,约书亚·梅内斯,沙希·纳拉扬,杰仁,耶利米亚·刘

查看PDF

摘要：用于摘要的现代深度模型获得了令人印象深刻的基准性能，但它们容易产生错误校准的预测不确定性。这意味着他们将高置信度分配给低质量的预测，从而导致实际应用中的可靠性和可信度受损。概率深度学习方法是解决校准错误问题的常用方法。然而，它们在复杂的自回归摘要任务中的相对有效性还没有得到很好的理解。在这项工作中，我们深入研究了不同最先进的概率方法在不同难度的三个大规模基准测试中提高神经摘要模型不确定性质量的有效性。我们表明，概率方法持续改进了模型的生成和不确定性质量，从而在实践中提高了选择性生成性能（即避免低质量摘要）。我们还揭示了NLP社区广泛采用的概率方法的显著失效模式（例如，深度集成和蒙特卡罗辍学），提醒人们为数据设置选择合适方法的重要性。

学科：	计算与语言（cs.CL）; 机器学习（cs.LG）
引用为：	arXiv公司：2304.08653【cs.CL】
	（或 arXiv公司：2304.08653v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2304.08653

提交历史记录

发件人：Polina Zablotskia[查看电子邮件]
[第1版]2023年4月17日星期一23:06:28 UTC（1508 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。氯

<上一版本 | 下一个>

新的 | 最近的 |2023-04

更改为浏览方式：

反恐精英
反恐精英。LG公司

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

标题：概率神经总结中的不确定性校准和选择性生成：一项基准研究

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：概率神经总结中的不确定性校准和选择性生成：一项基准研究

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目