Training Generative Question-Answering on Synthetic Data Obtained from an Instruct-tuned Model

Takahashi, Kosuke; Omi, Takahiro; Arima, Kosuke; Ishigaki, Tatsuya

计算机科学>计算与语言

arXiv:2310.08072（cs）

【于2023年10月12日提交(第1版)，上次修订日期：2023年10月13日（此版本，v2）]

标题：训练生成性问题——对从指导-调整模型中获得的合成数据的回答

作者：高桥浩佑,奥米·高弘,Kosuke Arima公司,石垣达也

查看PDF

摘要：本文提出了一种简单且经济高效的数据合成方法，用于训练问答系统。对于培训，微调GPT模型是英语等资源丰富的语言中的常见做法，然而，由于缺乏足够的问答（QA）对，这对非英语语言来说是一个挑战。现有的方法使用经过人工编写的QA对训练的问答生成器，这涉及大量的人力成本。相反，我们使用指令调整模型以零快照或少快照的方式生成QA对。我们通过实验比较了从指令调谐模型中获取QA对的各种策略。结果表明，基于我们提出的合成数据训练的模型与基于手动整理数据集训练的模型相比，性能相当，而不会产生人力成本。

评论：	PACLIC 2023短文，4页（6页，包括参考文献），4张图
学科：	计算与语言（cs.CL）
移动交换中心类：	68T50型
引用为：	arXiv:2310.08072【cs.CL】
	（或 arXiv:2310.08072v2【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2310.08072

提交历史记录

发件人：Kosuke Takahashi[查看电子邮件]
[第1版]2023年10月12日星期四06:46:07 UTC（7112 KB）
[版本2]2023年10月13日星期五00:40:29 UTC（7112 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。氯

<上一版本 | 下一个>

新的 | 最近的 |2023-10

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

标题：训练生成性问题——对从指导-调整模型中获得的合成数据的回答

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：训练生成性问题——对从指导-调整模型中获得的合成数据的回答

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目