Investigating Table-to-Text Generation Capabilities of Large Language Models in Real-World Information Seeking Scenarios

Yilun Zhao; Haowei Zhang; Shengyun Si; Linyong Nan; Xiangru Tang; Arman Cohan

doi:10.18653/v1/2023.emnlp-industry.17

现实世界信息搜索场景中大型语言模型的表到文本生成能力研究

摘要

表格数据在各个行业中普遍存在，用户需要花费大量时间和精力来理解和处理这些数据，以实现其信息搜索目的。大型语言模型（LLM）的进步显示出巨大的潜力，可以提高用户效率。然而，LLM在实际应用中用于表格信息查找的应用仍然没有得到充分的探索。在本文中，我们使用四个数据集在两个真实世界的信息搜索场景中研究了不同LLM的表到文本功能。其中包括用于数据洞察生成的LogicNLG和我们新构建的LoTNLG数据集，以及用于基于查询生成的FeTaQA和我们新构造的F2WTQ数据集。我们围绕三个研究问题展开调查，分别评估LLM在表到文本生成、自动评估和反馈生成方面的性能。实验结果表明，当前高性能的LLM，特别是GPT-4，可以有效地充当表到文本生成器、评估器和反馈生成器，促进用户在真实场景中的信息搜索目的。然而，其他开源LLM（例如，Vicuna和LLaMA-2）与GPT-4模型之间仍存在显著的性能差距。我们的数据和代码可在以下网址公开获取：https://github.com/yale-nlp/LLM-T2T。

选集ID：: 2023.emnlp行业17
体积：: 2023年自然语言处理实证方法会议记录：行业跟踪
月份：: 十二月
年份：: 2023
地址：: 新加坡
编辑：: 王明轩,伊梅德·齐图尼
地点：: EMNLP公司
SIG公司：
出版商：: 计算语言学协会
注：
页：: 160–175
语言：
网址：: https://aclantology.org/2023.emnlp-industry.17
内政部：: 10.18653/v1/2023.emnlp行业17
比比键：
引用（ACL）：: 赵一伦、张浩伟、司胜云、南林勇、唐祥如、阿曼·科汉。2023研究真实世界信息搜索场景中大型语言模型的表到文本生成能力.英寸2023年自然语言处理实证方法会议记录：行业跟踪，第160–175页，新加坡。计算语言学协会。
引用（非正式）：: 现实世界信息搜索场景中大型语言模型的表到文本生成能力研究（Zhao等人，EMNLP 2023）
复制引文：
PDF格式：: https://aclantology.org/2023.emnlp-industry.17.pdf
视频：: https://aclantology.org/2023.emnlp-industry.17.mp4

PDF格式引用搜索视频