地面对话的符号规划和代码生成

贾斯汀·邱,赵文婷,德里克·陈,索哈斯·瓦杜古鲁,亚历山大·拉什,弗里德


摘要
大型语言模型(LLM)擅长处理和生成文本和代码。然而,LLM在扎根的任务导向对话中的适用性有限,因为它们很难朝着任务目标前进,并且无法处理新的扎根。我们提出了一个模块化和可解释的基础对话系统,该系统通过使用符号规划器和基础代码执行来组成LLM来解决这些缺点。我们的系统由阅读器和计划器组成:阅读器利用LLM将合作伙伴的语句转换为可执行代码,调用执行基础的函数。翻译后的代码输出被存储以跟踪对话状态,而符号规划器确定下一个适当的响应。我们评估了系统在要求很高的OneCommon对话任务中的性能,包括对分散点的抽象图像进行协作参考分辨率。我们的系统大大超过了以前的先进技术,包括在最具挑战性的环境中,人工评估的任务成功率从56%提高到69%。
选集ID:
2023.emnlp-main.460年
体积:
2023年自然语言处理实证方法会议记录
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
Houda Bouamor公司,胡安·皮诺,卡利卡-巴厘岛
地点:
EMNLP公司
SIG公司:
出版商:
计算语言学协会
注:
页:
7426–7436
语言:
网址:
https://aclantology.org/2023.emnlp-main.460
内政部:
10.18653/v1/2023.emnlp-main.460
比比键:
引用(ACL):
赵文婷(Justin Chiu)、赵文廷(Wenting Zhao)、陈德雷(Derek Chen)、瓦杜古鲁(Saujas Vaduguru)、亚历山大·拉什(Alexander Rush)和丹尼尔·弗里德(Daniel Fried)。2023地面对话的符号规划和代码生成.英寸2023年自然语言处理实证方法会议记录,第7426–7436页,新加坡。计算语言学协会。
引用(非正式):
地面对话的符号规划和代码生成(Chiu等人,EMNLP 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.emnlp-main.460.pdf
视频:
 https://aclantology.org/2023.emnlp-main.460.mp4网址