计算机科学>计算与语言
职务: 地面对话的符号规划和代码生成
摘要: 大型语言模型(LLM)擅长处理和生成文本和代码。 然而,LLM在扎根的任务导向对话中的适用性有限,因为它们很难朝着任务目标前进,并且无法处理新的扎根。 我们提出了一个模块化、可解释的固定对话系统,该系统通过使用符号规划器和固定代码执行来组合LLM来解决这些缺点。 我们的系统由阅读器和计划器组成:阅读器利用LLM将合作伙伴的语句转换为可执行代码,调用执行基础的函数。 翻译后的代码输出被存储以跟踪对话状态,而符号规划器确定下一个适当的响应。 我们评估了系统在要求很高的OneCommon对话任务中的性能,包括对分散点的抽象图像进行协作参考分辨率。 我们的系统大大超过了以前的先进技术,包括在最具挑战性的环境中,人工评估的任务成功率从56%提高到69%。