Graph Neural Prompting with Large Language Models

Tian, Yijun; Song, Huan; Wang, Zichen; Wang, Haozhu; Hu, Ziqing; Wang, Fang; Chawla, Nitesh V.; Xu, Panpan

计算机科学>计算与语言

arXiv:2309.15427（cs）

【2023年9月27日提交(第1版)，上次修订日期：2023年12月28日（本版本，v2）]

标题：大型语言模型的图神经提示

作者：田一军（音）,欢松,王子晨,王浩珠,胡自清,王芳（Fang Wang）,尼特斯·查拉,徐攀攀

查看PDF HTML（实验性）

摘要：大型语言模型（LLM）在各种语言建模任务中表现出卓越的泛化能力和优异的性能。然而，它们在准确捕获和返回扎根知识方面仍然存在固有的局限性。虽然现有工作已探索利用知识图（KG）通过联合训练和定制模型体系结构来增强语言建模，但将其应用于LLM是有问题的，因为它们具有大量参数和高计算成本。因此，如何利用扎根知识（例如，检索增强生成）来增强预训练LLM仍然是一个悬而未决的问题。在这项工作中，我们提出了图神经提示（GNP），这是一种新的即插即用方法，用于帮助预先训练的LLM从KGs学习有益的知识。GNP包含各种设计，包括标准图形神经网络编码器、交叉模态池模块、域投影仪和自监督链接预测目标。在多个数据集上的大量实验证明了GNP在不同LLM大小和设置的常识和生物医学推理任务上的优势。代码位于此https URL.

评论：	AAAI 2024接受
学科：	计算与语言（cs.CL）; 人工智能；机器学习（cs.LG）
引用为：	arXiv:2309.15427【cs.CL】
	（或 arXiv:2309.15427v2【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2309.15427

提交历史记录

发件人：田一军[查看电子邮件]
[第1版]2023年9月27日星期三06:33:29 UTC（1717 KB）
[版本2]2023年12月28日星期四21:14:01 UTC（1718 KB）

计算机科学>计算与语言

标题：大型语言模型的图神经提示

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：大型语言模型的图神经提示

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目