KGLens: A Parameterized Knowledge Graph Solution to Assess What an LLM Does and Doesn't Know

Zheng, Shangshang; Bai, He; Zhang, Yizhe; Su, Yi; Niu, Xiaochuan; Jaitly, Navdeep

计算机科学>人工智能

arXiv:2312.11539（个）

【于2023年12月15日提交(第1版)，上次修订日期：2024年2月16日（本版本，v2）]

标题：KGLens：一种参数化知识图解决方案，用于评估LLM知道什么和不知道什么

作者：尚尚正,何白,张一哲,易素,小川牛,纳维德普·贾特利

查看PDF

摘要：测量知识图（KG）和大型语言模型（LLM）之间的对齐是评估LLM真实性和识别其知识盲点的有效方法。然而，这种方法遇到了两个主要挑战，包括将KG翻译成自然语言以及有效评估这些广泛而复杂的结构。在本文中，我们提出了KGLens——一个新的框架，旨在测量KG和LLM之间的一致性，并指出LLM相对于KG的知识缺陷。KGLens具有一个图形引导的问题生成器，用于将KG转换为自然语言，以及一个基于参数化KG结构的精心设计的采样策略，以加快KG遍历。我们使用来自Wikidata的三个特定于域的KG进行了实验，这些KG包含19000多个边、700个关系和21000个实体。我们对八个LLM的分析表明，KGLens不仅可以更快地评估LLM的事实准确性，还可以对主题、时间动态和关系进行深入分析。此外，人类评估结果表明，KGLens能够以与人类注释器几乎相等的准确度评估LLM，达到95.7%的准确率。

学科：	人工智能（cs.AI）; 计算与语言（cs.CL）；机器学习（cs.LG）
引用为：	arXiv:2312.11539[cs.人工智能]
	（或 arXiv:2312.11539v2[cs.人工智能]对于此版本）
	https://doi.org/10.48550/arXiv.2312.11539

提交历史记录

发件人：何白[查看电子邮件]
[第1版]2023年12月15日星期五23:34:05 UTC（8119 KB）
[版本2]2024年2月16日星期五17:41:01 UTC（7628 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。人工智能

<上一版本 | 下一个>

新的 | 最近的 |2023-12

更改为浏览方式：

反恐精英
反恐精英。氯
反恐精英。LG公司

参考文献和引文

导出BibTeX引文

计算机科学>人工智能

标题：KGLens：一种参数化知识图解决方案，用于评估LLM知道什么和不知道什么

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>人工智能

标题：KGLens：一种参数化知识图解决方案，用于评估LLM知道什么和不知道什么

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目