当前的LLM摘要系统生成广泛的概述,与人们特定的兴趣和期望无关。基本上,人们的偏好(主题)可以通过语义关键字的集合来表达。以前的工作利用这些关键字作为额外的输入来生成摘要。这需要额外的人工注释。为了解决这些约束,我们提出了一个新的框架,基于主题知识的受控生成(TKCG),通过从源文档中自动提取的一组主题关键字来控制生成的摘要。首先,由于大型语言模型(LLM)受上下文窗口长度的限制,我们需要根据文档格式将文档拆分为小部分,如章节,因为一个章节是语义完整的部分。其次,我们使用基于变换器的模型从源文档中提取一些主题关键词。这些主题关键字用于检索与主题相关的章节。然后,我们将主题关键字和章节的组合作为提示输入到LLM中,以获得条件摘要。我们还证明了TKCG在两个标准数据集MACSum和arXiv上的有效性。
我们使用cookie为您提供最佳体验。它们还允许我们分析用户行为,以便不断为您改进网站。关于隐私政策IOS出版社。
我们使用cookie为您提供最佳体验。它们还允许我们分析用户行为,以便为您不断改进网站。关于隐私政策IOS出版社。