计算机科学››2024,第51卷››问题(5): 258-266.数字对象标识:10.11896/jsjkx.230300007
•人工智能• 以前的文章 下一篇文章
刘军、阮彤、张欢欢
收到:
修订过的:
在线:
出版:
关于作者:
支持单位:
摘要:任务型对话系统中对话理解模块的目标是将用户的自然语言输入转换为结构化形式。然而,在面向诊断的医学对话系统中,现有的方法面临以下问题:1)信息的粒度不能完全满足诊断的需要,例如提供症状的严重程度;2) 很难同时满足医学领域中时隙值的各种表示,例如可能包含非连续嵌套实体的“症状”和可能包含类别值的“否定”。本文提出了一种基于即时学习的生成性医学对话理解方法。为了解决问题1),本文将当前对话理解任务中的单层槽结构替换为多层槽结构来表示细粒度信息,然后提出了一种基于对话式提示的生成方法,它使用提示标记来模拟医生和患者之间的对话,并从多轮交互中获取多级信息。为了解决问题2),本文提出在推理过程中使用受限解码策略,以便该模型能够统一处理提取和分类时隙的意图检测和时隙填充任务,避免复杂的建模。此外,为了解决医学领域中缺少标记数据的问题,本文提出了一种两阶段训练策略,以利用大规模未标记医学对话语料库来提高性能。本文针对包含多级时隙结构的医学对话理解任务,注释并发布了一个包含4722个对话的数据集,其中包含17个意图和74种时隙类型。实验表明,该方法能够有效地解析医学对话中的各种复杂实体,与现有的生成方法相比,性能提高了2.18%。在数据较少的情况下,两阶段训练可以将模型的性能提高5.23%。
关键词: 及时学习, 自然语言理解, 医疗对话系统, 生成模型, 两阶段培训
CLC编号:
刘军、阮彤、张欢欢。基于快速学习的医学对话理解生成方法[J]。计算机科学,2024,51(5):258-266。
0 / / 推荐
添加到引文管理器 尾注|样板客户经理|ProCite公司|BibTeX公司|参考Works
网址: https://www.jsjkx.com/EN/10.11896/jsjkx-230300007
https://www.jsjkx.com/EN/Y2024/V51/I5/258
引用