计算机工程与应用››2024,第60卷››发行(10): 140-147.内政部:10.3778/j.issn.102-83312301-0087

•模式识别和人工智能• 以前的文章   下一篇文章

基于知识增强的自监督表格数据异常检测方法

高晓宇、赵晓勇、王磊  

  1. 北京信息科技大学信息管理学院,北京100192
  • 在线:2024-05-15 出版:2024-05-15

知识增强的自监督表格数据异常检测方法研究

高小玉,赵晓永,王磊  

  1. 北京信息科技大学 信息管理学院,北京 100192

摘要:传统的监督异常检测方法发展迅速。为了减少对标签的依赖,自监督预训练方法被广泛研究,研究表明,额外的内在语义知识嵌入对于表学习至关重要。为了挖掘表格数据中丰富的知识信息,提出了基于知识增强的自监督表格数据异常检测方法(STKE),并进行了以下改进。该数据处理模块将领域知识(语义)和统计数学知识集成到特征构造中。同时,自我监督的预训练(参数学习)提供上下文知识先验,实现表格数据的丰富信息传递。屏蔽机制用于原始数据,通过学习相关的非屏蔽特征来学习屏蔽特征,并预测数据隐层空间中加性高斯噪声的原始值。即使在存在噪声输入的情况下,此策略也可以提升模型。还可以恢复原始特征信息。采用混合注意机制有效提取数据特征之间的关联信息。在六个数据集上的实验结果表明,该方法具有良好的性能。

关键词: 异常检测, 自我监督, 知识增强, 预培训

摘要:传统的监督异常检测方法快速发展,为了减少对标签的依赖,自监督预训练方法得到了广泛的研究,同时研究表明额外的内在语义知识嵌入对于表格学习至关重要。为了挖掘表格数据当中存在的丰富知识信息,提出了一种基于知识增强的自监督表格数据异常检测方(基于知识增强的自监督表格数据异常检测方法,STKE)并进行了改进。提出的数据处理模块将领域知识语义)、统计数学知识融入到特征构建中,同时自监督预训练参数学习)提供上下文知识先验,实现表格数据的丰富信息迁移。在原始数据上采用面具机制,通过学习相关的非遮掩特征来学习遮掩特征,同时预测在数据隐层空间加性高斯噪声的原始值。该策略促使模型即使在有噪声输入的情况下也能恢复原始的特征信息。使用混合注意机制有效提取数据特征之间的关联信息。在6个数据集上的实验结果展现了提出的方法优越的性能。

关键词: 异常检测, 自监督, 知识增强, 预训练