BOND:静态属性图上无监督孤立点检测的基准测试

部分神经信息处理系统进展35(NeurIPS 2022)数据集和基准跟踪

Biptex公司 纸类 补充的

作者

刘凯、窦英桐、赵岳、丁雪莹、胡西阳、张瑞桐、丁凯泽、陈灿宇、郝鹏、舒凯、孙立超、李俊东、陈乔治、贾志浩、俞飞利浦

摘要

检测图中的哪些节点是离群值是一项相对较新的机器学习任务,有许多应用。尽管近年来为这项任务开发了大量算法,但还没有针对性能评估的标准综合设置。因此,很难理解哪些方法在广泛的环境下工作良好。为了弥补这一差距,据我们所知,我们提出了第一个在静态属性图上进行无监督异常节点检测的综合基准,称为BOND,重点如下。(1) 我们对从经典矩阵分解到最新图形神经网络的14种方法的异常值检测性能进行了基准测试。(2) 使用九个实际数据集,我们的基准评估了不同的检测方法如何响应两种主要类型的合成异常值,以及如何分别响应“有机”(实际非合成)异常值。(3) 使用现有的随机图生成技术,我们生成了一系列不同图形大小的综合生成数据集,使我们能够比较不同异常检测算法的运行时间和内存使用。基于我们的实验结果,我们讨论了现有图异常值检测算法的优缺点,并强调了未来研究的机会。重要的是,我们的代码是免费的,并且易于扩展:https://github.com/pygod-team/pygod/tree/main/bequinchmark