×

基于局部-全局邻域信息的不完全混合数据驱动离群点检测。 (英语) Zbl 07831767号

概要:异常检测是识别意外模式、错误和行为的关键任务;因此,最大限度地从无处不在、不完整、冗余、噪声和混合数据中获取有价值的信息是一个巨大的挑战。为了实现高效的基于图形的离群点检测,我们增强了相似对象之间的连通性,削弱了异构对象之间的连接。本文提出的网络结构称为“未完成本地和叶状的n个邻里关系信息(ILGNI)网络。“在该网络中,可以从两个方面利用不完全混合数据;单属性局部信息和多属性全局信息。具体来说,我们最初使用无监督属性约简方法来提高数据质量。然后,从局部和全局信息的角度,利用对象的相似性水平设计强邻域和弱相似关系来处理不完整数据。在此基础上,可以实现大量细粒度邻域信息网络的拓扑重构。最后,考虑ILGNI网络上马尔可夫随机游走模型的平稳分布,计算了离群值得分。在四个真实电信欺诈数据集上的实验表明,该算法可以在较低的时间复杂度下实现增强的离群值检测性能。此外,该方法可以有效地挖掘从不完整数据中获得的信息,对特征相关和特征相关数据集具有很高的适用性。

MSC公司:

68年XX月 计算机科学
90倍X 运筹学、数学规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 胡晓霞。;陈,H.C。;Liu,S.X。;姜浩。;Chu,G.H。;Li,R.,BTG:电信欺诈检测中图形机器学习的桥梁,《未来一代》。计算。系统。,137, 274-287 (2022)
[2] 王伟平。;郭建杰。;王,Z。;Wang,H。;Cheng,J。;Wang,C.Y。;袁,M.M。;库尔斯,J。;罗,X。;高毅,基于深度强化学习的工业控制网络异常流量检测,应用。数学。计算。,409,第126379条pp.(2021)
[3] Shehnepoor,S。;Salehi,M。;法拉巴赫什,R。;Crespi,N.,NetSpam:在线社交媒体评论的基于网络的垃圾邮件检测框架,IEEE Trans。Inf.法医安全。,12, 7, 1585-1595 (2017)
[4] Djenouri,Y。;Belhadi,A。;Lin,J.C。;Djenouri,D。;Cano,A.,《城市交通异常检测算法调查》,IEEE Access,712192-12205(2019)
[5] 尚德,B。;Kumaravelan,G.,《无线传感器网络的离群检测策略:一项调查》,J.King Saud Univ,Compute。信息科学。,6 (2021)
[6] 施密德尔,S。;Wenig,P。;Papenbrock,T.,《时间序列中的异常检测:综合评估》,VLDB J.,15,9,1779-1797(2022)
[7] 李·T。;寇,G。;彭,Y。;Shi,Y.,《自适应超球分类:基于竞争学习的增量分类器》,IEEE Trans。系统。人类网络。系统。,50, 4, 1218-1229 (2020)
[8] Papadopoulos,A.A。;Rajati,M.R。;谢赫,N。;Wang,J.M.,分布外检测的置信控制异常暴露,神经计算,441,21,138-150(2021)
[9] Djenouri,Y。;Djenouri,D。;Lin,J.C.,《轨迹异常值检测:智能城市的新问题和解决方案》,ACM Trans。知识。发现。,15, 2 (2021)
[10] Degirmenci,A。;Karal,O.,《数据流中基于密度和聚类的高效增量异常值检测》,《信息科学》。,607, 901-920 (2022)
[11] 李·T。;寇,G。;彭,Y。;Yu,P.S.,《金融数据的集成集群检测、优化和解释方法》,IEEE Trans。赛博。,2021年12月52日
[12] Yang,J.W。;Rahardja,S。;Franti,P.,Mean-shift离群值检测和过滤,模式识别。,115,第107874条pp.(2021)
[13] 寇,G。;Xu,Y。;彭,Y。;沈,F。;陈,Y。;Chang,K。;Kou,S.M.,利用交易数据和两阶段多目标特征选择进行中小企业破产预测,Decis。支持系统。,140,第113429条pp.(2021)
[14] 袁,Z。;张晓云。;Feng,S.,基于邻域信息熵的混合数据驱动离群值检测及其发展措施,专家系统。申请。,112, 243-257 (2018)
[15] 江,F。;Sui,Y.F。;Cao,C.G.,基于信息熵的粗集离群值检测方法,专家系统。申请。,37, 9, 6338-6344 (2010)
[16] Chen,Y.M。;Miao,D.Q。;张海勇,邻域异常值检测,专家系统。申请。,第37页,第12页,第8745-8749页(2010年)
[17] Moonesignhe,H.D.K。;Tan,P.N.,使用随机行走进行离群点检测,(2006年IEEE第18届人工智能工具国际会议(2006年),IEEE),532-539
[18] 王,C。;刘,Z。;高,H。;Fu,Y.,VOS:一种新的使用虚拟图的离群值检测模型,Knowl-基于系统。,185,第104907条pp.(2019)
[19] Wang,Y。;李永平,基于加权邻域信息网络的混合值数据集离群点检测,信息科学。,564, 396-415 (2021)
[20] Li,R。;陈,H.C。;Liu,S.X。;王凯。;王,B。;胡晓霞,TFD-IIS-CRMCB:基于相关关系和最大一致块的不完备信息系统电信欺诈检测,熵,25,1,1-24(2023)
[21] Baraldi,A.N。;Enders,C.K.,《现代缺失数据分析导论》,J.Sch。心理医生。,48, 5-37 (2010)
[22] 钱,W.B。;Shu,W.H.,具有模糊决策的不完备有序信息系统的属性约简,应用。软计算。J.,7,242-253(2018)
[23] Clark,P.G。;高,C。;Grzymala-Busse,J.W。;Mroczek,Teresa,挖掘不完全数据的特征集和广义最大一致块,Inf.Sci。,453, 66-79 (2018) ·Zbl 1440.68204号
[24] Nazabal,A。;Olmos,P.M。;加赫拉马尼,Z。;Valera,I.,使用VAE处理不完整的异构数据,模式识别。,107,第107501条,第(2020)页
[25] 李·T。;寇,G。;Peng,Y.,通过特征工程改进恶意URL检测:线性和非线性空间转换方法,Inf.Sci。,91,第101494条pp.(2020)
[26] 李,Z。;Qu,L。;张,G。;谢楠,基于信息熵的异构数据属性选择,国际通用系统。,50, 5, 548-566 (2021)
[27] Wang,J。;Wei,J.M。;Yang,Z.L。;Wang,S.Q.,最大化独立分类信息的特征选择,IEEE Trans。知识。数据工程,1-14(2016)
[28] 北卡罗来纳州图伊。;Wongthanavasu,S.,《基于信息熵和剥离商集的不一致决策表属性约简》,专家系统。申请。,137, 308-323 (2019)
[29] 陈,Y。;刘凯。;宋,J。;Fujita,H。;杨,X。;Qian,Y.,属性约简的属性组,Inf.Sci。,535,64-80(2020)·Zbl 1459.68204号
[30] Wang,Y.B。;陈晓杰。;Dong,K.,通过局部条件熵进行属性约简,Int.J.Mach。学习。赛博。,10, 3619-3634 (2019)
[31] Wang,C.Z。;黄,Y。;丁,W.P。;曹振华,用模糊粗糙自我信息测度进行属性约简,信息科学。,49, 5, 68-86 (2021) ·兹比尔1474.68367
[32] 袁,Z。;Chen,H.M。;李·T·R。;于,Z。;Sang,B.B。;罗,C.,基于模糊粗糙集的混合数据无监督属性约简,信息科学。,572, 67-87 (2021)
[33] 刘晓凤。;Dai,J.H。;Chen,J.L。;Zhang,C.C.,不完全区间值信息系统中基于模糊α相似关系的属性约简方法,应用。软计算。,109, 1-19 (2021)
[34] Yong,B.X。;Brintrup,A.,《具有不确定性量化的贝叶斯自动编码器:走向可信的异常检测》,专家系统。申请。,209,15,第118196条第(2022)页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。