×

流特征的局部因果结构学习。 (英语) Zbl 07735621号

摘要:局部因果结构学习(LCSL)是在不学习全局因果结构的情况下,发现并区分给定目标变量(T)的直接原因(父母)和直接影响(孩子)的过程。然而,最先进的LCSL算法只能处理静态特征空间,而忽略了具有流特征的特征空间的动态变化。对于高维数据,现有方法无法有效区分特征和目标变量之间的因果关系。为了解决这些问题,我们建议L(左)局部C类澳大利亚S公司结构L(左)收入S公司流式处理F类特征(\(\mathrm{LCSL_{SF}}\))\(\mathrm{LCSL{SF}})包含两个连续步骤,因为它首先动态挖掘因果特征,以构建目标变量的近似马尔可夫覆盖(aMB)。它通过过滤无关和冗余的特征,尽可能地保留流特征中的因果特征。其次,它通过从目标变量的aMB中批量挖掘和拼接特征节点的V结构来学习局部因果结构。在变量数量在20到724之间的基准贝叶斯网络上,\(\mathrm{LCSL_{SF}})的性能明显优于其竞争对手。我们通过对医学诊断中的因果发现进行真实案例研究来证明其有效性。代码发布时间https://github.com/youdianlong/LCSLSF.

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H22个 概率图形模型

软件:

TETRAD公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Yu,K。;郭,X。;刘,L。;李,J。;Wang,H。;Ling,Z。;Wu,X.,基于因果关系的特征选择:方法和评估,ACM计算。调查。,53, 5, 1-36 (2020)
[2] 元音,M.J。;北卡罗来纳州卡姆戈兹。;波登,R,你喜欢dags吗?关于结构学习和因果发现的调查,ACM Comput。调查。,55, 4, 1-36 (2021)
[3] Yu,K。;刘,L。;李,J.,因果和非因果特征选择的统一观点,ACM Trans。知识。发现。数据,15,4,1-46(2021年)
[4] 郭,R。;Cheng,L。;李,J。;哈恩,P.R。;Liu,H.,用数据学习因果关系的调查:问题和方法,ACM计算。调查。,53, 4, 1-37 (2020)
[5] Schölkopf,B。;Locatello,F。;Bauer,S。;Ke,N.R。;Kalchbrenner,N。;戈亚尔,A。;Bengio,Y.,《走向因果表征学习》,Proc。IEEE,109,5,612-634(2021)
[6] 沈,X。;马,S。;Vemuri,P。;Simon,G.,因果发现算法的挑战和机遇:阿尔茨海默病病理生理学应用,科学。代表,10,1,1-12(2020年)
[7] 东北部芬顿。;McLachlan,S。;卢卡斯,P。;Dube,K。;希特曼,G.A。;奥斯曼,M。;Kyrimi,E。;Neil,M.,用于个性化COVID19风险评估和联系人追踪的贝叶斯网络模型,MedRxiv(2021),2020-2007
[8] Badsha,M。;Fu,A.Q.,用孟德尔随机化原理学习因果生物网络,Front。遗传学。,1460(2019)
[9] 巴布尔,Ö。;Luna,A。;Korkut,A。;杜鲁皮纳,F。;Siper,M.C。;Dogrusoz,美国。;Jacome,A.S.V。;佩克纳,R。;Christianson,K.E。;Jaffe,J.D.,《来自蛋白质组剖面的因果相互作用:分子数据满足路径知识》,模式,2,6,100-257(2021)
[10] 科勒,D。;Friedman,N.,《概率图形模型:原理与技术》(2009),麻省理工学院出版社·Zbl 1183.68483号
[11] Suchetha,N.K。;Nikhil,A。;Hrudya,P.,《比较Twitter情感分类上的包装器特征选择评估器》,(第二届数据科学计算智能国际会议,2019年2月21日至2019年1月23日,ICCIDS 2019年-第二届国际数据科学计算智慧会议,论文集(2019),IEEE,电气与电子工程师协会),1-6
[12] 王,X。;Ren,H。;Guo,X.,一种用于贝叶斯网络结构学习的新型离散萤火虫算法,Knowl-基于系统。,242, 108-426 (2022)
[13] 沙马尔迪诺斯一世。;Brown,L.E。;Aliferis,C.F.,最大爬山贝叶斯网络结构学习算法,马赫。学习。,65, 31-78 (2006) ·Zbl 1470.68192号
[14] Margaritis,D。;Thrun,S.,通过本地社区进行贝叶斯网络归纳,高级神经信息处理。系统。,12, 505-511 (2000)
[15] 郑,X。;Aragam,B。;拉维库马尔,P。;Xing,E.P.,《没有眼泪的Dags:结构学习的持续优化》,《高级神经信息处理》。系统。,2018年12月,9472-9483(2018)
[16] Wang,Y。;曹,F。;Yu,K。;Liang,J.,多个操纵数据集的局部因果发现,IEEE Trans。神经网络。学习。系统。,1-13 (2022)
[17] Yu,X。;Lam,W.,通过结构化变分近似将逻辑和学习结合起来的概率联合模型用于信息提取,Knowl。信息系统。,32, 2, 415-444 (2012)
[18] 尹,J。;周,Y。;王,C。;何,P。;郑,C。;Geng,Z.,预测因果网络的部分定向和局部结构学习,(因果和预测挑战,PMLR(2008)),93-105
[19] 王,C。;周,Y。;赵(Q.Zhao)。;Geng,Z.,通过顺序局部学习方法发现和定向与数据集中目标变量相连的边,Compute。统计数据分析。,77, 252-266 (2014) ·Zbl 1506.62184号
[20] 高,T。;Ji,Q.,直接因果的局部因果发现,(第28届神经信息处理系统国际会议论文集,第2卷)。《第28届神经信息处理系统国际会议论文集》,第2卷,NIPS’15(2015),麻省理工学院出版社:麻省剑桥,美国),2512-2520
[21] Yang,S。;Wang,H。;Yu,K。;曹,F。;Wu,X.,《迈向高效的局部因果结构学习》,IEEE Trans。大数据,8,61592-1609(2021)
[22] Ling,Z。;Yu,K。;Wang,H。;李,L。;Wu,X.,使用特征选择进行局部因果结构学习,IEEE Trans。Emerg.顶部。计算。智力。,5, 4, 530-540 (2021)
[23] Lv,Y。;Lin,Y。;陈,X。;王,D。;Wang,C.,基于特征交互的在线流媒体特征选择,(2020年IEEE知识图国际会议(ICKG)(2020),IEEE),49-57
[24] Yu,K。;吴,X。;郝伟(Hao,W.)。;Wei,D.,从流特征中发现因果关系,(2010年IEEE国际数据挖掘会议(2010)),1163-1168
[25] 吴,X。;Yu,K。;丁·W。;Wang,H。;Zhu,X.,带流媒体功能的在线功能选择,IEEE Trans。模式分析。机器。智力。,35, 5, 1178-1192 (2013)
[26] 你,D。;李,R。;Liang,S。;孙,M。;欧,X。;袁,F。;沈,L。;Wu,X.,流媒体功能的在线因果特征选择,IEEE Trans。神经网络。学习。系统。,34, 3, 1563-1577 (2023)
[27] Yu,K。;吴,X。;丁·W。;Pei,J.,《大数据的可扩展和准确在线特征选择》,ACM Trans。知识。发现。数据,11,2,1-39(2016)
[28] 蔡,J。;罗,J。;王,S。;Yang,S.,《机器学习中的特征选择:一个新的视角》,神经计算,300,5,70-79(2018)
[29] 吴,X。;Xu,X。;刘杰。;Wang,H。;胡,B。;Nie,F.,《利用正交回归和特征加权进行监督特征选择》,IEEE Trans。神经网络。学习。系统。,32, 5, 1831-1838 (2020)
[30] 杨,J。;沈,A。;Yu,K。;Chen,Y.,使用基于最大相关最小冗余的特征选择预测肺结节的语义特征,(2019年IEEE生物信息学和生物医学国际会议(2019),IEEE),1318-1323
[31] Yu,K。;刘,L。;李,J。;丁·W。;Le,T.D.,多源因果特征选择,IEEE Trans。模式分析。机器。智力。,42, 9, 2240-2256 (2020)
[32] 沙马尔迪诺斯一世。;Aliferis,C.F.,《走向原则性特征选择:相关性、过滤器和包装器》,(人工智能和统计国际研讨会,人工智能和统计学国际研讨会,PMLR(2003)),300-307
[33] Aliferis,C.F。;沙马尔迪诺斯一世。;Statnikov,A.,Hiton:用于最优变量选择的新型马尔可夫覆盖算法,AMIA Annual Symp。程序。,2003, 21-25 (2003)
[34] Wang,H。;Ling,Z。;Yu,K。;Wu,X.,面向高效和有效地发现用于特征选择的马尔可夫覆盖层,信息科学。,509, 227-242 (2020)
[35] Ling,Z。;Yu,K。;Wang,H。;刘,L。;丁·W。;Wu,X.,BAMB:特征选择的平衡马尔可夫毯式发现方法,ACM Trans。智力。系统。技术。,10, 5, 1-25 (2019)
[36] 吴博士。;何毅。;罗,X。;Zhou,M.,基于潜在因素分析的在线稀疏流特征选择方法,IEEE Trans。系统。人类网络。系统。,52, 11, 6744-6758 (2021)
[37] 周,P。;Wang,N。;赵,S.,考虑特征交互的在线群组流特征选择,Knowl-基于系统。,226, 107-157 (2021)
[38] Scanagatta,M。;Salmerón,A。;Stella,F.,《从数据中学习贝叶斯网络结构的调查》,Prog。Artif公司。智力。,8, 4, 425-439 (2019)
[39] 姜瑜。;Liang,Z。;高,H。;郭毅。;钟,Z。;杨,C。;Liu,J.,一种使用高斯核概率密度估计器的改进的基于约束的贝叶斯网络学习方法,专家系统。申请。,113, 544-554 (2018)
[40] 巴塔查里亚,R。;Nagarajan,T。;马林斯基,D。;Shpitser,I.,《未测量混杂下的差异因果发现》,(国际人工智能和统计会议,国际人工智能与统计会议,PMLR(2021)),2314-2322
[41] Niinimaki,T。;Parviainen,P.,贝叶斯网络中的局部结构发现,(《第二十八届人工智能不确定性会议论文集》,第二十八届人造智能不确定性大会论文集,美国加利福尼亚州卡塔琳娜岛,2012年8月14日至18日),634-643
[42] 沙马尔迪诺斯一世。;Aliferis,C.C.F。;Statnikov,A.A.,《马尔可夫覆盖层和直接因果关系的时间和样本高效发现》,(第九届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第九届AC M SIGKDD国际知识发现与数据挖掘会议文献集,KDD-2003(2003)),673-678
[43] 高,T。;Fadnis,K.P。;Campbell,M.,局部到全局贝叶斯网络结构学习,(第34届机器学习国际会议论文集。第34届国际机器学习会议论文集,澳大利亚新南威尔士州悉尼市ICML,2017年8月6-11日),1193-1202
[44] 郑,X。;Aragam,B。;拉维库马尔,P。;Xing,E.P.,Dags with no earth:continuous optimization for structure learning,(第32届神经信息处理系统会议,2018年12月2日-2018年12月8日)。第32届神经信息处理系统会议,NeurIPS 2018,2018年12月2日-2018年12月8日,神经信息处理体系进展,神经信息系统基金会,第2018-12月(2018)卷),9472-9483
[45] 张,M。;江,S。;崔,Z。;加内特,R。;Chen D-vae,Y.,有向无环图的变分自动编码器,(第33届神经信息处理系统年会。第33届神经元信息处理系统年度会议,2019年12月8日至2019年十二月14日,NeurIPS 2019。第33届神经信息处理系统年会。第三十三届神经信息处理系统年会,2019年12月8日至2019年11月14日,NeurIPS 2019,神经信息处理体系进展,神经信息系统基金会,第32卷(2019年),1586-1598
[46] 西尔弗斯坦·克雷格;谢尔盖,布林;莫特瓦尼·拉吉耶夫;Jeff Ullman,《挖掘因果结构的可伸缩技术》,Data Min.Knowl。发现。,4, 2, 163-192 (2000)
[47] Pearl,J.,《智能系统中的概率推理:合理推理网络》,摩根-考夫曼表示与推理系列(1988)
[48] Spirtes,P。;Glymour,C。;Scheines,R.,因果、预测和搜索,第83卷(2000),麻省理工出版社·Zbl 0806.62001
[49] 盖恩,I。;Satnikov,A。;Aliferis,C.,《利用因果关系工作台进行时间序列分析》,(NIPS时间序列因果关系迷你峰会,NIPS时间系列因果关系迷你研讨会,PMLR(2011)),115-139
[50] 盖恩,I。;Gunn,S。;Hur,A.B。;Dror,G.,《Nips2003挑战的设计与分析》,第207卷,237-263(2006),施普林格-柏林-海德堡出版社
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。