×

具有周期和潜在变量的结构因果模型的基础。 (英文) Zbl 1486.62176号

摘要:结构因果模型(SCM),也称为(非参数)结构方程模型(SEM),广泛用于因果建模目的。特别是,非循环SCM,也称为递归SEM,形成了SCM的一个经过充分研究的子类,它泛化了因果贝叶斯网络,以允许潜在的混淆。在本文中,我们在更一般的背景下研究SCM,考虑到潜在混杂因素和周期的存在。我们表明,在存在循环的情况下,非循环SCM的许多便利性质一般不成立:它们并不总是有解;它们并不总是诱导独特的观察、干预和反事实分布;边际化并不总是存在的,如果存在,边际模型并不总是尊重潜在投影;它们并不总是满足马尔可夫性质;并且它们的图形并不总是与它们的因果语义一致。我们证明,对于一般的SCMs,这些性质中的每一个在某些可解性条件下都成立。我们的工作概括了迄今为止只有在某些特殊情况下才知道的具有循环的SCMs的结果。我们引入了简单SCM类,它将非循环SCM类扩展到循环设置,同时保留了非循环SCMs的许多方便属性。通过本文,我们旨在为SCM统计因果建模的一般理论提供基础。

MSC公司:

62H22个 概率图形模型
62A09号 统计学中的图形方法
68立方英尺 知识表示
68层37 人工智能背景下的不确定性推理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Balke,A.和Pearl,J.(1994年)。反事实查询的概率评估。第十二届全国人工智能会议记录(AAAI公司-94) 1 230-237. AAAI出版社,门罗公园。
[2] Beckers,S.和Halpern,J.Y.(2019年)。抽象因果模型。第三十三届AAAI人工智能会议记录(AAAI公司-19) 33 2678-2685. AAAI出版社,门罗公园。
[3] Blom,T.、Bongers,S.和Mooij,J.M.(2019年)。超越结构性因果模型:因果约束模型。会议记录35第十届人工智能不确定性会议(阿拉伯联合酋长国-19) (R.P.Adams和V.Gogate编辑)。AUAI出版社。
[4] Bollen,K.A.(1989)。具有潜在变量的结构方程.概率与数理统计中的威利级数:应用概率统计纽约威利·Zbl 0731.62159号 ·doi:10.1002/9781118619179
[5] Bongers,S.、Blom,T.和Mooij,J.M.(2021)。动力系统的因果建模。预打印。可从arXiv:1803.08784v3[cs.AI]获取。
[6] Bongers,S.、Forré,P.、Peters,J.和Mooij,J.M.(2021年)。补充“具有周期和潜在变量的结构因果模型基础”https://doi.org/10.1214/21-AOS2064SUPP网站
[7] Bühlmann,P.、Peters,J.和Ernest,J.(2014)。CAM:因果加性模型、高维有序搜索和惩罚回归。安。统计师。42 2526-2556. ·Zbl 1309.62063号 ·doi:10.1214/14-AOS1260
[8] Byrne,R.M.J.(2007)。理性想象:人们如何创造现实的替代品.布拉德福德的书麻省理工学院出版社,马萨诸塞州剑桥。
[9] Cooper,G.F.(1997)。一种简单的基于约束的算法,用于有效挖掘观测数据库中的因果关系。数据最小知识。迪斯科。1 203-224.
[10] Dawid,A.P.(2002)。因果建模和推理的影响图。国际统计版次。70 161-189. ·Zbl 1215.6202号
[11] Duncan,O.D.(1975)。结构方程模型简介:人口研究纽约学术出版社·Zbl 0337.90019号
[12] Eaton,D.和Murphy,K.(2007年)。从不确定干预中学习精确的贝叶斯结构。第十一届国际人工智能与统计会议记录(M.Meila和X.Shen编辑)。机器学习研究进展2 107-114.
[13] Eberhardt,F.、Hoyer,P.和Scheines,R.(2010年)。结合实验发现具有潜在变量的线性循环模型。第十三届国际人工智能与统计会议记录(Y.W.Teh和M.Titterington编辑)。机器学习研究进展9 185-192.
[14] Evans,R.J.(2016)。贝叶斯网络的边界图。扫描。J.统计。43 625-648. ·Zbl 1468.62300号 ·doi:10.1111/sjos.12194
[15] Evans,R.J.(2018)。离散贝叶斯网络的边界。安。统计师。46 2623-2656·兹比尔1408.62044 ·doi:10.1214/17-AOS1631
[16] Fisher,F.M.(1970年)。联立方程模型的对应原理。计量经济学38 73-92.
[17] Forré,P.和Mooij,J.M.(2017)。具有周期和潜在变量的图形模型的马尔可夫性质。预打印。可从arXiv:1710.08775[math.ST]获取。
[18] Forré,P.和Mooij,J.M.(2018)。具有周期和潜在混杂因素的非线性结构因果模型的基于约束的因果发现。会议记录34第十届人工智能不确定性会议(阿拉伯联合酋长国-18) (A.Globerson和R.Silva编辑)。AUAI出版社。
[19] Forré,P.和Mooij,J.M.(2019年)。存在循环、潜在混杂因素和选择偏差的因果演算。会议记录35第十届人工智能不确定性会议(阿拉伯联合酋长国-19) (R.P.Adams和V.Gogate编辑)。AUAI出版社。
[20] Foygel,R.、Draisma,J.和Drton,M.(2012)。线性结构方程模型一般可辨识性的半路程准则。安。统计师。40 1682-1713. ·Zbl 1257.62059号 ·doi:10.1214/12-AOS1012
[21] Goldberger,A.S.和Duncan,O.D.(1973年)。社会科学中的结构方程模型研讨会出版社,纽约。
[22] Haavelmo,T.(1943年)。联立方程组的统计含义。计量经济学11 1-12. ·Zbl 0063.01836号 ·doi:10.2307/1905714
[23] Halpern,J.(1998)。公理化因果推理。第十四届人工智能不确定性会议记录(阿拉伯联合酋长国-98)(G.Cooper和S.Moral编辑)202-210。Morgan Kaufmann,美国加利福尼亚州旧金山。
[24] Hyttinen,A.、Eberhardt,F.和Hoyer,P.O.(2012年)。学习具有潜在变量的线性循环因果模型。J.马赫。学习。物件。13 3387-3439. ·Zbl 1433.68350号
[25] Hyttinen,A.、Hoyer,P.O.、Eberhardt,F.和Järvisalo,M.(2013)。发现具有潜在变量的循环因果模型:基于SAT的通用程序。第二十届人工智能不确定性会议论文集(阿拉伯联合酋长国-13) (A.Nicholson和P.Smyth编辑)301-310。美国俄勒冈州科瓦利斯AUAI出版社。
[26] Iwasaki,Y.和Simon,H.A.(1994年)。因果关系和模型抽象。人工智能67 143-194. ·Zbl 0942.68711号 ·doi:10.1016/0004-3702(94)90014-0
[27] Kechris,A.S.(1995年)。经典描述性集合理论.数学研究生课程156.纽约斯普林格·Zbl 0819.04002号 ·doi:10.1007/978-1-4612-4190-4
[28] Koster,J.T.A.(1996年)。非递归因果模型的马尔可夫特性。安。统计师。24 2148-2177. ·Zbl 0867.62056号 ·doi:10.1214/aos/1069362315
[29] Koster,J.T.A.(1999)。具有相关误差的高斯结构方程组路径图的马尔可夫解释的有效性。扫描。J.统计。26 413-431·Zbl 0947.60057号 ·doi:10.1111/1467-9469.00157
[30] Lacerda,G.、Spires,P.L.、Ramsey,J.和Hoyer,P.O.(2008)。通过独立成分分析发现循环因果模型。第二十四届人工智能不确定性会议记录(阿拉伯联合酋长国-08)(D.McAllester和P.Myllymaki编辑)366-374。美国俄勒冈州科瓦利斯AUAI出版社。
[31] Lauritzen,S.L.(1996)。图形模型.牛津统计科学系列17.牛津克拉伦登出版社·Zbl 0907.62001
[32] Lauritzen,S.L.、Dawid,A.P.、Larsen,B.N.和Leimer,H.G.(1990)。有向马尔可夫场的独立性。网络20 491-505. ·兹比尔074305065 ·doi:10.1002/网络.3230200503
[33] Lewis,D.K.(1979年)。反事实依赖和时间之箭。没有Dos13 455-476. ·doi:10.2307/2215339
[34] Maathuis,M.H.、Kalisch,M.和Bühlmann,P.(2009)。根据观测数据估计高维干预效果。安。统计师。37 3133-3164. ·Zbl 1191.62118号 ·doi:10.1214/09-AOS685
[35] Mani,S.(2006)。贝叶斯局部因果发现框架。匹兹堡大学博士论文。
[36] 梅森·S·J(1953)。反馈理论——信号流图的一些性质。爱尔兰共和国会议记录41 1144-1156. 电气与电子工程师协会。
[37] 梅森·S·J(1956)。反馈理论——信号流图的进一步性质。爱尔兰共和国会议记录44 920-926. 电气与电子工程师协会。
[38] Meek,C.(1995年)。贝叶斯网络中的强完备性和忠实性。第十一届人工智能不确定性大会论文集(阿拉伯联合酋长国-95)(P.Besnard和S.Hanks编辑)411-418。Morgan Kaufmann,美国加利福尼亚州旧金山。
[39] Mogensen,S.W.和Hansen,N.R.(2020年)。边缘化局部独立图的马尔可夫等价性。安。统计师。48 539-559. ·Zbl 1441.62221号 ·doi:10.1214/19-AOS1821
[40] Mogensen,S.W.、Malinsky,D.和Hansen,N.R.(2018年)。部分观测随机动力系统的因果学习。第三十四届人工智能不确定性会议论文集(阿拉伯联合酋长国-18) (A.Globerson和R.Silva编辑)AUAI出版社。
[41] Mooij,J.M.和Claassen,T.(2020)。在存在循环的情况下使用部分祖先图的基于约束的因果发现。会议记录36第十届人工智能不确定性会议(阿拉伯联合酋长国-20) (J.Peters和D.Sontag编辑)124 1159-1168。PMLR公司。
[42] Mooij,J.M.和Heskes,T.(2013)。从连续平衡数据中发现循环因果关系。会议记录29第十届人工智能不确定性会议(阿拉伯联合酋长国-13) (A.Nicholson和P.Smyth编辑)431-439。美国俄勒冈州科瓦利斯AUAI出版社。
[43] Mooij,J.M.、Janzing,D.和Schölkopf,B.(2013年)。从常微分方程到结构因果模型:确定性案例。会议记录29第十届人工智能不确定性会议(阿拉伯联合酋长国-13) (A.Nicholson和P.Smyth编辑)440-448。AUAI出版社。
[44] Mooij,J.M.、Magliabane,S.和Claassen,T.(2020年)。从多个上下文进行联合因果推理。J.马赫。学习。物件。21第99、108号论文·兹比尔1507.62224
[45] Mooij,J.M.、Peters,J.、Janzing,D.、Zscheischler,J.和Schölkopf,B.(2016)。使用观测数据区分因果关系:方法和基准。J.马赫。学习。物件。17第32、102号论文·Zbl 1360.68700号
[46] Neal,R.M.(2000)。关于在具有反馈的因果图中从\(d)-分离推导条件独立性。J.人工智能研究。12 87-91. ·Zbl 0943.68123号 ·doi:10.1613/jair.689
[47] Pearl,J.(1985)。概率推理的约束传播方法。第一届人工智能不确定性会议记录(阿拉伯联合酋长国-85)(L.Kanal和J.Lemmer编辑)31-42。美国俄勒冈州科瓦利斯AUAI出版社。
[48] Pearl,J.(2009)。因果关系:模型、推理和推理,第二版,剑桥大学出版社,剑桥·Zbl 1188.68291号 ·doi:10.1017/CBO9780511803161
[49] Pearl,J.和Dechter,R.(1996年)。通过反馈确定因果图中的独立性。第十二届人工智能不确定性会议记录(阿拉伯联合酋长国-(E.Horvitz和F.Jensen编辑)420-426。Morgan Kaufmann,美国加利福尼亚州旧金山。
[50] Pearl,J.和Mackenzie,D.(2018年)。《为什么》:因果新科学纽约Basic Books出版社·Zbl 1416.62026号
[51] Peters,J.、Janzing,D.和Schölkopf,B.(2017年)。因果推理的要素:基础和学习算法.自适应计算与机器学习麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1416.62012年
[52] Peters,J.、Mooij,J.M.、Janzing,D.和Schölkopf,B.(2014)。连续加性噪声模型的因果发现。J.马赫。学习。物件。15 2009-2053. ·Zbl 1318.68151号
[53] Pfister,N.、Bauer,S.和Peters,J.(2019年)。学习动力学系统中的稳定和预测结构。程序。国家。阿卡德。科学。美国116 25405-25411. ·兹比尔1456.70002 ·doi:10.1073/pnas.1905688116
[54] Richardson,T.(2003)。非循环有向混合图的Markov性质。扫描。J.统计。30 145-157. ·Zbl 1035.60005号 ·数字对象标识代码:10.1111/1467-9469.00323
[55] Richardson,T.和Spirtes,P.(1999)。线性反馈模型的自动发现。计算、因果关系和发现(C.Glymour和G.F.Cooper编辑)253-302。加利福尼亚州门罗公园AAAI出版社。
[56] Richardson,T.和Spirtes,P.(2002)。祖先图马尔可夫模型。安。统计师。30 962-1030. ·Zbl 1033.60008号 ·doi:10.1214/aos/1031689015
[57] Richardson,T.S.(1996)。有向循环图的发现算法。第十二届人工智能不确定性大会论文集(阿联酋-96)(E.Horvitz和F.Jensen编辑)454-461。Morgan Kaufmann,美国加利福尼亚州旧金山。
[58] Richardson,T.S.(1996)。发现循环因果结构。卡内基梅隆大学CMU-PHIL-68号技术报告。
[59] Richardson,T.S.(1996)。反馈模式:解释和发现。卡内基梅隆大学博士论文。
[60] Richardson,T.S.和Robins,J.(2013)。单一世界干预图(SWIG):对因果关系的反事实和图形方法的统一。第128号技术报告,统计和社会科学中心。
[61] Roese,N.J.(1997年)。反事实思维。精神病。牛市。121 133-148.
[62] Rubenstein,P.K.、Weichwald,S.、Bongers,S.,Mooij,J.M.、Janzing,D.、Grosse-Wentrup,M.和Schölkopf,B.(2017年)。结构方程模型的因果一致性。会议记录33第三届人工智能不确定性会议(阿拉伯联合酋长国-17) (G.Elidan和K.Kersting编辑)。AUAI出版社。
[63] 鲁宾,D.B.(1974)。在随机和非随机研究中估计治疗的因果效应。J.教育。精神病。66 688-701.
[64] Shpitser,I.和Pearl,J.(2008年)。因果层次的完整识别方法。J.马赫。学习。物件。9 1941-1979. ·Zbl 1225.68216号
[65] Spirtes,P.(1993)。有向循环图、条件独立性和非递归线性结构方程模型。卡内基梅隆大学CMU-PHIL-35号技术报告。
[66] Spirtes,P.(1994年)。反馈有向循环图形模型中的条件独立性。卡内基梅隆大学CMU-PHIL-54号技术报告。
[67] Spirtes,P.(1995)。反馈模型的有向循环图形表示。第十一届人工智能不确定性会议记录(阿拉伯联合酋长国-95)(P.Besnard和S.Hanks编辑)499-506。Morgan Kaufmann,美国加利福尼亚州旧金山。
[68] Spirtes,P.、Glymour,C.和Scheines,R.(2000年)。因果、预测和搜索,第2版。自适应计算与机器学习麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0806.62001
[69] Spirtes,P.、Meek,C.和Richardson,T.(1999)。存在潜在变量和选择偏差的因果推理算法。计算、因果关系和发现(C.Glymour和G.F.Cooper编辑)211-252。加利福尼亚州门罗公园AAAI出版社。
[70] Spites,P.、Richardson,T.、Meek,C.、Scheines,R.和Glymour,C.(1998年)。使用路径图作为结构方程建模工具。社会学。方法研究。27 182-225.
[71] 田杰(2002)。因果推理和学习研究。美国洛杉矶加利福尼亚大学认知系统实验室R-309号技术报告。
[72] Tian,J.和Pearl,J.(2001)。从变化中发现原因。会议记录17第届人工智能不确定性会议(阿拉伯联合酋长国-01)(J.Breese和D.Koller编辑)512-521。Morgan Kaufmann,美国加利福尼亚州旧金山。
[73] Verma,T.S.(1993)。因果模型的图形方面。技术报告编号R-191。美国洛杉矶加利福尼亚大学计算机科学系。
[74] Wright,S.(1921)。相关性和因果关系。《农业杂志》。物件。20 557-585.
[75] 张杰(2008)。存在潜在混杂因素和选择偏差时因果发现定向规则的完整性。人工智能172 1873-1896 ·Zbl 1184.68434号 ·doi:10.1016/j.artint.2008.08.001
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。