×

从复杂调查数据中进行贝叶斯网络结构学习:一种基于重采样的方法。 (英语) Zbl 07596129号

摘要:如今,高质量的官方统计数据越来越多。多元统计模型的构建可能会导致因果关系的识别,这一点值得关注。在这方面,贝叶斯网络发挥了重要作用。关键的一步是学习贝叶斯网络的结构。使用最广泛的过程之一是PC算法,它包括对可用数据集进行几次独立测试,以及根据测试结果构建贝叶斯网。PC算法基于数据独立且同分布的不可容许假设。不幸的是,官方统计数据通常是通过复杂的抽样设计收集的,因此不符合上述假设。在这种情况下,PC算法无法学习结构。为了避免这种情况,在结构学习过程中必须考虑样本选择。本文提出了一种改进的PC算法,用于从复杂调查数据推断因果结构。它基于有限总体的重采样技术。仿真实验表明了该算法对偏离假设的鲁棒性以及良好的性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Antal,E。;Tillé,Y.,有限总体复杂抽样设计的直接自举方法,美国统计协会,106534-543(2011)·兹比尔1232.62030
[2] 巴林,M。;Scanu,M.,Vicard P(2010)《使用概率专家系统对复杂调查抽样中列联表的估计》,《J Stat Plan推断》,1401501-1512(2010)·Zbl 1185.62104号
[3] 博蒙特,J-F;Patak,Z.,《关于特别关注泊松抽样的抽样调查的广义自举法》,《国际统计评论》,第80期,第127-148页(2012年)·Zbl 1418.6206号
[4] Berger,YG,不等概率大熵抽样设计下的渐近一致性,Pak J Stat,27,407-426(2011)·Zbl 1509.62024号
[5] PJ Bickel;Freedman,DA,引导的一些渐近理论,Ann Statist,91196-1217(1981)·Zbl 0449.62034号
[6] Boistard,H。;惠普公司Lophuhaä;Ruiz-Gazen,A.,《单阶段抽样设计的函数中心极限定理》,Ann Stat,451728-1758(2017)·Zbl 1459.62013号
[7] JG展位;巴特勒,RW;Hall,P.,有限总体的Bootstrap方法,J Amer Statist Assoc,89,1282-1289(1994)·Zbl 0812.62006号
[8] 赵,MT;Lo,S-H,有限总体的自举方法,Sankhya Ser A,47,399-405(1985)·Zbl 0587.62031号
[9] Chauvet G(2007)《人口终结的自助方法》。伦内斯第二大学恩塞学院统计实验室博士学位论文,
[10] Chatterjee,A.,有限总体样本分位数的渐近性质,《Ann Inst Statist Math》,63,157-179(2011)·Zbl 1432.62022
[11] Conti,PL,《关于高熵抽样设计下有限总体分布函数的估计及其应用》,Sankhya B,76,234-259(2014)·Zbl 1330.62061号
[12] 孔蒂,PL;Marella,D.,《fnite总体分位数的推断:渐近与重采样结果》,Scand J Stat,42,545-561(2015)·Zbl 1368.62019号
[13] 孔蒂,PL;Marella,D.,《有限总体分位数的推断:渐近与重采样结果》,Scand J Stat,42,545-561(2015)·Zbl 1368.62019号
[14] 孔蒂,PL;Marella,D。;Mecatti,F。;Andreis,F.,《基于伪总体的重新采样统一原则框架:渐近理论》,Bernoulli,261044-1069(2019)·兹比尔1466.62241
[15] Conti PL,Di Iorio A(2018)通过重新采样在有限种群中进行分析推理,应用于置信区间和独立性测试,arXiv:1809.08035。提交第二次审查
[16] 孔蒂,PL;Di Iorio,A。;Guandalini,A。;Marella,D。;Vicard,P。;Vitale,V.,关于复杂抽样设计下洛伦兹曲线的估计,Stat-Meth Appl,29,1-24(2020)·Zbl 1436.62389号
[17] Cowell RG、Dawid P、Lauritzen SL、Spiegelhalter DJ(2007)《概率网络和专家系统:贝叶斯网络的精确计算方法》,Springer出版公司·Zbl 1120.68444号
[18] Di Zio,M。;斯坎努,M。;科波拉,L。;鲁兹,O。;Ponti,A.,贝叶斯插补网络,《皇家统计学会杂志》,167,309-322(2004)·Zbl 1408.62043号
[19] 德顿,M。;Maathuis,MH,《图形建模中的结构学习》,Annu Rev Stat Appl,4365-393(2017)
[20] Efron,B.,《Bootstrap方法:折刀的另一种视角》,《Ann Stat》,第7期,第1-26页(1979年)·Zbl 0406.62024号
[21] Friedman N、Goldszmidt M、Wyner A(1999)《贝叶斯网络数据分析:自举方法》。196-201年第15届人工智能不确定性年会论文集,
[22] Grafström,A.,不等概率抽样设计的熵,Stat Methodol,784-97(2010)·Zbl 1230.62004号
[23] Hájek,J.,《有限总体不同概率拒绝抽样的渐近理论》,《数学统计年鉴》,第35期,1491-1523页(1964年)·Zbl 0138.13303号
[24] Holmberg A(1998)《概率比例抽样的自举方法》,《ASA调查研究方法部分会议记录》,378-383
[25] Jiménez-Gamero,医学博士;Moreno-Rebollo,JL;Mayor-Gallego,JA,关于有限总体特征函数的估计及其应用,Test,2795-121(2018)·Zbl 1386.62003年
[26] Gross ST(1980)抽样调查中位数估计。在调查研究方法一节的会议记录中。美国统计协会181-184
[27] 卡利施,M。;Mächler,M。;科伦坡,D。;Maathuis,MH;Bühlmann,P.,使用图形模型和R包pcalg进行因果推断,J Stat Softw,47,1-26(2012)
[28] 拉加尼,V。;阿提尼欧,G。;Farcomeni,A。;Tsagris,M。;Tsamardinos,I.,《使用R包MXM进行特征选择:发现统计等效特征子集》,J Stat Softw,80,7(2017)
[29] Lahiri,SN,相关数据的重新采样方法。斯普林格统计学系列(2003年),纽约:斯普林格,纽约·Zbl 1028.6202号
[30] 马萨利吉,Z。;哈齐扎,D。;Leger,C.,《有限总体抽样中bootstrap方法的调查》,Stat Surv,10,1-52(2016)·Zbl 1351.62025号
[31] Marella,D。;Vicard,P.,用于建模受访者测量误差的面向对象贝叶斯网络,Commun Stat,42,3463-3477(2013)·Zbl 1466.62428号
[32] Marella D,Vicard P(2015)面向对象的贝叶斯网络,用于处理家庭调查中的测量误差。数据分析统计模型的进展
[33] Marella,D。;Pfeffermann,D.,来自两个独立信息样本的匹配信息,J Stat Plan Inference,203,70-81(2019)·Zbl 1422.62049号
[34] McCarthy PJ,Snowden CB(1985)引导和有限总体抽样。《生命与健康统计》95(2):1-23。华盛顿特区:公共卫生服务出版物,美国政府印刷,
[35] Pfeffermann,D.,《建模调查数据时采样权重的作用》,《国际统计评论》,61317-337(1993)·Zbl 0779.62009年
[36] Pfeffermann,D.,复杂调查数据建模:为什么建模?为什么这是一个问题?我们如何处理?,Surv Methodol,37,115-136(2001)
[37] Ramsey J,Spirtes P,Zhang J(2006)邻信度和保守因果推理,第22届人工智能不确定性会议论文集,401-408。俄勒冈州:AUAI出版社,
[38] Ranalli MG,Mecatti F(2012)《比较自举抽样调查数据的最新方法:迈向统一方法的第一步》。在ASA关于调查研究方法的会议记录中,4088-4099,
[39] Rao,CR,线性统计推断及其应用(1973),纽约:威利出版社,纽约·Zbl 0256.6202号
[40] Rao,JNK;Scott,AJ,《来自复杂抽样调查的分类数据分析:双向表中良好性和独立性的chi-squared检验》,美国统计协会,76,221-230(1981)·Zbl 0473.62010号
[41] Rao,JNK;Scott,AJ,《关于利用调查数据估计单元格比例的多路表格的齐方检验》,《Ann Stat》,第12期,第46-60页(1984年)·Zbl 0622.62059号
[42] Rao,JNK;Wu,C-FJ,用复杂调查数据重新抽样推断,J Amer Statist Assoc,83,231-241(1988)·Zbl 0654.62015号
[43] Serfling,RJ,《数理统计近似理论》(1980),纽约:威利出版社,纽约·Zbl 0538.62002号
[44] Sitter,RR,复杂调查数据的重采样程序,J Amer Statist Assoc,87,755-765(1992)·Zbl 0760.62013.中
[45] Skinner CJ,Holt D,Smith MF(1989)复杂调查分析。威利·Zbl 0701.62018号
[46] Spirtes P、Glymour G、Scheines R(2000)《因果关系、预测和搜索》,麻省理工学院出版社,马萨诸塞州剑桥,第二版,D.Heckerman、C.Meek、G.F.Cooper和T.Richardson提供的附加材料·Zbl 0806.62001
[47] Thibaudeau Y,Winkler WE(2002)贝叶斯网络表示、广义插补和满足分析约束的合成微观数据,研究报告RRS2002/92002。美国人口普查局
[48] Tsagris,M.,《使用PC算法的贝叶斯网络学习:一种改进的正确变体》,《应用Artif Intell》,33,2,101-123(2019)
[49] 伊利诺伊州Tsamardinos;布朗,E。;Aliferis,CF,最大最小爬升贝叶斯网络结构学习算法,Mach Learn,65,1,31-78(2006)·Zbl 1470.68192号
[50] 尤勒,C。;Raskutti,G。;Bühlmann,P。;Yu,B.,因果推理中忠实假设的几何学,《Ann Stat》,第41期,第436-463页(2013年)·Zbl 1267.62068号
[51] Verma T,Pearl J(1990)关于因果模型的等价性。加州大学洛杉矶分校计算机科学系技术报告R-150
[52] Wilcox RR(2010)《现代统计方法基础》,大幅提高功效和准确性。施普林格·Zbl 1211.62001号
[53] 张杰。;Spirtes,P.,《不忠检测与稳健因果推断》,Minds Mach,18,239-271(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。