文件Zbl 07596129-zbMATH Open

从复杂调查数据中进行贝叶斯网络结构学习：一种基于重采样的方法。（英语） Zbl 07596129号

统计方法应用。 31,4号，981-1013（2022）.

摘要：如今，高质量的官方统计数据越来越多。多元统计模型的构建可能会导致因果关系的识别，这一点值得关注。在这方面，贝叶斯网络发挥了重要作用。关键的一步是学习贝叶斯网络的结构。使用最广泛的过程之一是PC算法，它包括对可用数据集进行几次独立测试，以及根据测试结果构建贝叶斯网。PC算法基于数据独立且同分布的不可容许假设。不幸的是，官方统计数据通常是通过复杂的抽样设计收集的，因此不符合上述假设。在这种情况下，PC算法无法学习结构。为了避免这种情况，在结构学习过程中必须考虑样本选择。本文提出了一种改进的PC算法，用于从复杂调查数据推断因果结构。它基于有限总体的重采样技术。仿真实验表明了该算法对偏离假设的鲁棒性以及良好的性能。

引用于1文件

MSC公司：

62至XX

统计

关键词：

贝叶斯网络;复杂测量数据;假人口;重新取样;结构学习

软件：

墨西哥比索;TETRAD公司;pcalg公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Antal，E。；Tillé，Y.，有限总体复杂抽样设计的直接自举方法，美国统计协会，106534-543（2011）·兹比尔1232.62030
[2]	巴林，M。；Scanu，M.，Vicard P（2010）《使用概率专家系统对复杂调查抽样中列联表的估计》，《J Stat Plan推断》，1401501-1512（2010）·Zbl 1185.62104号
[3]	博蒙特，J-F；Patak，Z.，《关于特别关注泊松抽样的抽样调查的广义自举法》，《国际统计评论》，第80期，第127-148页（2012年）·Zbl 1418.6206号
[4]	Berger，YG，不等概率大熵抽样设计下的渐近一致性，Pak J Stat，27，407-426（2011）·Zbl 1509.62024号
[5]	PJ Bickel；Freedman，DA，引导的一些渐近理论，Ann Statist，91196-1217（1981）·Zbl 0449.62034号
[6]	Boistard，H。；惠普公司Lophuhaä；Ruiz-Gazen，A.，《单阶段抽样设计的函数中心极限定理》，Ann Stat，451728-1758（2017）·Zbl 1459.62013号
[7]	JG展位；巴特勒，RW；Hall，P.，有限总体的Bootstrap方法，J Amer Statist Assoc，89，1282-1289（1994）·Zbl 0812.62006号
[8]	赵，MT；Lo，S-H，有限总体的自举方法，Sankhya Ser A，47，399-405（1985）·Zbl 0587.62031号
[9]	Chauvet G（2007）《人口终结的自助方法》。伦内斯第二大学恩塞学院统计实验室博士学位论文，
[10]	Chatterjee，A.，有限总体样本分位数的渐近性质，《Ann Inst Statist Math》，63，157-179（2011）·Zbl 1432.62022
[11]	Conti，PL，《关于高熵抽样设计下有限总体分布函数的估计及其应用》，Sankhya B，76，234-259（2014）·Zbl 1330.62061号
[12]	孔蒂，PL；Marella，D.，《fnite总体分位数的推断：渐近与重采样结果》，Scand J Stat，42，545-561（2015）·Zbl 1368.62019号
[13]	孔蒂，PL；Marella，D.，《有限总体分位数的推断：渐近与重采样结果》，Scand J Stat，42，545-561（2015）·Zbl 1368.62019号
[14]	孔蒂，PL；Marella，D。；Mecatti，F。；Andreis，F.，《基于伪总体的重新采样统一原则框架：渐近理论》，Bernoulli，261044-1069（2019）·兹比尔1466.62241
[15]	Conti PL，Di Iorio A（2018）通过重新采样在有限种群中进行分析推理，应用于置信区间和独立性测试，arXiv:1809.08035。提交第二次审查
[16]	孔蒂，PL；Di Iorio，A。；Guandalini，A。；Marella，D。；Vicard，P。；Vitale，V.，关于复杂抽样设计下洛伦兹曲线的估计，Stat-Meth Appl，29，1-24（2020）·Zbl 1436.62389号
[17]	Cowell RG、Dawid P、Lauritzen SL、Spiegelhalter DJ（2007）《概率网络和专家系统：贝叶斯网络的精确计算方法》，Springer出版公司·Zbl 1120.68444号
[18]	Di Zio，M。；斯坎努，M。；科波拉，L。；鲁兹，O。；Ponti，A.，贝叶斯插补网络，《皇家统计学会杂志》，167，309-322（2004）·Zbl 1408.62043号
[19]	德顿，M。；Maathuis，MH，《图形建模中的结构学习》，Annu Rev Stat Appl，4365-393（2017）
[20]	Efron，B.，《Bootstrap方法：折刀的另一种视角》，《Ann Stat》，第7期，第1-26页（1979年）·Zbl 0406.62024号
[21]	Friedman N、Goldszmidt M、Wyner A（1999）《贝叶斯网络数据分析：自举方法》。196-201年第15届人工智能不确定性年会论文集，
[22]	Grafström，A.，不等概率抽样设计的熵，Stat Methodol，784-97（2010）·Zbl 1230.62004号
[23]	Hájek，J.，《有限总体不同概率拒绝抽样的渐近理论》，《数学统计年鉴》，第35期，1491-1523页（1964年）·Zbl 0138.13303号
[24]	Holmberg A（1998）《概率比例抽样的自举方法》，《ASA调查研究方法部分会议记录》，378-383
[25]	Jiménez-Gamero，医学博士；Moreno-Rebollo，JL；Mayor-Gallego，JA，关于有限总体特征函数的估计及其应用，Test，2795-121（2018）·Zbl 1386.62003年
[26]	Gross ST（1980）抽样调查中位数估计。在调查研究方法一节的会议记录中。美国统计协会181-184
[27]	卡利施，M。；Mächler，M。；科伦坡，D。；Maathuis，MH；Bühlmann，P.，使用图形模型和R包pcalg进行因果推断，J Stat Softw，47，1-26（2012）
[28]	拉加尼，V。；阿提尼欧，G。；Farcomeni，A。；Tsagris，M。；Tsamardinos，I.，《使用R包MXM进行特征选择：发现统计等效特征子集》，J Stat Softw，80，7（2017）
[29]	Lahiri，SN，相关数据的重新采样方法。斯普林格统计学系列（2003年），纽约：斯普林格，纽约·Zbl 1028.6202号
[30]	马萨利吉，Z。；哈齐扎，D。；Leger，C.，《有限总体抽样中bootstrap方法的调查》，Stat Surv，10，1-52（2016）·Zbl 1351.62025号
[31]	Marella，D。；Vicard，P.，用于建模受访者测量误差的面向对象贝叶斯网络，Commun Stat，42，3463-3477（2013）·Zbl 1466.62428号
[32]	Marella D，Vicard P（2015）面向对象的贝叶斯网络，用于处理家庭调查中的测量误差。数据分析统计模型的进展
[33]	Marella，D。；Pfeffermann，D.，来自两个独立信息样本的匹配信息，J Stat Plan Inference，203，70-81（2019）·Zbl 1422.62049号
[34]	McCarthy PJ，Snowden CB（1985）引导和有限总体抽样。《生命与健康统计》95（2）：1-23。华盛顿特区：公共卫生服务出版物，美国政府印刷，
[35]	Pfeffermann，D.，《建模调查数据时采样权重的作用》，《国际统计评论》，61317-337（1993）·Zbl 0779.62009年
[36]	Pfeffermann，D.，复杂调查数据建模：为什么建模？为什么这是一个问题？我们如何处理？，Surv Methodol，37，115-136（2001）
[37]	Ramsey J，Spirtes P，Zhang J（2006）邻信度和保守因果推理，第22届人工智能不确定性会议论文集，401-408。俄勒冈州：AUAI出版社，
[38]	Ranalli MG，Mecatti F（2012）《比较自举抽样调查数据的最新方法：迈向统一方法的第一步》。在ASA关于调查研究方法的会议记录中，4088-4099，
[39]	Rao，CR，线性统计推断及其应用（1973），纽约：威利出版社，纽约·Zbl 0256.6202号
[40]	Rao，JNK；Scott，AJ，《来自复杂抽样调查的分类数据分析：双向表中良好性和独立性的chi-squared检验》，美国统计协会，76，221-230（1981）·Zbl 0473.62010号
[41]	Rao，JNK；Scott，AJ，《关于利用调查数据估计单元格比例的多路表格的齐方检验》，《Ann Stat》，第12期，第46-60页（1984年）·Zbl 0622.62059号
[42]	Rao，JNK；Wu，C-FJ，用复杂调查数据重新抽样推断，J Amer Statist Assoc，83，231-241（1988）·Zbl 0654.62015号
[43]	Serfling，RJ，《数理统计近似理论》（1980），纽约：威利出版社，纽约·Zbl 0538.62002号
[44]	Sitter，RR，复杂调查数据的重采样程序，J Amer Statist Assoc，87，755-765（1992）·Zbl 0760.62013.中
[45]	Skinner CJ，Holt D，Smith MF（1989）复杂调查分析。威利·Zbl 0701.62018号
[46]	Spirtes P、Glymour G、Scheines R（2000）《因果关系、预测和搜索》，麻省理工学院出版社，马萨诸塞州剑桥，第二版，D.Heckerman、C.Meek、G.F.Cooper和T.Richardson提供的附加材料·Zbl 0806.62001
[47]	Thibaudeau Y，Winkler WE（2002）贝叶斯网络表示、广义插补和满足分析约束的合成微观数据，研究报告RRS2002/92002。美国人口普查局
[48]	Tsagris，M.，《使用PC算法的贝叶斯网络学习：一种改进的正确变体》，《应用Artif Intell》，33，2，101-123（2019）
[49]	伊利诺伊州Tsamardinos；布朗，E。；Aliferis，CF，最大最小爬升贝叶斯网络结构学习算法，Mach Learn，65，1，31-78（2006）·Zbl 1470.68192号
[50]	尤勒，C。；Raskutti，G。；Bühlmann，P。；Yu，B.，因果推理中忠实假设的几何学，《Ann Stat》，第41期，第436-463页（2013年）·Zbl 1267.62068号
[51]	Verma T，Pearl J（1990）关于因果模型的等价性。加州大学洛杉矶分校计算机科学系技术报告R-150
[52]	Wilcox RR（2010）《现代统计方法基础》，大幅提高功效和准确性。施普林格·Zbl 1211.62001号
[53]	张杰。；Spirtes，P.，《不忠检测与稳健因果推断》，Minds Mach，18，239-271（2008）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

从复杂调查数据中进行贝叶斯网络结构学习：一种基于重采样的方法。（英语） Zbl 07596129号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

从复杂调查数据中进行贝叶斯网络结构学习：一种基于重采样的方法。 （英语） Zbl 07596129号

MSC公司：

关键词：

软件：

参考文献：

从复杂调查数据中进行贝叶斯网络结构学习：一种基于重采样的方法。（英语） Zbl 07596129号