×

从相关数据集进行结构学习的贝叶斯层次分数。 (英语) Zbl 07478949号

总结:文献中用于学习贝叶斯网络结构的分数函数假设数据是一组同质的观测值;然而,通常情况下,它们包含以不同方式收集的不同相关但不同质的数据集。本文提出了一种新的贝叶斯Dirichlet分数,称为贝叶斯层次Dirichle(BHD)。建议的分数基于一个层次模型,该模型将信息集中在数据集上,以学习单个包含的网络结构,同时考虑到其概率结构的差异。我们使用边际似然的变分近似推导了BHD的封闭表达式,研究了相关的计算成本,并使用模拟数据评估了其性能。我们发现,当数据包括多个相关数据集时,BHD在通过结构汉明距离测量的重建精度方面优于贝叶斯狄利克雷等效均匀(BDU)得分,并且当数据是同质的时,它与BDU一样准确。当网络中变量的数量或观测值的数量较大时,这种改进尤其明显。此外,由于假正弧的数量较少,估计的网络比用BDeu获得的网络更稀疏,因此更容易解释。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H22个 概率图形模型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Gray,R.J.,多中心癌症临床试验中机构效应的贝叶斯分析,生物统计学,50244-253(1994)·Zbl 0825.62760号
[2] 施皮盖尔哈特,D.J。;艾布拉姆斯,K.R。;Myles,J.P.,《临床试验和健康护理评估的贝叶斯方法》(2004),威利
[3] Goddard,M.E.,《基因组选择:预测准确性和最大化长期反应》,Genetica,136,245-257(2009)
[4] 维恩捷斯,Y.C.J。;Bijma,P。;韦尔坎普,R.F。;Calus,M.P.L.,《通过组合来自多个性状、种群或环境的数据来预测基因组值准确性的方程》,《遗传学》,202,799-823(2016)
[5] 马科斯基,R。;新墨西哥州帕杰夫斯基。;Klimentidis,Y.C。;巴斯克斯,A.I。;杜阿尔特,C.W。;Allison,D.B。;de los Campos,G.,《超越缺失遗传力:复杂性状的预测》,《公共科学图书馆遗传学》。,7,文章e1002051 pp.(2011)
[6] de los Campos,G。;巴斯克斯,A.I。;费尔南多·R·L。;Klimentidis,Y.C。;Sorensen,D.,使用基因组最佳线性无偏预测因子预测复杂人类特征,《公共科学图书馆·遗传学》。,第9条,第1003608页(2013年)
[7] 罗素(A.Russell)。;Ghalaieny,M。;Gazdiyeva,B。;朱马巴耶娃,S。;Kurmanbayeva,A。;阿赫梅托夫,K.K。;穆卡诺夫,Y。;McCann,M。;阿里,M。;塔克,A。;维托洛,C。;Althonayan,A.,《哈萨克斯坦环境指标的空间调查:当前条件和未来需求的审查》,《国际环境杂志》。决议,12735-748(2018)
[8] 维托洛,C。;Scutari,M。;塔克,A。;Russell,A.,《使用贝叶斯网络模拟空气污染、气候和健康数据:英国地区的案例研究》,地球空间科学。,5, 76-88 (2018)
[9] 钱S.S。;Cuffney,T.F。;阿拉米丁,I。;麦克马洪,G。;Reckhow,K.H.,《多级建模在环境和生态研究中的应用》,生态学,91,355-361(2010)
[10] Gelman,A。;Carlin,J.B。;斯特恩,H.S。;邓森,D.B。;Vehtari,A。;Rubin,D.B.,贝叶斯数据分析(2014),CRC出版社·Zbl 1279.62004号
[11] 科勒,D。;弗里德曼,N.,《概率图形模型:原理和技术》(2009),麻省理工学院出版社·Zbl 1183.68483号
[12] 尼古列斯库·马齐尔(Niculescu-Mizil),A。;Caruana,R.,《贝叶斯网络结构学习的归纳迁移》(Proceedings of Artificial Intelligence and Statistics,2007),339-346
[13] 奥茨,C.J。;J.Q.史密斯。;穆克吉,S。;Cussens,J.,多有向无环图的精确估计,统计计算。,26, 797-811 (2016) ·Zbl 1505.62300号
[14] De Michelis,F。;Magni,P。;Piergiorgi,P。;鲁宾,医学硕士。;Bellazzi,R.,用于处理分类问题中样本异质性的分层朴素贝叶斯模型:组织微阵列的应用,BMC生物信息。,7, 514 (2006)
[15] 马洛维尼,A。;北卡罗来纳州巴巴里尼。;贝拉齐,R。;De Michelis,F.,遗传关联研究的层次朴素贝叶斯,BMC生物信息。,2012年6月13日
[16] Bareinboim,E。;Pearl,J.,因果推理和数据融合问题,Proc。国家。阿卡德。科学。,113, 7345-7352 (2016)
[17] 阿齐蒙蒂,L。;Corani,G。;Zaffalon,M.,贝叶斯网络中参数的层次估计,计算。统计数据分析。,137, 67-91 (2019) ·Zbl 1507.62005年
[18] 赫克曼,D。;盖革,D。;Chickering,D.M.,《学习贝叶斯网络:知识和统计数据的结合》,马赫出版社。学习。,20,197-243(1995),作为技术报告MSR-TR-94-09提供·Zbl 0831.68096号
[19] Lauritzen,S.L。;Wermuth,N.,变量之间关联的图形模型,其中一些是定性的,一些是定量的,Ann.Stat.,17,31-57(1989)·Zbl 0669.62045号
[20] Schwarz,G.,《估算模型的尺寸》,Ann.Stat.,6461-464(1978)·Zbl 0379.62005年
[21] Ueno,M.,《由先验与数据之比确定的学习网络》,(第26届人工智能不确定性会议论文集(2010)),598-605
[22] Scutari,M.,《离散贝叶斯网络的经验贝叶斯评分》,Proceedings Track。程序跟踪,2016年PGM。程序跟踪。Proceedings Track,PGM 2016,J.Mach。学习。决议,52,438-448(2016)
[23] Scutari,M.,Dirichlet Bayesian网络得分和最大相对熵原理,Behaviormetrica,45,337-362(2018)
[24] Chickering,D.M.,等效贝叶斯网络结构的转换表征,(第11届人工智能不确定性会议论文集。第11届人工智能不确定性会议论文集,UAI'95(1995)),87-98
[25] M.I.乔丹。;加赫拉马尼,Z。;Jaakkola,T.S。;Saul,L.K.,《图形模型变分方法简介》,马赫。学习。,37, 183-233 (1999) ·Zbl 0945.68164号
[26] Wainwright,M.J。;Jordan,M.I.,《图形模型、指数族和变分推理》,Found。趋势马赫数。学习。,1, 1-305 (2008) ·Zbl 1193.62107号
[27] 卡塞拉,G。;Moreno,E.,《评估双向列联表中独立性内在测试的稳健性》,美国统计协会,104,1261-1271(2009)·Zbl 1328.62359号
[28] Scutari,M.,《使用bnlearn R包学习贝叶斯网络》,J.Stat.Softw。,35, 1-22 (2010)
[29] Silander,T。;Kontkanen,P。;Myllymäki,P.,关于映射贝叶斯网络结构对等效样本大小参数的敏感性,(第二十届人工智能不确定性会议论文集(2007)),360-367
[30] Tsamardinos,I。;Brown,L.E。;Aliferis,C.F.,最大爬山贝叶斯网络结构学习算法,马赫。学习。,65, 31-78 (2006) ·Zbl 1470.68192号
[31] Boutiler,C。;弗里德曼,N。;Goldszmidt,M。;Koller,D.,《贝叶斯网络中的上下文特定独立性》,(《第十二届人工智能不确定性国际会议论文集》,第十二届国际人工智能不确定会议论文集,UAI’97(1996)),115-123
[32] Tillman,R.E.,《独立非同分布数据的结构学习》,(第26届机器学习国际年会论文集,第26届国际机器学习会议论文集,ICML'09(2009)),1041-1048
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。