×

从连接连续变量和离散变量的数据集学习贝叶斯网络。 (英语) Zbl 1386.68129号

摘要:本文讨论了结构学习在计算生物学应用中观察到的两个问题。
第一个是处理混合数据。大多数学习算法的优化标准适用于离散或连续数据。混合数据集通常通过连续数据的离散化来处理,这往往会导致信息的丢失。为了解决这个问题,我们将离散评分函数应用于连续数据。因此,两种类型的变量使用相同的分数,可以直接从混合数据中学习网络结构。
第二个问题是I类错误级别的控制。通常,学习算法输出的网络根据某些优化标准是最佳的,但该网络表示的特定关系的可靠性未知。我们通过允许用户指定预期的错误级别并将评分标准的参数调整到此级别来解决此问题。

MSC公司:

68T05型 人工智能中的学习和自适应系统
2015年1月62日 贝叶斯推断
92-08 生物学问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 弗里德曼,N.,《使用概率图形模型推断蜂窝网络》,《科学》,303,5659,799-805(2004)
[2] 多杰尔,N。;甘宾,A。;威尔钦斯基,B。;Tiuryn,J.,《将动态贝叶斯网络应用于扰动基因表达数据》,BMC生物信息。,7, 249 (2006)
[3] Beer,医学硕士。;Tavazoie,S.,从序列预测基因表达,细胞,117,2,185-198(2004)
[4] 达布罗夫斯基,M。;多杰尔,N。;Zawadzka,M。;Mieczkowski,J。;Kaminska,B.,中风和癫痫发作后保守特征系统亚空间顺式调节的比较分析,BMC系统。生物学,4,86(2010)
[5] 史密斯,V.A。;Yu,J。;Smulders,T.V.公司。;Hartemink,A.J。;Jarvis,E.D.,《神经信息流网络的计算推理》,《公共科学图书馆·计算》。生物学,2,11,文章e161 pp.(2006)
[6] 美国波恩。;Zinzen,R.P。;Girardot,C。;古斯塔夫森,E.H。;Perez-Gonzalez,A。;Delhomme,N。;加维·赫尔姆,Y。;威尔钦斯基,B。;A.里德尔。;Furlong,E.E.M.,《染色质状态的组织特异性分析确定胚胎发育期间增强子活性的时间特征》,《自然遗传学》。,44, 2, 148-156 (2012)
[7] 库珀,G.F。;Herskovits,E.,从数据中归纳概率网络的贝叶斯方法,马赫。学习。,9, 309-347 (1992) ·Zbl 0766.68109号
[8] 林,W。;Bacchus,F.,《学习贝叶斯信念网络:基于MDL原理的方法》,计算。智力。,10, 3, 269-293 (1994)
[9] 赫克曼,D。;盖革,D。;Chickering,D.M.,《学习贝叶斯网络:知识和统计数据的结合》,马赫出版社。学习。,20, 3, 197-243 (1995) ·Zbl 0831.68096号
[10] de Campos,L.M.,基于互信息和条件独立性测试的贝叶斯网络学习评分函数,J.Mach。学习。第7号决议,2149-2187(2006年)·Zbl 1222.62036号
[11] 埃利丹,G。;我·纳奇曼。;Friedman,N.,《连续变量贝叶斯网络的“理想父”结构学习》,J.Mach。学习。第8号决议,1799-1833(2007年)·Zbl 1222.68191号
[12] Imoto,S。;Goto,T。;Miyano,S.,使用贝叶斯网络和非参数回归估计基因之间的遗传网络和功能结构,Pac。症状。生物计算。,175-186 (2002)
[13] Lauritzen,S.L。;Jensen,F.I.I.,条件高斯分布下的稳定局部计算,统计计算。,11, 2, 191-203 (2001)
[14] Cowell,R.G.,条件高斯贝叶斯网络中的局部传播,J.Mach。学习。第6157-1550号决议(2005年)·Zbl 1222.68176号
[15] McGeachie,M.J。;Chang,H.-H。;Weiss,S.T.,CGBayesNets:混合离散和连续数据的条件高斯贝叶斯网络学习和推理,《公共科学图书馆·计算》。生物学,10,6,文章e1003676 pp.(2014)
[16] 蒙蒂,S。;Cooper,G.F.,从混合数据中学习贝叶斯网络的多元离散化方法,(UAI’98:第十四届人工智能不确定性会议论文集。UAI’1998:美国威斯康星州麦迪逊市威斯康星大学商学院第十四届人造智能不确定性大会论文集,1998年7月24日至26日(1998)),404-413
[17] 铃木,J.,概率图形模型,(第七届欧洲研讨会,会议录。第七届欧盟研讨会,会议记录,2014年,荷兰乌得勒支,2014年9月17日至19日(2014年),施普林格国际出版:施普林格国际出版商会),471-486,Ch。存在离散和连续变量时学习贝叶斯网络结构·Zbl 1443.68156号
[18] 威尔钦斯基,B。;Dojer,N.,BNFinder:学习贝叶斯网络的精确有效方法,生物信息学,25,2286(2009)
[19] 多杰尔,N。;Bednarz,P。;Podsialo,A。;Wilczynski,B.,BNFinder2:更快的贝叶斯网络学习和贝叶斯分类,生物信息学,29,16,2068-2070(2013)
[20] Wilczynski,B。;Liu,Y.-H。;Yeo,Z.X。;Furlong,E.E.M.,使用转录因子占用和染色质状态的综合模型预测时空基因表达,PLoS Compute。生物学,8,12,文章e1002798 pp.(2012)
[21] Dojer,N.,《学习贝叶斯网络不一定是NP-hard》,(Královic,R.;Urzyczyn,P.,《2006年计算机科学数学基础学报》。2006年计算机科学数学基础学报,Lect。注释计算。科学。,第4162卷(2006),施普林格-弗拉格),305-314·兹比尔1132.68537
[22] Schwarz,G.,估算模型的维数,《Ann.Stat.》,6,2,461-464(1978)·Zbl 0379.62005年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。