×

简化的PC-算法:改进大型随机网络中的因果结构学习。 (英语) Zbl 1446.62256号

小结:我们考虑估计一个高维有向非循环图的任务,给出了从具有任意噪声分布的线性结构方程模型的观测值。通过利用常见随机图的特性,我们开发了一种新的算法,该算法只需要对小的变量集进行条件处理。该算法本质上是PC-a算法的改进版本,在计算复杂度和估计精度方面都有显著提高。特别是,它可以在包含中心节点的大型网络中实现更高效、更准确的估计,这在生物系统中很常见。我们证明了所提出算法的一致性,并表明它还需要比PC算法更不严格的忠实性假设。使用低维和高维环境中的模拟来说明这些发现。基因表达数据的应用表明,与当前方法相比,该算法可以识别更多的临床相关基因。

MSC公司:

62M40型 随机字段;图像分析
62H22个 概率图形模型
60G60型 随机字段
05C90年 图论的应用
62-08 统计问题的计算方法
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] Silvia Acid和Luis M de Campos。用多叉树逼近因果网络:一项实证研究。智能计算进展,第149-158页。斯普林格,1994年。
[2] Animashree Anandkumar、Vincent YF Tan、Furong Huang和Alan S Willsky。高维高斯图形模型选择:行走可和性和局部分离准则。机器学习研究杂志,13(1):2293-23372012·Zbl 1433.68322号
[3] 癌症基因组图谱研究网络。鳞状细胞肺癌的综合基因组特征。《自然》,489(7417):519-5252012。
[4] Marc RJ Carlson、Bin Zhang、Zixing Fang、Paul S Mischel、Steve Horvath和Stanley F Nelson。基因连接、功能和序列保护:来自模块化酵母共表达网络的预测。BMC基因组学,7(1):402006。
[5] 郝晨和伯特·M·夏普。通过挖掘公开摘要构建内容丰富的生物网络。BMC生物信息学,5(1):1472004。
[6] David Maxwell Chickering。学习贝叶斯网络是NP完成的。从数据中学习,第121-130页。施普林格,1996年。
[7] 理查德·杜雷特(Richard Durrett)。《随机图形动力学》,第200卷。剑桥大学出版社,2007年·Zbl 1116.05001号
[8] 丹尼尔·伊顿和凯文·墨菲。使用动态编程和MCMC.arXiv预印本arXiv:1206.52472012的贝叶斯结构学习。
[9] Rina Foygel和Mathias Drton。高斯图形模型的扩展贝叶斯信息准则。神经信息处理系统(NeurIPS),第604-6122010页。
[10] 尼尔·弗里德曼(Nir Friedman)、米查尔·利尼尔(Michal Linial)和伊夫塔奇·纳奇曼(Iftach Nachman)。使用贝叶斯网络分析表达式数据。《计算生物学杂志》,7:601-622000。
[11] 闵金哈、孙伟、谢继春。PenPC:估计高维有向非循环图骨架的两步方法。生物计量学,72(1):146-1552016·Zbl 1393.62065号
[12] S Horvath,B Zhang,M Carlson,KV Lu,S Zhu,RM Felciano,MF Laurance,W Zhao,S Qi,Z Chen等。胶质母细胞瘤中致癌信号网络的分析确定aspm为分子靶点。《美国国家科学院院刊》,103(46):17402-174072006。
[13] 胡安·费特(Juan F.Huete)和路易斯·坎波斯(Luis M.Campos)。学习因果多元树。《推理和不确定性的符号和定量方法》,第180-185页。施普林格,1993年。doi:10.1007/BFb0028199。
[14] Trey Ideker和Nevan J Krogan。差异网络生物学。分子系统生物学,8(1):5652012。
[15] 罗纳德·詹森(Ronald Jansen)、于海元(Haiyuan Yu)、多夫·格林鲍姆(Dov Greenbaum)、尤瓦尔·克鲁格(Yuval Kluger)、内文·J·克罗根(Nevan J.Krogan)、桑巴斯·钟(Sambath Chung)、安德鲁·埃米利(Andrew Emili)、迈克尔·斯奈德(Michael Snyder)、杰克·格林布拉特(Jack F.Greenblatt)和马克·格斯坦(Mark Gerstein)。从基因组数据预测蛋白质相互作用的贝叶斯网络方法。科学,302(5644):449-4532003。ISSN 0036-8075。doi:10.1126/science.1087361。
[16] Hawoong Jeong、B´alint Tombor、R´eka Albert、Zoltan N Oltvai和A-L Barab´asi。代谢网络的大规模组织。《自然》,407(6804):651-6542000。
[17] Hawoong Jeong、Sean P Mason、A-L Barab´asi和Zoltan N Oltvai。蛋白质网络的致死性和中心性。《自然》,411(6833):41-422001。
[18] 马库斯·卡利施和彼得·伯尔曼。用PC-A算法估计高维有向非循环图。机器学习研究杂志,8:613-6362007年5月。ISSN 1532-4435·Zbl 1222.68229号
[19] 乔恩·克莱恩伯格,《小世界现象:算法视角》。InACM计算理论研讨会,第163-170页。ACM,2000年·Zbl 1296.05181号
[20] 刘拜德、小谷、黄天宝、杨銮和丁雪飞。前列腺癌侵袭性中tmprss2erg机制的确定:mmp-9和丛蛋白b1的参与。《肿瘤报告》,37(1):201-2082017年。
[21] Po-Ling Loh和Peter B–uhlmann。基于协方差逆估计的线性因果网络的高维学习。机器学习研究杂志,15(1):3065-31052014·Zbl 1318.68148号
[22] Dmitry M Malioutov、Jason K Johnson和Alan S Willsky。高斯图形模型中的行走和和信念传播。机器学习研究杂志,7(10月):2031-20642006·Zbl 1222.68254号
[23] 迈克尔·莫洛伊和布鲁斯·里德。具有给定度序列的随机图的临界点。随机结构与算法,6(2-3):161-1801995·Zbl 0823.05050号
[24] Preetam Nandy、Alain Hauser和Marloes H Maathuis。基于分数和混合结构学习中的高维一致性。arXiv预印本arXiv:1507.026082015·Zbl 1411.62144号
[25] Jonas Peters、Joris M Mooij、Dominik Janzing和Bernhard Sch¨olkopf。连续加性噪声模型的因果发现。机器学习研究杂志,15:2009-20532014·Zbl 1318.68151号
[26] 莱昂尼·拉茨(Leonie Ratz)、马克·莱布尔(Mark Laible)、卢卡斯·A·卡普兹克(Lukasz A Kacprzyk)、斯蒂芬妮·维蒂格·布莱奇(Stephanie M Wittig-Blaich)、亚尼斯·托尔斯塔夫(Yanis Tolstof)、斯特凡·杜宁(Stefan Duensing)、彼得·阿尔特沃格。Tmprss2:Erg基因融合变异体在人前列腺癌细胞中诱导tgf-β信号转导和上皮-间充质转化。Oncotarget,8(15):251152017年。
[27] Pradeep Ravikumar、Martin J Wainwright、Garvesh Raskutti和Bin Yu。通过最小化l1惩罚的对数决定元散度进行高维协方差估计。《电子统计杂志》,5:935-9802011年·Zbl 1274.62190号
[28] Christiane M Robbins、Waibov A Tembe、Angela Baker、Shripad Sinari、Tracy Y Moses、Stephen Beckstrom Sternberg、James Beckstrom-Sternberg、Michael Barrett、James-Long、Arul Chinnaiyan等。拷贝数和靶向突变分析揭示了转移性前列腺肿瘤中的新的躯体事件。基因组研究,21(1):47-552011。
[29] Roberta R Ruela-de Sousa、Elmer Hoekstra、A Marije Hoogland、Karla C Souza Queiroz、Maikel P Peppelenbosch、Andrew P Stubbs、Karin Pelizzaro-Rocha、Geert JLH van Leenders、Guido Jenster、Hiroshi Aoyama等。低分子酪氨酸磷酸酶通过增加转移潜能预测前列腺癌预后。欧洲泌尿学,69(4):710-7192016。
[30] Eric E Schadt、John Lamb、Xia Yang、Jun Zhu、Steve Edwards、Debraj GuhaThakurta、Solveig K Sieberts、Stephanie Monks、Marc Reitman、Chunsheng Zhang等。推断基因表达与疾病之间因果关系的综合基因组学方法。《自然遗传学》,37(7):710-7172005。
[31] Mark Schmidt、Alexandru Niculescu-Mizil和Kevin Murphy。使用l1-正则化路径学习图形模型结构。人工智能促进协会(AAAI),第7卷,第1278-1283页,2007年。
[32] Marco Scutari。使用bnlearn r包学习贝叶斯网络。统计软件杂志,35(1):1-222010。ISSN 1548-7660。doi:10.18637/jss.v035.i03。
[33] A.Shojaie、A.Jauhiainen、M.Kallitsis和G.Michailidis。通过结合扰动筛选和稳态基因表达谱推断调控网络。《公共科学图书馆·综合》,9(2):e823932014年。
[34] Ali Shojaie和George Michailidis。稀疏高维有向非循环图估计的惩罚似然方法。《生物特征》,97(3):519-5382010·Zbl 1195.62090号
[35] P.Spirtes、C.Glymour和R.Scheines。因果、预测和搜索。麻省理工学院出版社,第二版,2000年·Zbl 0806.62001
[36] 克里斯·斯塔克(Chris Stark)、鲍比·乔·布雷特克鲁兹(Bobby-Joe Breitkreutz)、特蕾莎·雷格利(Teresa Reguly)、洛里·鲍彻(Lorrie Boucher)、阿什顿·布雷特克鲁兹和迈克·泰勒(Mike Tyers)。Biogrid:交互数据集的通用存储库。核酸研究,34(增刊1):D535-D5392006。
[37] 塞斯·沙利凡特、凯利·塔拉斯卡和扬·德雷斯马。高斯图形模型的Trek分离。《统计年鉴》,第1665-1685页,2010年·Zbl 1189.62091号
[38] 孙亮、吕家驹、丁森泰、毕东斌、丁克佳、牛志宏和刘平。Hcrp1通过egfr信号调节前列腺癌的增殖、侵袭和耐药性。生物医学与药物治疗,91:202-2072017年。
[39] Ioannis Tsamardinos、Laura E Brown和Constantin F Aliferis。最大爬山贝叶斯网络结构学习算法。机器学习,65(1):31-782006·Zbl 1470.68192号
[40] 卡罗琳·尤勒(Caroline Uhler)、加维什·拉斯库蒂(Garvesh Raskutti)、彼得·贝鲁曼(Peter B¨uhlmann)和余斌(Bin Yu)。因果推理中忠实假设的几何学。《统计年鉴》,41(2):436-4632013·Zbl 1267.62068号
[41] Arend Voorman、Ali Shojaie和Daniela Witten。联合可加模型的图形估计。《生物统计学》,101(1):852014年·兹比尔1285.62061
[42] Changwon Yoo、Vesteinn Thorsson和Gregory F Cooper。从实验和观察DNA微阵列数据的混合物中发现基因调节途径中的因果关系。太平洋生物计算研讨会,第7卷,第498-5092002页。
[43] 张济济和彼得·斯皮特斯。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。