×

高斯图形模型选择中的多重测试和误差控制。 (英语) Zbl 1246.62143号

摘要:图形模型为探索多元依赖模式提供了一个框架。图与统计模型之间的联系是通过用观测变量识别图的顶点,并将图中的边模式转换为施加在变量联合分布上的条件独立模式来实现的。以高斯模型为重点,我们回顾了经典的图形模型。对于这些模型,定义的条件独立性相当于与图中缺少的单个边相关的某些(部分)相关系数的消失。因此,可以通过对消失(部分)相关系数的假设进行多次测试来选择高斯图形模型。我们展示并举例说明了该方法如何允许用户在执行模型选择的同时控制错误边缘包含的错误率。

理学硕士:

62H15型 多元分析中的假设检验
62H20个 关联度量(相关性、典型相关性等)
05C90年 图论的应用
05C20号 有向图(有向图),比赛
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aitkin,M.A.(1969年)。相关矩阵的一些测试。生物特征56 443–446·Zbl 0182.52004号 ·doi:10.1093/biomet/56.2.443
[2] Aitkin,M.A.(1971)。更正:相关矩阵的一些测试。生物特征58 245·Zbl 0182.52004号
[3] Anderson,T.W.(2003)。《多元统计分析导论》,第三版,新泽西州霍博肯威利出版社·Zbl 1039.62044号
[4] Andersson,S.A.、Madigan,D.和Perlman,M.D.(1997年)。非循环有向图的马尔可夫等价类的一个刻画。安。统计师。25 505–541. ·Zbl 0876.60095号 ·doi:10.1214/aos/1031833662
[5] Andersson,S.A.、Madigan,D.和Perlman,M.D.(2001年)。链图的可选马尔可夫属性。扫描。J.统计。28 33–85. ·Zbl 0972.60067号 ·doi:10.1111/1467-9469.00224
[6] Andersson,S.A.和Perlman,M.D.(1998年)。具有递归图形马尔可夫结构的正态线性回归模型。《多元分析杂志》。66 133–187. ·Zbl 1127.62377号 ·doi:10.1006/jmva.1998.1745
[7] Andersson,S.A.和Perlman,M.D.(2006年)。刻画AMP链图模型的马尔可夫等价类。安。统计师。34 939–972. ·Zbl 1096.62097号 ·doi:10.1214/00905360000000173
[8] Atay-Kayis,A.和Massam,H.(2005年)。计算不可分解高斯图形模型中边际似然的蒙特卡罗方法。生物特征92 317–335·Zbl 1094.62028号 ·doi:10.1093/生物技术/92.2.317
[9] Badsberg,J.(1992)。CoCo在列联表中进行模型搜索。《计算统计学》(Y.Dodge和J.Whittaker编辑)251-256。海德堡物理学。
[10] Banerjee,M.和Richardson,T.S.(2003)。关于图形高斯模型的二元化:一个修正注释。扫描。J.统计。30 817–820. ·Zbl 1053.62079号 ·doi:10.1111/1467-9469.00366
[11] Becker,A.、Geiger,D.和Meek,C.(2000年)。完美的树状马尔可夫分布。第16届人工智能不确定性会议论文集19-23。Morgan Kaufmann,加利福尼亚州旧金山·Zbl 1122.60013号
[12] Beerenwinkel,N.和Drton,M.(2007年)。纵向克隆HIV序列数据的突变树隐马尔可夫模型。生物统计学8 53–71·Zbl 1170.62368号 ·doi:10.1093/biostatistics/kxj033
[13] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B 57 289–300。JSTOR公司:·Zbl 0809.62014号
[14] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165–1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[15] Butte,A.J.、Tamayo,P.、Slonim,D.、Golub,T.R.和Kohane,I.S.(2000年)。利用相关网络发现RNA表达和化疗敏感性之间的功能关系。程序。国家。阿卡德。科学。美国97 12182–12186。
[16] Caputo,A.、Foraita,R.、Klasen,S.和Pigeot,I.(2003年)。贝宁营养不良——基于图形模型的分析。社会科学与医学56 1677–1691。
[17] Caputo,A.、Heinicke,A.和Pigeot,I.(1999)。图链模型源自社会学家研究生的模型选择策略。生物。期刊41 217–234·兹伯利0923.62125 ·doi:10.1002/(SICI)1521-4036(199905)41:2<217::AID-BIMJ217>3.0.CO;2-U型
[18] Castelo,R.和Roverato,A.(2006年)。一种稳健的程序,用于从(p)大于(n)的微阵列数据中搜索高斯图形模型。J.马赫。学习。第7号决议2621–2650·Zbl 1222.68158号
[19] Chaudhuri,S.、Drton,M.和Richardson,T.S.(2007年)。协方差矩阵的零估计。生物特征94 199–216·Zbl 1143.62032号 ·doi:10.1093/biomet/asm007
[20] Chickering,D.M.(2002)。学习贝叶斯网络结构的等价类。J.马赫。学习。第2445–498号决议·Zbl 1007.68179号 ·doi:10.1162/1532443027600696
[21] Consonni,G.和Leucari,V.(2001年)。有向非循环图的模型确定。统计学家50 243–256。JSTOR公司:·数字对象标识代码:10.1111/1467-9884.00275
[22] Cooper,G.F.和Herskovits,E.(1992年)。从数据中归纳概率网络的贝叶斯方法。机器学习9 309–347·Zbl 0301.68092号 ·doi:10.1109/TIT.1974.1055259
[23] Cowell,R.G.、Dawid,A.P.、Lauritzen,S.L.和Spiegelhalter,D.J.(1999)。概率网络和专家系统。纽约州施普林格·Zbl 0937.68121号 ·doi:10.1007/b97670
[24] Cox,D.R.和Wermuth,N.(1993年)。链图表示的线性相关性。统计师。科学。8 204–218. ·Zbl 0955.62593号 ·doi:10.1214/ss/1177010887
[25] Cox,D.R.和Wermuth,N.(1996年)。多元相关性。查普曼和霍尔,伦敦·兹伯利0880.62124
[26] Dahlhaus,R.(2000)。多元时间序列的图形交互模型。梅特里卡51 157–172·Zbl 1093.62571号 ·doi:10.1007/s001840000055
[27] Dahlhaus,R.和Eichler,M.(2003)。时间序列分析中的因果关系和图形模型。在高度结构化随机系统中27 115–144。牛津大学出版社。
[28] Dawid,A.P.和Lauritzen,S.L.(1993)。可分解图形模型统计分析中的超马尔科夫定律。安。统计师。21 1272–1317. ·Zbl 0815.62038号 ·doi:10.1214/aos/1176349260
[29] de la Fuente,A.、Bing,N.、Hoeschele,I.和Mendes,P.(2004)。使用偏相关系数发现基因组数据中有意义的关联。生物信息学20 3565–3574。
[30] Dellaportas,P.、Giudici,P.和Roberts,G.(2003年)。不可分解图形高斯模型的贝叶斯推断。Sankhyá65 43–55岁·Zbl 1192.62090号
[31] Dempster,A.P.(1972年)。协方差选择。生物统计学28 157–175。
[32] Didelez,V.(2007)。可组合有限马尔可夫过程的图形模型。扫描。J.统计。34 169–185. ·Zbl 1142.62052号 ·doi:10.1111/j.1467-9469.2006.00528.x
[33] Didelez,V.、Pigeot,I.、Dean,K.和Wister,A.(2002)。图形交互和逻辑回归建模的比较分析:自我护理和应对晚年慢性病。生物。J.44第410-432页·doi:10.1002/1521-4036(200206)44:4<410::AID-BIMJ410>3.0.CO;2-O型
[34] Dobra,A.、Hans,C.、Jones,B.、Nevins,J.R.、Yao,G.和West,M.(2004)。探索基因表达数据的稀疏图形模型。《多元分析杂志》。90 196–212. ·Zbl 1047.62104号 ·doi:10.1016/j.jmva.2004.02.009
[35] Drton,M.和Eichler,M.(2006年)。交替马尔可夫性质下高斯链图模型的最大似然估计。扫描。J.统计。33 247–257. ·Zbl 1125.62086号 ·数字对象标识代码:10.1111/j.1467-9469.2006.00482.x
[36] Drton,M.和Perlman,M.D.(2004年)。高斯浓度图的模型选择。生物特征91 591–602·Zbl 1108.62098号 ·doi:10.1093/biomet/91.3591
[37] Drton,M.和Perlman,M.D.(2007年)。高斯图形模型选择的正弦方法。J.统计。计划。推理·Zbl 1130.62068号 ·doi:10.1016/j.jspi.2007.05.035
[38] Dudoit,S.、Shaffer,J.P.和Boldrick,J.C.(2003)。微阵列实验中的多重假设检验。统计师。科学。18 71–103. ·Zbl 1048.62099号 ·数字对象标识代码:10.1214/ss/1056397487
[39] Dudoit,S.、van der Laan,M.J.和Pollard,K.S.(2004)。多次测试。I.控制一般I类错误率的单步程序。统计应用程序。基因。分子生物学。3 1–71. ·Zbl 1166.62338号 ·doi:10.2202/1544-6115.1040
[40] Edwards,D.和Havránek,T.(1985年)。多维列联表中模型搜索的快速过程。生物计量学72 339–351。JSTOR公司:·Zbl 0576.62067号 ·doi:10.1093/biomet/72.2.339
[41] Edwards,D.和Havránek,T.(1987年)。大型模型族的快速模型选择过程。J.Amer。统计师。协会82 205–211。JSTOR公司:·Zbl 0607.62086号 ·doi:10.2307/2289155
[42] Edwards,D.M.(2000)。《图形建模导论》,第二版,施普林格出版社,纽约·Zbl 0952.62003号 ·doi:10.1007/978-1-4612-0493-0
[43] Efron,B.、Tibshirani,R.、Storey,J.D.和Tusher,V.(2001)。微阵列实验的经验贝叶斯分析。J.Amer。统计师。协会96 1151–1160。JSTOR公司:·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[44] Eichler,M.(2007)。多元时间序列的Granger-可用性和路径图。《计量经济学杂志》137 334–353·Zbl 1360.62455号 ·doi:10.1016/j.jeconom.2005.06.032
[45] Fried,R.和Didelez,V.(2003)。多元时间序列图形模型的分解和选择。生物特征90 251–267·Zbl 1036.62072号 ·doi:10.1093/biomet/90.2.251
[46] Friedman,N.(2004)。使用概率图形模型推断蜂窝网络。科学303 799–805。
[47] Frydenberg,M.(1990年)。链图的马尔可夫性质。扫描。J.统计。17 333–353·Zbl 0713.60013号
[48] Giudici,P.和Green,P.J.(1999)。可分解图形高斯模型确定。生物特征86 785–801。JSTOR公司:·Zbl 0940.62019号 ·doi:10.1093/生物技术/86.4785
[49] Heckerman,D.、Geiger,D.和Chickering,D.M.(1995)。学习贝叶斯网络:知识和统计数据的结合。机器学习20 197–243·Zbl 0831.68096号
[50] Holm,S.(1979年)。一个简单的顺序拒绝多重测试程序。扫描。J.统计。6 65–70. ·Zbl 0402.62058号
[51] Jensen,F.V.(2001年)。贝叶斯网络和决策图。纽约州施普林格·Zbl 0973.62005号
[52] Jojic V.、Jojic N.、Meek C.、Geiger D.、Siepel A.、Haussler D.和Heckerman D.(2004)。从数据中学习系统发育HMM模型的有效近似。生物信息学20 I161–I168。
[53] Jones,B.、Carvalho,C.、Dobra,A.、Hans,C.、Carter,C.和West,M.(2005年)。高维图形模型的随机计算实验。统计师。科学。20 388–400. ·Zbl 1130.62408号 ·doi:10.1214/088342305000000304
[54] Jordan,M.I.(2004)。图形模型。统计师。科学。19 140–155. ·Zbl 1057.62001号 ·doi:10.1214/0883423040000026
[55] Kauermann,G.(1996)。关于图形高斯模型的对偶。扫描。J.统计。23 105–116. ·Zbl 0912.62006号
[56] Koster,J.T.A.(1999)。具有相关误差的高斯结构方程组路径图的马尔可夫解释的有效性。扫描。J.统计。26 413–431. ·Zbl 0947.60057号 ·doi:10.111/1467-9469.00157
[57] Kreiner,S.(1987)。通过精确条件测试分析多维列联表:技术和策略。扫描。J.统计。14 97–112. ·Zbl 0636.62048号
[58] Lauritzen,S.L.(1996)。图形模型。牛津大学出版社,纽约·Zbl 0907.62001
[59] Lauritzen,S.L.(2001)。图形模型的因果推断。《复杂随机系统》(Eindhoven,1999)63-107。查普曼和霍尔/CRC,佛罗里达州博卡拉顿·Zbl 1010.62004号
[60] Lauritzen,S.L.和Sheehan,N.A.(2003年)。遗传分析的图形模型。统计师。科学。18 489–514. ·Zbl 1055.62126号 ·doi:10.1214/ss/1081443232
[61] Lauritzen,S.L.和Wermuth,N.(1989年)。变量之间关联的图形模型,其中一些是定性的,一些是定量的。安。统计师。17 31–57. ·Zbl 0669.62045号 ·doi:10.1214/aos/1176347003
[62] Lehmann,E.L.和Romano,J.P.(2005)。全系列错误率的推广。安。统计师。33 1138–1154. ·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[63] Levitz,M.、Perlman,M.D.和Madigan,D.(2001年)。AMP链图Markov模型的分离性和完备性。安。统计师。29 1751–1784. ·Zbl 1043.62080号 ·doi:10.1214/aos/1015345961
[64] Li,H.和Gui,J.(2006)。稀疏高斯浓度图的梯度定向正则化及其在遗传网络推理中的应用。生物统计学7 302–317·Zbl 1169.62378号 ·doi:10.1093/生物统计学/kxj008
[65] Madigan,D.和Raftery,A.E.(1994年)。模型选择和使用Occam窗口计算图形模型中的模型不确定性。J.Amer。统计师。协会89 1535–1546·Zbl 0814.62030号 ·doi:10.2307/2291017
[66] Magwene,P.M.和Kim,J.(2004年)。使用一阶条件独立性估计基因组共表达网络。基因组生物学5 R100。
[67] Matsuno,T.、Tominaga,N.、Arizono,K.、Iguchi,T.和Kohara,Y.(2006年)。基于各种化学刺激诱导的表达偏差模式的基因关联结构的图形高斯建模。IEICE信息与系统交易E89-D 1563–1574。
[68] McAuliffe,J.D.、Pachter,L.和Jordan,M.I.(2004)。多序列功能注释和广义隐马尔可夫系统发育。生物信息学20 1850–1860。
[69] Meinshausen,N.和Bühlmann,P.(2005年)。一般依赖结构下多重关联测试的假零假设数的下限。生物特征92 893–907·Zbl 1151.62308号 ·doi:10.1093/biomet/92.4.893
[70] Meinshausen,N.和Bühlmann,P.(2006)。用拉索选择高维图和变量。安。统计师。34 1436–1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[71] Mohamed,W.N.、Diamond,I.和Smith,P.F.(1998年)。马来西亚婴儿死亡率的决定因素:图形链建模方法。J.罗伊。统计师。Soc.序列号。A 161 349–366。
[72] Olkin,I.和Siotani,M.(1976年)。相关矩阵函数的渐近分布,收录于概率统计论文235-251。东京津津信子·Zbl 0369.62056号
[73] Pearl,J.(2000)。因果关系。剑桥大学出版社,剑桥·Zbl 0959.68116号
[74] Pearl,J.和Wermuth,N.(1994年)。关联图什么时候可以接受因果解释?《从数据中选择模型:人工智能和统计学IV》(P.Cheeseman等人,编辑)。统计中的课堂笔记。89 205–214. 纽约州施普林格·Zbl 0828.05060号
[75] Pollard,K.S.和van der Laan,M.J.(2004年)。在基于重采样的多重测试中选择零分布。J.统计。计划。推论125 85–100·Zbl 1074.62009年 ·doi:10.1016/j.jspi.2003.07.019
[76] Richardson,T.S.(2003)。非循环有向混合图的Markov性质。扫描。J.统计。30 145–157. ·Zbl 1035.60005号 ·doi:10.111/1467-9469.00323
[77] Richardson,T.S.和Spirtes,P.(2002)。祖先图马尔可夫模型。安。统计师。30 962–1030. ·Zbl 1033.60008号 ·doi:10.1214/aos/1031689015
[78] Romano,J.P.和Wolf,M.(2005)。多重测试中广义错误率的控制。苏黎世大学经济学实证研究所第245号工作文件。可在http://www.iew.unizh.ch/wp/iewwp245.pdf。
[79] Roverato,A.(1996年)。图形高斯模型中的偏相关系数比较。在COMPSTAT中。计算统计学论文集,第12届429–434研讨会。海德堡物理学。
[80] Roverato,A.(2002年)。不可分解图的超逆Wishart分布及其在高斯图形模型贝叶斯推理中的应用。扫描。J.统计。29 391–411. ·Zbl 1036.62027号 ·doi:10.1111/1467-9469.00297
[81] Roverato,A.和Consonni,G.(2004年)。有向非循环图模型的兼容先验分布。J.R.统计社会服务。B统计方法。66 47–61. ·Zbl 1062.62050 ·文件编号:10.1111/j.1467-9868.2004.00431.x
[82] Roverato,A.和Whittaker,J.(1998年)。Isserlis矩阵及其在不可分解图形高斯模型中的应用。生物特征85 711–725。JSTOR公司:·Zbl 0946.62031号 ·doi:10.1093/biomet/85.3.711
[83] Schäfer,J.和Strimmer,K.(2005年)。一种推断大规模基因关联网络的经验贝叶斯方法。生物信息学21 754–764。
[84] Schwarz,G.(1978年)。估算模型的维度。安。统计师。6 461–464. ·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[85] 什伊达克(1967)。多元正态分布均值的矩形置信区。J.Amer。统计师。协会62 626–633。JSTOR公司:·Zbl 0158.17705号 ·doi:10.2307/2283989
[86] Smith,P.(1992)。评估图形建模时使用的模型选择程序的威力。计算统计学(Y.Dodge和J.Whittaker编辑)275-280。海德堡物理学。
[87] Spites,P.、Glymour,C.和Scheines,R.(2000)。因果、预测与搜索,第二版,麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0806.62001
[88] Studen,M.(2005)。概率条件独立结构。斯普林格,伦敦·Zbl 1070.62001号
[89] Studení,M.和Bouckaert,R.R.(1998)。描述条件独立结构的链上图模型。安。统计师。26 1434–1495. ·Zbl 0930.62066号 ·doi:10.1214/aos/1024691250
[90] Studení,M.和Roverato,A.(2006年)。AMP链图等价类的图形表示。J.马赫。学习。第7号决议1045-1078·Zbl 1222.60052号
[91] van der Laan,M.J.、Dudoit,S.和Pollard,K.S.(2004年a)。控制广义家族错误率和假阳性比例的尾部概率的增强程序。统计应用程序。遗传学。分子生物学。3 1–27. ·兹比尔1166.62379
[92] van der Laan,M.J.、Dudoit,S.和Pollard,K.S.(2004b)。多次测试。二、。控制家庭错误率的逐步降低程序。统计应用程序。遗传学。分子生物学。3 1–35. ·兹比尔1166.62378
[93] van der Vaart,A.W.(1998)。渐进统计。剑桥大学出版社·Zbl 0910.62001号 ·doi:10.1017/CBO978051180225
[94] Wermuth,N.(1976年)。列联表中乘法模型与协方差选择之间的类比。生物统计学32 95–108。JSTOR公司:·Zbl 0357.62049号 ·doi:10.2307/2529341
[95] Wermuth,N.(1980年)。线性递归方程、协方差选择和路径分析。J.Amer。统计师。协会75 963–972·Zbl 0475.62056号 ·doi:10.2307/2287189
[96] Wermuth,N.和Cox,D.R.(2004)。三角形系统诱导的联合响应图和分离。J.R.统计社会服务。B统计方法。66 687–717. ·Zbl 1050.05116号 ·文件编号:10.1111/j.1467-9868.2004.b5161.x
[97] Wermuth,N.、Cox,D.R.和Marchetti,G.M.(2006年)。协方差链。伯努利12 841–862·Zbl 1134.62031号 ·doi:10.3150/bj/1161614949
[98] Wermuth,N.和Lauritzen,S.L.(1990年)。关于实质性研究假设、条件独立图和图链模型。J.罗伊。统计师。Soc.B 52 21–50、51–72。JSTOR公司:·Zbl 0749.62004号
[99] Westfall,P.H.和Young,S.(1993年)。基于重采样的多重测试:(p\)值调整的示例和方法。纽约威利·Zbl 0850.62368号
[100] Whittaker,J.(1990年)。应用多元统计中的图形模型。奇切斯特·威利·Zbl 0732.62056号
[101] Wille,A.和Bühlmann,P.(2006)。用于推断遗传网络的低阶条件独立图。统计应用程序。基因。分子生物学。5 . ·Zbl 1166.62374号 ·doi:10.2202/1544-6115.1170
[102] Wille,A.、Zimmermann,P.、Vranova,E.、Fürholz,A.、Laule,O.、Bleuler,S.、Hennig,L.、Prelic,A.、von Rohr,P.,Thiele,L.,Zitzler,E.、Gruissem,W.和Bühlmann,P(2004)。拟南芥类异戊二烯基因网络的稀疏图形高斯模型。基因组生物学5 R92。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。