×

多维列联表中遗传平衡蒙特卡罗检验的马尔可夫链。 (英语) Zbl 0871.62094号

摘要:哈代-温伯格平衡和连锁平衡是群体遗传学中的基本概念。实际上,在单倍型数据中测试连锁平衡相当于在大型、稀疏、多维列联表中测试独立性。在多位点基因型数据上同时测试Hardy-Weinberg和连锁平衡引入了信息缺失和边缘概率对称约束的额外复杂性。为了避免稀疏列联表的不可靠大样本近似,可以使用精确的测试,如Fisher经典测试,该测试条件是观察到的边际总和。不幸的是,计算精确测试的(p)值通常是不可行的,因为有大量的表与观察表的边际总和一致。
我们在这里发展了马尔可夫链,用于从适当的条件分布中进行抽样,以测试遗传平衡。这些链与我们提出的并行、独立采样方法相比具有优势。对于(J)位点上的(n)单倍型观察,马尔可夫链以[(J-1)n ln n]/2+O(n)]步收敛到其平稳分布,可以作为估计(p)值的有效工具。我们对这些结果的理论处理涉及到强平稳停止时间、顺序统计、大偏差和泊松过程的嵌入。我们包括一些关于应用强平稳时间来限定样本平均估计量的精度和偏差的一般结果。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学
65二氧化碳 蒙特卡罗方法
62H17型 应急表

软件:

AS 144标准
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] AGRESTI,A.1992年。列联表精确推断综述。统计师。科学。7 131 177. Z.公司·Zbl 0955.62587号 ·doi:10.1214/ss/1177011454
[2] ALDOUS,D.和DIACONIS,P.1986年。洗牌和停止时间。阿默尔。数学。每月93 333 348。Z.JSTOR公司:·Zbl 0603.60006号 ·doi:10.2307/2323590
[3] BARNARD,G.1963年。M.S.Bartlett对“点过程的谱分析”的讨论。J.罗伊。统计师。Soc.系列。B 25 294。Z.JSTOR公司:
[4] BESAG,J.和CLIFFORD,P.1989年。广义蒙特卡罗显著性检验。生物特征76 633 642。Z.JSTOR公司:·Zbl 0679.62033号 ·doi:10.1093/biomet/76.4.633
[5] BLOM,G.和HOLST,L.1991年。在概率中嵌入离散问题的程序。数学。科学。16 27 40. Z.公司·Zbl 0737.60014号
[6] BOy ETT,J.M.1979年。具有给定行和列总数的随机R C表。J.罗伊。统计师。Soc.系列。C 28 329 332号。Z.CAVALLI-SFORZA,L.L.和BODMER,W.F.1971。人类群体遗传学。旧金山弗里曼。Z.公司。
[7] CROW,J.E.1988年。80年前:人口遗传学的开始。遗传学119 473 476。Z.公司。
[8] 大卫·H·A·1981。订单统计。威利,纽约州·Zbl 0553.62046号
[9] 迪亚康尼斯,P.1988。概率统计中的群表示。IMS,加利福尼亚州海沃德·Zbl 0695.60012号
[10] DIACONIS,P.和STURMFELS,B.1996。条件分布抽样的代数算法。未发表的手稿。Z.公司。
[11] ELSTON,R.和FORTHOFER,R.,1977年。小样本哈迪-温伯格平衡测试。生物计量学33 536 542。Z.公司·兹伯利0371.62146 ·doi:10.2307/2529370
[12] EMIGH,T.1980。Hardy-Weinberg平衡测试的比较。生物统计学36 627 642。Z.JSTOR公司:·Zbl 0446.62111号 ·doi:10.2307/2556115
[13] FELLER,W.1968年。《概率及其应用导论》第1卷第3版,威利出版社,纽约·Zbl 0155.23101号
[14] GORADIA,T.M.、LANGE,K.、MILLER,P.L.和NADKARNI,P.M.,1992年。快速计算人类系谱数据的遗传可能性。人类遗传42 42 62。Z.公司。
[15] GRAHAM,R.L.、KNUTH,D.E.和PATASHNIK,O.1989年。具体数学。马萨诸塞州雷丁市Addison-Wesley·Zbl 0668.00003号
[16] 郭S.和汤普森E.,1992年。对多个等位基因的Hardy-Weinberg比例进行精确测试。生物识别48 361 372。Z.公司·Zbl 0825.62835号 ·doi:10.2307/2532296
[17] HALDANE,J.1954年。交配随机性的精确测试。遗传学杂志52 631 635。Z.公司。
[18] 哈斯廷斯,W.K.1970。使用马尔可夫链的蒙特卡罗抽样方法及其应用。生物特征57 97 109。Z.公司·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[19] KARLIN,S.和TAy LOR,H.M.1975年。随机过程第一课程。学术出版社,纽约。
[20] KELLY,F.P.1979年。可逆性和随机网络。威利,纽约州·Zbl 0422.60001号
[21] KOLASSA,J.E.和TANNER,M.A.,1994年。通过Gibbs采样器在指数族中进行近似条件推断。J.艾默。统计师。协会89 697 702。Z.JSTOR公司:·Zbl 0803.62013年 ·doi:10.2307/2290874
[22] 兰格,K.1993。遗传连锁平衡的随机模型。理论。人口生物学。44 129 148. ·Zbl 0783.92022号 ·doi:10.1006/tpbi.1993.1022
[23] LAZZERONI,L.C.,ARNHEM,N.,SCHMITT,K.和LANGE,K.,1994年。精子注射数据的多点映射计算。美国人类遗传学杂志55 431 436。Z.公司。
[24] LEVENE,H.1949年。关于遗传学中出现的匹配问题。安。数学。统计师。20 91 94. Z.公司·Zbl 0031.37402号 ·doi:10.1214/aoms/1177730093
[25] LI,C.C.1955年。群体遗传学。芝加哥大学出版社。Z.公司。
[26] 路易斯·E和德梅斯特·E,1987年。哈迪·温伯格和多重等位基因的精确检测。生物识别43 805 811。Z.公司·Zbl 0715.62266号 ·数字对象标识代码:10.2307/2531534
[27] 马修斯,P.1988。随机换位的强一致时间。J.理论。普罗巴伯。1 411 423. Z.公司·Zbl 0716.60074号 ·doi:10.1007/BF01048728
[28] NIJENHUIS,A.和WILF,H.S.1978。组合算法。学术出版社,纽约·Zbl 0476.68047号
[29] SEN,P.K.和SINGER,J.M.1993年。统计学中的大样本方法。查普曼和霍尔,纽约州·Zbl 0867.62003号
[30] VERBEEK,A.和KROONENBERG,P.M.1985年。具有固定边距的列联表中测试统计量精确分布的算法综述。计算。统计师。数据分析。3 159 285. Z.公司·Zbl 0586.62083号 ·doi:10.1016/0167-9473(85)90080-5
[31] WEIR,B.S.1990年。遗传数据分析。桑德兰西诺联合公司。Z.公司。
[32] WEIR,B.S.和BROOKS,L.D.,1986年。人类染色体11p的不平衡。Genetic Z.流行病学增补1 177 183。
[33] 加利福尼亚州斯坦福德94305 ANN ARBOR,MICHIGAN 48109电子邮件:laura@游戏fair.stanford.edu电子邮件:klange@sph.umich.edu
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。