跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
2015年3月;47(3):284-90.
doi:10.1038/ng.3190。 Epub 2015年2月2日。

高效的贝叶斯混合模型分析提高了大规模队列中的关联能力

附属公司

高效的贝叶斯混合模型分析提高了大规模队列中的关联能力

波鲁洛等。 自然基因 2015年3月

摘要

线性混合模型是一种强大的统计工具,用于识别遗传关联并避免混淆。然而,现有方法在大规模队列中计算困难,可能无法优化功率。所有现有的方法都需要时间成本O(MN(2))(其中N是样本数,M是SNP数),并隐式假设效应大小正态分布的无限小遗传结构,这可能会限制功率。在这里,我们提出了一种更有效的混合模型关联方法,BOLT-LMM,它只需要少量的O(MN)时间迭代,并通过在标记效应大小之前通过贝叶斯混合建模更真实、非有限的遗传结构来增加功率。我们将BOLT-LMM应用于来自女性基因组健康研究(WGHS)的23294个样本中的9个定量性状,并观察到功率显著增加,这与模拟一致。理论和模拟表明,随着队列规模的增加,功率增加,使得BOLT-LMM对大规模队列的全基因组关联研究具有吸引力。

PubMed免责声明

数字

图1
图1。混合模型关联方法的计算性能
对数长度图()运行时间和(b条)记忆作为样本大小的函数(N个). 曲线斜率对应于幂律缩放指数N个对模拟数据集进行基准测试,其中每个样本都是从WTCCC2数据集中的2个随机“父母”中生成的基因型数据的马赛克(N个=15,633,M(M)=360K),表型用M(M)因果关系的=5000名SNP解释小时2因果关系的=0.2的表型方差。报告的运行时间是使用2.27 GHz Intel Xeon L5640处理器的一个内核的五次相同运行的中位数。我们注意到,运行时间比较可能会随着计算环境的变化而变化一个小的常数因子。FaST-LMM-Select(分别是GCTA-LOCO、EMMAX)内存使用超过96GBN个=15K(分别为30K和60K)。GEMMA在处遇到运行时错误(分段错误)N个=30公里。软件版本:FaST LMM Select v2.07;GCTA-LOCO,v1.24;EMMAX,v20120210;GEMMA,v0.94。数值数据见补充表1。
图2
图2。BOLT-LMM增加了在仿真中检测关联的能力
平均值χ2标准化效应下SNP作为()因果SNP的数量(b条)由因果SNP解释的方差比例(c(c))样本数量。模拟使用WTCCC2数据集中的真实基因型(N个=15,633,M(M)=360K)和模拟表型,其中特定数量的因果SNPs解释了特定比例的表型变异,另外60个标准化效应SNPs解释了额外2%的变异。误差条,s.e.m.,100个模拟。我们在前5次模拟中验证了BOLT-LMM-inf和GCTA-LOCO统计数据几乎相同(补充表7)。补充表2中提供了数值数据。
图3
图3。BOLT-LMM增强了检测WGHS表型关联的能力
我们使用10个主成分、标准(无穷小)混合模型分析和BOLT-LMM高斯混合模型分析来比较线性回归的功率(使用两个大致等效的指标测量)。(a)χ增加百分比2使用混合模型方法对已知基因座的统计与主成分分析:χ和比率2统计最高LD的类型SNP和已发表的相关SNP。(b)预测R(右)25倍交叉验证的值:依次省略每个倍,通过同时拟合所有SNP效应(对于混合模型方法)或使用训练倍估计协变量效应(对于PCA)来计算预测。(注意,BOLT-LMM-inf在这里等价于BLUP预测。)我们在中显示了PCA(b)因为PC解释的少量差异(由于人口分层)提供了一个基线,可以转换预测R(右)2与PC协变量的混合模型关联与回归的功率增益。也就是说,关联能力和预测准确性之间的对应关系是(a)大致对应于(b)和类似的蓝色条(在线方法)。错误栏,折弯s.e.超过(a)已知位点(补充表8);(b)5个交叉验证折叠。数值数据见补充表9。

类似文章

引用人

  • NIHR生物资源基因和认知队列参与者的认知随年龄变化的动态及其遗传基础。
    Rahman MS、Harrison E、Biggs H、Seikus C、Elliott P、Breen G、Kingston N、Bradley JR、Hill SM、Tom BDM、Chinnery PF。 Rahman MS等人。 《国家医学杂志》,2024年5月14日。doi:10.1038/s41591-024-02960-5。打印前在线。 《国家医学》,2024年。 PMID:38745010
  • 血清尿酸盐的大规模跨祖先全基因组荟萃分析。
    Cho C、Kim B、Kim DS、Hwang MY、Shim I、Song M、Lee YC、Jung SH、Cho SK、Park WY、Myung W、Kim BJ、Do R、Choi HK、Merriman TR、Kim YJ、Won HH。 Cho C等人。 国家通讯社。2024年4月24日;15(1):3441. doi:10.1038/s41467-024-47805-4。 国家通讯社。2024 PMID:38658550 免费PMC文章。
  • 全基因组关联分析确定了95个风险位点,并为创伤后应激障碍的神经生物学提供了见解。
    Nievergelt CM、Maihofer AX、Atkinson EG、Chen CY、Choi KW、Coleman JRI、Daskalakis NP、Duncan LE、Polimanti R、Aaronson C、Amstadter AB、Andersen SB、Andreassen OA、Arbisi PA、Ashley-Koch AE、Austin SB、AvdibegoviçE、BabićD、Bacanu SA、Baker DG、Batzler A、Beckham JC、Belangero S、Benjet C、Bergner C、Bierer LM、Biernacka JM、Bierrut LJ、,Bisson JI、Boks MP、Bolger EA、Brandolino A、Breen G、Bressan RA、Bryant RA、Bustamante AC、Bybjerg-Grauholm J、Békvad-Hansen M、Börglum AD、Bórte S、Cahn L、Calabrese JR、Caldas-de-Almeida JM、Chatzinakos C、Cheema S、Clouston SAP、Colodro-Conde L、Coombes BJ、Cruz-Fuentes CS、Dale AM、Dalvie S、Davise LK、Deckert J、Delahanty DL、Denny是MF,Desarnaud F、DiPietro CP、Disner SG、Docherty AR、Domschke K、Dyb G、KulenovićAD、Edenberg HJ、Evans A、Fabbri C、Fani N、Farrer LA、Feder A、Feeny NC、Flory JD、Forbes D、Franz CE、Galea S、Garrett ME、Gelaye B、Gelernter J、Geuze E、Gillespie CF、Goleva SB、Gordon SD、Goçi A、Grasser LR、Guindalini C、Haas M、Hagenaars S、Hauser MA、Heath交流,Hemmings SMJ、Hesselbrock V、Hickie IB、Hogan K、Hougaard DM、Huang H、Huckins LM、Hveem K、JakovljevićM、Javanbakht A、Jenkins GD、Johnson J、Jones I、Jovanovic T… 完整作者列表见摘要 Nievergelt CM等人。 自然遗传学。2024年5月;56(5):792-808. doi:10.1038/s41588-024-01707-9。Epub 2024年4月18日。 自然遗传学。2024 PMID:38637617
  • 与出生体重相关的罕见变异确定了与脂肪组织调节、胎盘功能和胰岛素样生长因子信号有关的基因。
    Kentistou KA、Lim BEM、Kaisinger LR、Steinthorsdottir V、Sharp LN、Patel KA、Tragante V、Hawkes G、Gardner EJ、Olafsdottir T、Wood AR、Zhao Y、Thorleifsson G、Day FR、Ozanne SE、Hattersley AT、O'Rahilly S、Stefanson K、Ong KK、Beaumont RN、Perry JRB、Freathy RM。 Kentistou KA等人。 medRxiv[预打印]。2024年4月3:2024.04.03.24305248。doi:10.1101/2024.04.03.24305248。 医学研究。2024 PMID:38633783 免费PMC文章。 预打印。
  • 遗传相关性和孟德尔随机化分析支持饮食习惯和月经初潮年龄之间的因果关系。
    郭锐,冯锐,杨杰,肖勇,尹C。 郭R等。 科学报告,2024年4月10日;14(1):8425。doi:10.1038/s41598-024-58999-4。 科学报告2024。 PMID:38600095 免费PMC文章。

工具书类

    1. Yu J等。一种用于关联映射的统一混合模型方法,用于解释多个层次的关联性。自然遗传学。2006;38:203–208.-公共医学
    1. Kang HM等。模型生物关联映射中种群结构的有效控制。遗传学。2008;178:1709–1723.-项目管理咨询公司-公共医学
    1. Kang HM等。用于解释全基因组关联研究中样本结构的方差分量模型。自然遗传学。2010;42:348–354.-项目管理咨询公司-公共医学
    1. Zhang Z等。适用于全基因组关联研究的混合线性模型方法。自然遗传学。2010;42:355–360.-项目管理咨询公司-公共医学
    1. Lippert C等人,全基因组关联研究的FaST线性混合模型。自然方法。2011;8:833–835.-公共医学

参考文献(在线方法)

    1. Chen W-M,Abecasis GR.全基因组关联扫描的家族关联测试。美国人类遗传学杂志。2007;81:913–926.-项目管理咨询公司-公共医学
    1. Aulchenko YS,De Koning D-J,Haley C.使用混合模型和回归的全基因组快速关联:基于全基因组系谱的数量性状位点关联分析的快速简便方法。遗传学。2007;177:577–585.-项目管理咨询公司-公共医学
    1. Chen W-M、Manichaikul A、Rich SS。二分性状的广义家族关联检验。美国人类遗传学杂志。2009;85:364–376.-项目管理咨询公司-公共医学
    1. Boyd SP,Vandenberghe L.凸优化。剑桥大学出版社;2004
    1. Yang J,等。使用常见SNP对复杂性状的遗传变异进行基因组划分。自然遗传学。2011;43:519–525.-项目管理咨询公司-公共医学

出版物类型