软件

LDSPEC公司

(2023年12月)可以下载LDSPEC软件在这里LD SNP对效应相关回归(LDSPEC)是一种根据近端SNP的等位基因频率、LD和功能注释来估计衍生等位基因的因果效应大小相关性的方法。我们的手稿中提供了进一步的细节,“近端SNP的因果效应之间的普遍相关性随着功能注释的不同而变化,并暗示稳定选择”(Zhang等人医学博士).

自动取款机

(2023年1月)ATM软件可以下载在这里年龄相关主题建模(ATM)方法提供了大型EHR数据集中数百种不同疾病的纵向记录的低阶表示,从而能够基于异质共病特征识别疾病亚型。我们的手稿《英国生物银行中与年龄相关的共病主题模型确定具有不同遗传风险的疾病亚型》提供了更多详细信息(Jiang等人,2023年).

TCSC公司

(2022年8月)可以下载TCSC软件在这里组织共调节评分回归(TCSC)是一种联合分析GWAS和基因表达数据的方法,用于从标记组织中分离出因果组织,并将疾病遗传力(或两种疾病/性状之间的协方差)划分为组织特异性成分,正如我们的手稿“建模组织共同调节以估计组织特异性对疾病的贡献”所述(Amariuta等人,2023年).

scDRS系统

(2021年9月)可以下载scDRS软件在这里.scDRS是一种将scRNA-seq与单个细胞分辨率的多基因疾病风险联系起来的方法,如我们的手稿“多基因富集区分单个细胞RNA-seqdata中单个细胞的疾病关联”所述(Zhang*、Hou*等人,2022年).

S2G公司

(2021年8月)可以下载S2G软件在这里S2G软件可用于估计SNP-基因链接(S2G策略)的精确度和召回率,并构建组合S2G策略,以优化其对疾病风险的信息性,如我们的手稿“组合SNP-基因组链接策略以识别疾病基因并评估疾病的全能性”所述(Gazal等人。2022).

GCSC公司

(2021年7月)可以下载GCSC软件在这里GCSC是一种利用基因共调控来鉴定富含疾病遗传力的基因集的方法,如我们的手稿“利用基因共调控来鉴定富含疾病遗传力的基因集”所述(Siewert-Rocks等人,2022年).

Sc-linker公司

(2021年5月)Sc-linker是一个框架,用于整合scRNA-seq、表观遗传图谱和GWAS汇总统计数据,推断遗传变异影响疾病的潜在细胞类型和过程,正如我们的手稿《通过整合单细胞图谱和人类遗传学来识别人体内疾病关键细胞类型和细胞过程》中所述(Jagadeesh*、Dey*等人,2022年). 构建细胞类型、疾病进展和细胞过程基因程序的软件可以下载在这里在这里.可以下载经过后处理的scRNA-seq数据、基因程序和增强子-基因链接注释在这里.

PRS-FH系列

(2021年4月)可下载PRS-FH软件在这里PRS-FH是一种利用家族史信息提高多基因风险评分预测准确性的方法,如我们的手稿“合并疾病家族史可提高不同人群的多基因风险得分”所述(Hujoel等人,2022年).

PolyFun、PolyPred和PolyLoc

(2021年1月)可下载实现PolyFun和PolyPred的PolyFun软件在这里PolyFun是一种利用全基因组功能注释提高精细制图能力的方法,如我们的手稿“复杂性状遗传力的功能信息精细制图和多基因定位”所述(Weissbrod等人,2020年). PolyPred是一种通过PolyFun利用精细映射来提高多基因预测准确性的方法,特别是在不同人群中,如我们的手稿“利用精细映射和非欧洲培训数据来提高跨种族多基因风险评分”所述(魏斯布罗德*、卡奈*、施*等人,2022年).

(2019年10月)PolyLoc软件可以下载在这里PolyLoc是一种利用PolyFun的结果对复杂性状遗传力进行多基因定位的方法,如我们的手稿“复杂性状遗传率的功能信息精细定位和多基因定位”所述(Weissbrod等人,2020年).

DeepBoost/Imperio公司

(2020年9月)可以下载DeepBoost/Imperio软件在这里该软件包括(i)DeepBoost,一种梯度增强方法,用于通过将深度学习等效应注释与精细映射SNP集成来构建增强的深度学习注释;(ii)将这些深度学习注释与SNP-to-gene(S2G)链接策略和相关基因集相结合的工具,以及(iii)Imperio,一种将深度学习注释和S2G策略相结合的方法,用于预测全血中的基因表达,并基于预测表达的变化构建等位效应注释。这三种方法在血液相关性状中的应用在我们的手稿《提高人类复杂疾病深度学习模型信息性的综合方法》中进行了描述(Dey等人,biorxiv). 可以下载注释在这里.

GSSG公司

(2020年9月)可以下载GSSG软件在这里GSSG包括生成血液中增强子驱动和主调节基因得分的工具,并将这些基因得分与远端和近端SNP-to-gene(S2G)链接策略相结合,构建血液相关性状的SNP注释,正如我们的手稿“使用功能知情的SNP到基因连接策略揭示增强子驱动和主调节基因对自身免疫性疾病的独特贡献”(Dey等人,2022年). 可以下载基因评分、S2G链接和SNP注释在这里.

CC-GWAS公司

(2020年3月)CC-GWAS软件可以下载在这里CC-GWAS是一种使用各自病例对照GWAS的汇总统计数据测试两种不同疾病患者的等位基因频率差异的方法,如我们的手稿“使用CC-GWAS识别八种精神疾病患者中具有不同等位基因频度的基因座”所述(Peyrot等人,2021年).

公告增强

(2020年1月)可以下载AnnotBoost软件和注释在这里AnnotBoost是一个基于梯度增强的框架,用于插补和去噪孟德尔病源性致病性评分,以提高其对常见疾病的信息性,如我们的手稿“改善孟德尔病基性致病性得分对常见疾病信息性的影响”所述(Kim等人,2020年).

S-LDXR公司

(2019年10月)可以下载S-LDXR软件在这里.S-LDXR是一种跨基因组注释的平方跨种族遗传相关性分层方法,如我们的手稿“受选择影响的功能重要区域的人群特异性因果疾病影响大小”所述(Shi等人,2021年).

长期-FH

(2019年7月)LT-FH软件可以下载在这里.LT-FH是一种利用家族史信息提高关联力的方法,如我们的手稿“结合病例对照状态和疾病家族史增加关联力”所述(Hujoel等人,2020年)

LD预失效

(2019年1月)可以下载LDpred-funct软件在这里LDpred-funct是一种利用功能富集来提高多基因预测准确性的方法,如我们的手稿“建模功能富集提高了英国生物银行和23andMe数据集的多基因预测精度”所述(Marquez-Luna等人,2021年).

LD得分

(2018年10月更新)可下载ldsc软件在这里.LD得分回归(Bulik-Sullivan等人2015年a)是一种在全基因组关联研究中区分混杂和多基因性的方法。分层LD得分回归(Finucane等人,2015年功能注释在这里)是一种使用GWAS汇总统计按功能类别划分遗传力的方法。横向LD评分回归(Bulik-Sullivan等人2015年b)是一种使用GWAS汇总统计估计遗传相关性的方法。我们将分层LD评分回归扩展到基因表达表型(Liu等人,2017年). 我们还将分层LD评分回归扩展到了连续注释(Gazal等人2017). 我们还开发了一种方法,使用分层LD评分回归来确定与疾病相关的组织和细胞类型,这些组织和细胞在特定表达的基因中具有丰富的遗传力(Finucane等人,2018年功能注释在这里). 我们还将分层LD评分回归扩展到低频变量(Gazal等人,2018年功能注释在这里). 我们还确定了古代增强子、跨物种保守的增强子、古代启动子和功能丧失不耐受ExAC基因的启动子的疾病遗传力富集的条件独立信号(Hujoel等人2019年功能注释在这里). 我们还确定了丰富的通路、网络和通路+网络注释,得出结论,具有高网络连通性的基因丰富了疾病的遗传力(Kim等人2019年注释在这里). 我们还确定了转座因子疾病遗传力的条件独立信号(Hormozdiari等人2019年注释在这里). 我们还评估了深度学习等位基因效应注释的疾病遗传力的条件独立信号,得出的结论是,深度学习模型尚未实现其对复杂疾病的全部潜力,并且无法从其预测性调控注释的准确性中推断出其信息性(Dey等人,2020年). 可以下载深度学习注释在这里.

S-LD4M型

(2018年9月)S-LD4M软件可下载在这里该软件实现了我们的分层LD四阶矩回归(S-LD4M)方法,用于估计跨等位基因频率和功能类别的多基因性,如我们的手稿“通过负选择解释复杂性状的多态性”所述(O'Connor等人2019年).

芬兰

(2018年1月)可以下载FINDOR软件在这里该软件实现了我们的风险位点功能信息新发现(FINDOR)方法,如我们的手稿“利用多基因功能富集提高GWAS能力”中所述(Kichaev等人2019年).

生命周期价值

(2017年10月)LCV软件可以下载在这里该软件实现了我们的潜在因果变量(LCV)因果推理方法,如我们的手稿“区分52种疾病和复杂性状的遗传相关性和因果关系”中所述(O'Connor等人,2018年).

有符号LD剖面回归

(2017年10月)可下载签名的LD剖面回归软件在这里如我们的手稿“检测转录因子结合对多基因疾病风险的全基因组定向效应”所述,签名LD剖面回归是一种识别签名功能注释对疾病和复杂性状的全基因组方向效应的方法(Reshef等人,2018年).

分子QTL注释

(2017年10月)我们的手稿“利用分子QTL了解疾病和复杂性状的遗传结构”中描述的分子QTL-注释(Hormozdiari等人,2018年)可以下载在这里分子QTL注释包括从GTEx eQTL数据构建的MaxCPP注释和从BLUEPRINT eQTL、hQTL(H3K27ac和H3K4me1)、sQTL和meQTL数据库构建的MaxCCP注释。

BOLT-LMM和BOLT-REML螺栓

(2017年9月)BOLT-LMM v2.3软件包(Loh等人,2018年),其中包括对英国生物银行使用的BGEN v1.2插补文件格式的多线程支持,可以下载在这里。英国生物银行中所有N=459K欧洲历史样本的BOLT-LMM分析的汇总关联统计数据可用在这里.BOLT-LMM算法(Loh等人2015年a)使用线性混合模型(LMM)快速计算表型和基因型之间关联的统计数据。BOLT-REML算法划分SNP遗传率,并使用蒙特卡罗算法估计遗传相关性,用于快速多成分、多性状建模(Loh等人,2015b). 默认情况下,BOLT-LMM关联分析假设在随机效应归因于SNP(而非被测SNP)之前,存在贝叶斯混合正态分布。该模型概括了以前的混合模型关联方法使用的标准“无穷小”混合模型,提供了一个在控制误报的同时提高关联检测能力的机会。这两种算法都在LMM v2.3螺栓软件包;请参阅更新日志的链接。

本征软的

(2017年6月):现在可以下载EIGENSOFT 7.2.1版。EIGENSOFT软件包结合了我们的群体遗传学方法(Patterson等人,2006)和EIGENSTRAT分层校正方法的功能(Price等人,2006年).EIGENSTRAT方法使用主成分分析,沿连续变化轴明确建模病例和对照之间的祖先差异;由此产生的修正是针对候选标记在祖先群体中的频率变化的,从而最大限度地减少了虚假关联,同时最大限度地提高了检测真实关联的能力。EIGENSOFT软件包具有内置绘图脚本,支持多种文件格式和定量表型。

可以下载最新版本的EIGENSOFT(7.2.1)在这里。可以下载用于在Linux平台上使用EIGENSOFT 6.1.4的源代码、文档和可执行文件在这里.EIGENSOFT 6.x的新功能包括实现非常快速pca近似的快速模式选项(Galinsky等人,2016a,Galinsky等人,2016b)并支持多线程。EIGENSOFT 6.1.4包括pcaselection的错误修复和更好的内存不足诊断消息。我们以前的版本6.1.3可以下载在这里.

提供了EIGENSOFT常见问题解答(Frequently Asked Questions)在这里.

根据欧洲血统样本计算的SNP负荷GERA队列可以下载在这里.

LTSOFT公司

(2017年1月):可以下载LTSOFT 4.0版在这里版本4.0的更改包括在LTMLM软件中添加LT-Fam,实现了与相关个人设置的多元责任阈值混合线性模型(Hayeck等人2017). 版本3.0的更改包括增加了LTMLM,这是一个新的软件,实现了多元责任阈值混合线性模型关联统计,以进一步提高病例控制疾病设置的能力(Hayeck等人,2015年). LTSOFT是一个软件套件,旨在在进行病例对照关联研究时,更有效地利用年龄、体重指数、吸烟状态、性别等临床协变量以及遗传变量(如已知的相关变量)。在标准回归模型中包含这些协变量不仅是次优的,而且在许多情况下会降低功耗。LTSOFT采用了一种责任阈值模型方法,该方法利用已知的流行病学结果来更好地建模协变量与相关表型的关系(Zaitlen等人,2012年公共科学图书馆-遗传学以及Zaitlen等人2012生物信息学).

(2016年5月)The Eagle v2.0软件(Loh等人,2016b)使用阶段参考面板或在基因型队列中估计单倍型阶段。Eagle2现在是桑格密歇根插补服务器,并使用一种新的、非常快速的基于HMM的算法,通过两个关键思想提高了现有方法的速度和准确性。:基于位置Burrows-Wheeler变换的新数据结构和快速搜索算法,该算法仅通过HMM搜索最相关的路径。与Eagle1算法相比(Loh等人,2016a),Eagle2具有相似的速度,但在样本量小于50000时精度要高得多。Eagle软件可以下载在这里.

单倍体SNP

(2015年7月)单倍SNP算法(Bhatia等人,biorxiv)根据阶段性基因型数据构建一组单倍型多态性(单倍型SNP)。单倍型SNP是相邻SNP的单倍型,不包括由跳过的错配引起的屏蔽位点的子集。只有当它们可能被解释为共享背景上的突变时,才会跳过不匹配。这是通过单倍体SNP延伸和错配SNP之间的4配子测试来测试的。如果观察到所有4种可能的等位基因组合,则不能将错配解释为共享背景上的突变,单倍体SNP终止。
如果没有、一条或两条染色体与所有未屏蔽位点的单倍型相匹配,则认为个体携带了0,1或2个单倍型SNP拷贝。由于单倍体SNP是双等位基因,因此可以用于下游分析,如遗传力估计和关联。
可以下载单倍SNP软件在这里.

高效PCGC回归

(2015年6月)PCGC回归(Golan等人,2014年PNAS)旨在避免在已确定的病例对照研究中REML遗传力估计的偏差。我们发布了PCGC回归方法的有效实现。受所有grm都是在相同的个人列表上计算的限制(所有*.grm.id文件必须相同),此实现通过在动态回归变量之间累积点积(即流式处理grm输入),消除了N x N矩阵的内存存储,加速折刀计算(动态存储分区结果),并通过动态投影PC来消除“已清理”GRM的存储(即投影PC)。高效PCGC回归软件用于Loh等人,2015bBhatia等人,biorxiv,并且可以下载在这里.

LDpred公司

(2015年3月)可以下载LDpred软件在这里.LDpred公司(Vilhjalmsson等人,2015年)是一种从汇总关联统计中计算多基因风险得分的方法,同时计算标记之间的LD。该方法使用外部参考面板的效应大小和LD信息的非有限先验分布推断每个标记的后验平均因果效应大小。

SNPWEIGHTS公司

(2014年5月):SNPweights 2.1版可以下载在这里SNPweights是一个软件包,用于使用从大型外部参考面板预先计算的SNP权重推断全基因组遗传祖先(Chen等人,2013年生物信息学). 版本2.0的更改包括美洲原住民参考样本的新SNP权重、SNP权重文件的新格式,以及用户使用自己的参考样本推导SNP权重的新软件。版本2.1在infranc程序中包含了一个bug修复程序,该程序现在可用于所有snpwt文件。可以下载欧洲和西非祖先群体的SNP权重在这里.可以下载欧洲、西非和东亚祖先群体的SNP权重在这里.可以下载欧洲、西非、东亚和美洲原住民祖先的SNP权重在这里可以下载欧美人NW、SE和AJ祖先群体的SNP权重在这里.

功能性公告

(2014年3月):我们的功能遗传力论文中SNPs和区域的功能注释“在11种常见疾病中,调节变异比编码变异解释更多的遗传力”(Gusev等人,2014年)可以下载在这里.

IMPG-概要

(2024年1月):可以下载ImpG-Summary版本1.0在这里ImpG-Summary是一个软件包,用于根据摘要关联统计进行高斯插补,如我们的论文“快速准确地从摘要关联统计插补”所述(Pasaniuc等人,2014年).

万象城

(2012年7月):可以下载MIXSCORE 1.3版在这里MIXSCORE是一种结合SNP关联和混合关联统计的方法,用于提高混合人群中GWAS的能力。有关详细信息,请参阅MIXSCORE纸(Pasaniuc等人,2011年《公共科学图书馆·遗传学》,“混合人群中GWAS的增强统计测试:使用CARe和乳腺癌协会的非裔美国人进行评估”)。

TREESELECT公司

(2012年4月):可以下载TreeSelect 1.1版在这里TreeSelect是一个软件包,用于从密切相关的种群之间不寻常的种群分化中推断自然选择。有关详细信息,请参阅我们的非洲选择文件(Bhatia等人,2011年AJHG,“对CARe和其他队列中的非洲血统人群进行全基因组比较,揭示了自然选择的信号。”)

哈普米克斯

(2011年3月):HAPMIX 1.2版可下载在这里1.2版的改进包括显式检查混合和参考群体等位基因频率之间的不一致,以及将本地祖先估计值插入SNP超集的脚本。HAPMIX是一种利用密集的遗传数据准确推断混合种群中不同大陆祖先染色体片段的应用程序。有关详细信息,请参阅HAPMIX纸(Price等人,2009年)。

基因表达遗传性

(2011年1月):源代码和逐个基因的结果来自我们的基因表达遗传力论文“通过亲缘关系或非亲缘关系个体的血统识别的基因表达的单组织和跨组织遗传力”(Price等人,2011年)可以下载在这里.