摘要
Expression Atlas是EMBL-EBI的基因和蛋白质表达资源。它收集并汇编了各种生物系统和环境中RNA和蛋白质丰度和定位的数据,并为研究界提供了公开访问这些数据的途径。随着公共档案中单细胞RNA-Seq数据集可用性的增加,我们现在已经用新的增值服务扩展了Expression Atlas,以显示单细胞中的基因表达。单细胞表达图谱于2018年发布,目前包括12个物种的123个单细胞RNA-Seq研究。该网站可以通过物种内或物种间的基因进行搜索,以揭示该基因在何处表达或在何种条件下成为标记基因的实验、组织和细胞类型。在每项研究中,可以使用预先计算的t-SNE图对细胞进行可视化,并可以根据不同的特征或基于基因表达的细胞簇对细胞进行着色。在每个实验中,都有指向可下载文件的链接,如RNA量化矩阵、聚类结果、协议报告和相关元数据(如指定的细胞类型)。
引言
Expression地图集(https://www.ebi.ac.uk/gxa/home网站)是一个增值的在线生物信息学资源,包括数据库、用户界面和网络服务,可以轻松访问跨物种、组织、细胞、实验条件和疾病的基因表达信息。最初于2009年开发(1)作为统一分析、注释和显示ArrayExpress档案中微阵列和RNA-Seq实验结果的资源(2). 从那时起,Expression Atlas已经发展到处理来自各种其他来源和档案的数据集,例如NCBI的基因表达总表(GEO)(三),欧洲核苷酸档案(4)以及受控访问数据集,如GTEx。此外,Expression Atlas还是大规模基因组学研究(如Gramene)生成的转录组学数据的长期门户(5),植物的比较资源(网址:http://www.gramene.org/)和全基因组的泛癌分析(PCAWG,https://docs.icgc.org/pcawg/). Expression Atlas还通过来自PRIDE数据库的质谱蛋白质组数据集整合了蛋白质表达信息(6)和人类蛋白质图谱中的一个数据集。在过去五年中,处理和管理的基因表达数据集定期用于Open Targets等项目(7),而Expression Atlas的热图小部件已被八个资源采用,以在其网站内显示不同组织的基因表达(例如Reactome(8)).
随着组织分离技术和单细胞水平高通量测序技术的最新进展,单细胞RNA-Seq数据集正在以越来越快的速度生成并存入公共领域。自2017年上次Expression Atlas更新以来(9)因此,Expression Atlas的主要发展集中在单细胞RNA-Seq研究的注释、分析、存储和显示。Expression Atlas以前由用于组织水平表达的“基线表达”和“差异表达”组件组成,现在获得了第三个“单细胞”组件。这个新的组成部分,即单细胞表达图谱,于2018年首次发布,目前包括123项研究,包括来自12个不同物种的近100万次分析。单细胞表达图谱采用分析管道,以标准化的方式处理来自类SMART和基于液滴的实验方案的数据集,并显示不同细胞和细胞类型中的基因表达。
单细胞表达图谱的独特之处在于,它为生命科学界提供了跨多个物种的统一分析和注释的单细胞RNA-Seq数据。它可以方便地访问有意义的结果和标准化的数据文件(参见图1)从而为进一步分析表达矩阵的基因提供了方便的软件输入,并支持下游分析计算方法的开发,如细胞类型注释。在一系列实验方案中,单细胞基因组学领域正在迅速发展。这些结果导致数据量大幅增加,加重了基础设施的压力,并导致频繁的重新设计。例如,Expression Atlas中的大量RNA-Seq实验包含809项研究中的几十万次分析,而123项单细胞研究包含近一百万次分析。此外,新的分析方法不断产生并得到显著改进,导致管道重新估价和更新。因此,随着实验协议和分析方法的成熟,Single Cell Expression Atlas作为一项服务在Expression Attlas中发布,期望在不久的将来通过Expression Atlas的主要基因和条件搜索进行全面集成和查询。
图1。
“浏览实验”页面的屏幕截图。用户可以按物种或其他关键字搜索实验,快速链接到结果页面,或从一个或多个研究中下载原始、规范化数据和元数据包。
单细胞表达ATLAS
数据
自2018年5月首次推出以来,单细胞表达图谱服务已经处理了123项研究,包括来自12个不同物种的955000次分析,包括智人和模型生物,如小家鼠,拟南芥和黑腹果蝇。所有数据集均来自公共档案,如ArrayExpress和GEO。元数据通过一个半自动的过程在内部进行管理,该过程识别实验因素,例如细胞类型、疾病或扰动,然后用实验因素本体术语(EFO)进行注释,以描述实验比较,以便进一步处理。样本用单元格类型进行注释,这些单元格类型由这些数据集的主要作者提交或提供。然后,细胞类型与细胞本体中的术语相链接。
数据分析
单细胞表达图谱的分析管道由两部分组成:基因表达定量和下游分析。虽然量化是使用依赖技术的管道完成的,但目前所有研究的下游分析都是相同的。
基因表达的量化
对于SMART类技术(10)如果数据是以单元多路形式提供的,则使用散装管道。此管道最初在iRAP中实现(https://doi.org/10.1101/005991),但最近已使用Nextflow重新实现(11). 该流水线包括质量过滤、质量修剪和使用FASTX-Toolkit去除序列伪影(http://hannonlab.cshl.edu/fastx_toolkit/)、poly-A和带快速滤波器的未调用基过滤(https://github.com/nunofonseca/fastq_utils网站)和污染检查。配对的末端读数与fastq对重新配对(https://doi.org/10.101/552885)过滤后。然后用卡尔利斯托对过滤后的读数进行量化(12),然后将单元格量化组合成最终矩阵。
对于10x(v2、v3)等液滴技术(13)和Drop-seq(14)通过细胞条形码和唯一分子标识符(UMI),我们使用了Alevin,它是Salmon包装的一部分(15). Alevin处理条形码/UMI处理、量化和量化矩阵的生成。默认情况下,Alevin基于频率分布过滤单元格条形码,但我们发现在许多实验中,这很难在无监督的情况下操作。因此,我们运行Alevin时不进行过滤,只排除频率最低的条形码,然后应用DropletUtils包的emptyDrops方法(16)去除空液滴。如果一项研究合并了多个库,则每次运行产生的矩阵都会合并为最终矩阵。该管道正在进行仔细审查,并考虑在未来的迭代中包括双重删除等过程。
下游分析
对于所有用于下游分析的单细胞实验,我们使用Scanpy(17)包括附加过滤、降维、聚类和标记检测。最终输出文件以可用的标准文件格式提供,包括用于表达式矩阵的类似10x的矩阵市场格式。我们设想使用允许更丰富数据的格式(例如Loom(http://lumpy.org/)或annData(17))包括批量修正,更好地使用元数据进行差异比较,包括轨迹分析,并简化未来版本中的进一步分析。
所有工作流组件现在都使用Bioconda(18)包,支持紧密版本控制和自动Docker容器生成。对于fastq-utils、Scanpy和DropletUtils,我们贡献了新的包装器脚本和Bioconda配方来生成必要的包。然后使用工作流基础结构部署这些包。我们目前在量化阶段使用Nextflow,而Galaxy(19)以可重复的方式进行下游分析。请参见https://github.com/ebi-gene-expression-group/scxa-workflows网站以获取详细信息。
用户界面
该网站可以通过物种内或物种间的基因进行搜索,以揭示该基因在何处表达或在何种条件下成为标记基因的实验、组织和细胞类型。在每项研究中,可以使用预先计算的t-SNE图对细胞进行可视化,并可以根据基因表达通过不同的元数据或细胞簇对细胞进行着色。还使用基于t-SNE的可视化显示跨不同细胞的基因表达。在每个实验中,都有指向可下载文件的链接,如RNA量化矩阵、聚类结果、协议报告和相关元数据(如指定的细胞类型)。
基因搜索
Single Cell Expression Atlas主页包括按基因名称和特征进行查询,具体查询词可以是基因ID、基因符号或名称。可以使用搜索框旁边的下拉框指定物种。一旦执行搜索,结果将显示基因表达的所有实验。结果页面根据查询显示一个或多个物种的实验列表,指明物种、研究标题、实验变量和分析数量。有一个明确的迹象表明,所查询的基因是否是研究中的标记基因。页面左侧的过滤器可用于缩小搜索结果范围,如图所示2.
图2。
基因ASPM的搜索结果,过滤后显示ASPM表达的数据集小家鼠.
实验页面
单细胞表达地图集中的每个实验都有自己的实验页面,该页面显示数据分析的结果,并提供指向研究原始档案来源、原始文件、处理文件和元数据文件的发布和下载的链接。实验页面包括两种可视化方法:t-SNE图(图三)和标记基因heatmap(图4). t-SNE图显示数据中的细胞亚群,同时能够以单细胞分辨率可视化基因表达变化。
浏览和下载实验
最后,Single Cell Expression Atlas提供了一个页面,其中显示了所有可用实验的更新表。有一些选项可以按关键字搜索数据集,例如物种或实验标题以筛选结果,每个实验的分析结果的快速链接,还有一种从一个或多个选定实验下载数据包的简单方法(图1). 数据包包含MAGE-TAB格式的样本元数据文件,以及矩阵市场格式的过滤和未过滤的标准化基因量化矩阵。
t-SNE小工具
t-SNE可视化,包括基因搜索,可以作为一个小部件,嵌入到不同的网站和资源中,希望链接到单细胞表达图谱中特定研究的基因表达结果。该小部件及其使用说明如下:https://github.com/ebi-gene-expression-group/scxa-tsne-widget.
新数据集和物种
在撰写本文时,Expression Atlas包含大量和单细胞表达数据集,作为其最新组件单细胞表达Atlas的一部分。总的来说,这些研究包括3711项转录组学或蛋白质组学研究(其中123项是单细胞研究),共包括1070 052项分析。所有Atlas数据集涵盖62个物种,包括1381项人类研究、2600多项哺乳动物研究和810项植物研究。表1总结了Expression Atlas中可用研究数量所代表的前15个物种。这些数据集涵盖了来自细胞本体的900多种细胞类型,以及EFO-EMBL-EBI用于注释功能基因组学实验的本体中的963多种疾病(20). 尽管大多数数据集都是通过微阵列技术生成的(2758项研究),但仍有809项研究是基于大块RNA测序的,还有21项来自人类癌症细胞系和小鼠的蛋白质组学数据集。根据RNA-Seq数据集,173人报告了基线基因表达。目前已有42种植物的基线数据,最新添加的是甜菜根(普通β)、油菜籽(甘蓝型油菜),香蕉(小果野蕉),桃(桃李)和红三叶(红三叶)等等。大多数研究继续采用差异设计,包括3391个数据集,对47种不同生物体的9852个差异比较样本进行研究。
物种. | 差异研究数量. | 基线研究数量. | 单细胞研究数量. |
---|
智人 | 1282 | 46 | 53 |
小家鼠 | 1023 | 42 | 50 |
拟南芥 | 535 | 7 | 5 |
褐家鼠 | 142 | 三 | 1 |
黑腹果蝇 | 134 | 1 | 1 |
水稻 | 79 | 4 | 0 |
酿酒酵母 | 42 | 0 | 1 |
五倍子 | 30 | 三 | 0 |
Zea mays公司 | 29 | 12 | 0 |
秀丽隐杆线虫 | 25 | 1 | 1 |
苏斯克罗法 | 23 | 1 | 0 |
葡萄 | 16 | 4 | 0 |
达尼奥雷里奥 | 15 | 1 | 7 |
甘氨酸最大值 | 13 | 8 | 0 |
大麦 | 12 | 三 | 0 |
其他 | 140 | 55 | 1 |
物种. | 差异研究数量. | 基线研究数量. | 单细胞研究数量. |
---|
智人 | 1282 | 46 | 53 |
小家鼠 | 1023 | 42 | 50 |
拟南芥 | 535 | 7 | 5 |
褐家鼠 | 142 | 三 | 1 |
黑腹果蝇 | 134 | 1 | 1 |
水稻 | 79 | 4 | 0 |
酿酒酵母 | 42 | 0 | 1 |
五倍子 | 30 | 三 | 0 |
Zea mays公司 | 29 | 12 | 0 |
秀丽隐杆线虫 | 25 | 1 | 1 |
苏斯克罗法 | 23 | 1 | 0 |
葡萄 | 16 | 4 | 0 |
达尼奥雷里奥 | 15 | 1 | 7 |
甘氨酸最大值 | 13 | 8 | 0 |
大麦 | 12 | 三 | 0 |
其他 | 140 | 55 | 1 |
物种. | 差异研究数量. | 基线研究数量. | 单细胞研究数量. |
---|
智人 | 1282 | 46 | 53 |
小家鼠 | 1023 | 42 | 50 |
拟南芥 | 535 | 7 | 5 |
褐家鼠 | 142 | 三 | 1 |
黑腹果蝇 | 134 | 1 | 1 |
水稻 | 79 | 4 | 0 |
酿酒酵母 | 42 | 0 | 1 |
五倍子 | 30 | 三 | 0 |
Zea mays公司 | 29 | 12 | 0 |
秀丽隐杆线虫 | 25 | 1 | 1 |
苏斯克罗法 | 23 | 1 | 0 |
葡萄 | 16 | 4 | 0 |
达尼奥雷里奥 | 15 | 1 | 7 |
甘氨酸最大值 | 13 | 8 | 0 |
大麦 | 12 | 三 | 0 |
其他 | 140 | 55 | 1 |
物种. | 差异研究数量. | 基线研究数量. | 单细胞研究数量. |
---|
智人 | 1282 | 46 | 53 |
小家鼠 | 1023 | 42 | 50 |
拟南芥 | 535 | 7 | 5 |
褐家鼠 | 142 | 三 | 1 |
黑腹果蝇 | 134 | 1 | 1 |
水稻 | 79 | 4 | 0 |
酿酒酵母 | 42 | 0 | 1 |
五倍子 | 30 | 三 | 0 |
Zea mays公司 | 29 | 12 | 0 |
秀丽隐杆线虫 | 25 | 1 | 1 |
苏斯克罗法 | 23 | 1 | 0 |
葡萄 | 16 | 4 | 0 |
达尼奥雷里奥 | 15 | 1 | 7 |
甘氨酸最大值 | 13 | 8 | 0 |
大麦 | 12 | 三 | 0 |
其他 | 140 | 55 | 1 |
Expression Atlas仍然致力于为广大科学界提供大规模数据集并将其可视化。其中包括基因型问题表达(GTEx)的第6版(21),拟南芥信息门户11版(ARAPORT11)(22),风扇5(https://www.ebi.ac.uk/gxa/terials?experialSet=FANTOM5); 编码器(https://www.ebi.ac.uk/gxa/experimentals?experimentalSet=ENCODE)和蛋白质组学数据。地标单细胞数据集包括来自鼠舌项目(https://www.ebi.ac.uk/gxa/sc/experiats/E-ENAD-15/)和疟疾细胞图谱(https://www.ebi.ac.uk/gxa/sc/experiats/E-CURD-2/).
其他发展
蛋白质组学数据
自上次更新以来,我们与EMBL-EBI的PRIDE团队合作,显著增加了Expression Atlas中蛋白质组数据集的内容。Expression Attlas现在包括21个人类癌症细胞系、癌症样本的质谱实验的蛋白质表达结果(https://doi.org/10.101/1665968)以及以MaxQuant为基础的管道分析的不同小鼠组织(6).
用户体验
自上次更新以来,我们在批量Expression Atlas资源中实现了显著的增强和新功能。Expression Atlas现在使用盒图显示了许多批量RNA-Seq实验的转录物定量,并在可用的情况下突出显示了显性转录物。搜索框上的自动建议已得到改进,搜索结果现在显示为新的“过滤器”按钮,可以根据选择的表达水平对显示进行切片。此外,蛋白质组学和转录组学结果现在更容易区分。主页进行了重大重新设计,搜索栏现在位于顶部,包括物种数量、研究、分析、Ensembl/EFO版本或更高的能见度。
未来发展方向
未来,Expression Atlas将继续导入所有物种的表达数据集,对其进行统一分析,并向研究界免费公开提供。与GTEx、Araport、ENCODE和Human Cell Atlas门户网站(均为特定项目)不同,Expression Atlas将来自多个数据集(包括来自这些项目的数据集)的数据集成在一个界面中,并以统一的方式进行处理。
我们将继续开发单细胞表达图谱,并将专注于将单细胞水平的基因表达精度与表达图谱主要组成部分中各种条件和组织的基因表达广度相结合。例如,我们将实现自动方法来注释从表达式数据派生的单元格类型。随着数据量的增加,Expression Atlas背后的基础设施将继续扩大,界面也将得到改进,以便能够查询单元格类型。我们将探索提供更广泛的数据可视化而非t-SNE图的可能性,包括UMAP或PCA等。随着许多研究(包括两者)和更广泛地使用微样本分析,未来体细胞和单细胞基因表达之间的差异可能会变得模糊。为了应对这一挑战,我们将努力将所有Expression Atlas组件无缝集成到单个界面中。
致谢
我们要感谢Olamidipupo Ajigboye和Helen Parkinson在丰富EFO方面所做的贡献,以描述在Atlas中研究的样本;Awais Athar、Ahmed Ali和Ugis Sarkans感谢他们在ArrayExpress界面方面的帮助,以及在向Array快递提交新的功能基因组学研究方面的帮助。我们要感谢艾蒂安·索利尔在单细胞RNA-Seq管道方面的协助;Bioconda社区和Björn Grüning(弗赖堡大学)为Bioconda和Galaxy提供援助。我们要感谢来自Gramene、Doreen Ware(冷泉港)和Pankaj Jaiswal(俄勒冈州州立大学)的合作者。最后,我们感谢Expression Atlas SAB的成员,Jurg Bahler(伦敦大学学院)、Angela Brookes(加州大学圣克鲁斯分校)、Roderic Guigó(基因组调控中心主席)、Kathryn Lilley(剑桥大学)和Zemin Zhang(北京大学)。
基金
欧洲分子生物学实验室(EMBL)成员国;Wellcome信托基金的单细胞基因表达图谱和PRIDE资助[108437/Z/15/Z和208391/Z/17/Z];美国国家科学基金会资助Gramene数据库[NSF IOS#1127112];开放目标;Chan Zuckerberg倡议;Cesar Augusto Prada Medina得到了由BBSRC代表全球挑战研究基金资助的“拉丁美洲生物信息学能力建设”(CABANA)的支持[BB/P027849/1]。开放存取费用由EMBL提供资金。
利益冲突声明。未声明。
笔记
现住址:葡萄牙波尔图大学生物多样性研究中心CIBIO/InBIO Nuno A.Fonseca。
现住址:巴西圣保罗圣保罗大学(USP)Cesar Augusto Prada Medina。
现住址:Laura Huerta,DotmaticsLimited,Bishop's Stortford CM23 2ND,United Kingdom。
参考文献
1卡普什基
M。
,埃玛
一、。
,霍洛韦
E。
,诺索夫
第页。
,佐林
答:。
,马龙
J。
,鲁斯蒂奇
G.公司。
,威廉姆斯
E。
,帕金森
小时。
,巴西
答:。
欧洲生物信息学研究所的基因表达图谱
.核酸研究。
2010
;38
:D690型
–D698型
. 2阿塔尔
答:。
,完全(Fullgrabe)
答:。
,乔治
N。
,伊克巴尔
小时。
,韦尔塔
L。
,阿里
答:。
,雪
C。
,丰塞卡
不适用。
,佩特里斯扎克
R。
,帕帕塞奥佐鲁
一、。
等。
ArrayExpress更新—从批量数据更新为单单元格表达式数据
.核酸研究。
2019
;47
:D711号
–D715型
. 三。巴雷特
T。
,威尔希特
瑞典。
,勒杜(Ledoux)
第页。
,福音派
C。
,基姆
国际货币基金组织。
,托马舍夫斯基
M。
,马歇尔
K.A.公司。
,菲利普
K.H.公司。
,谢尔曼
下午
,霍尔科
M。
等。
NCBI GEO:功能基因组数据集存档–更新
.核酸研究。
2013
;41
:D991型
–D995型
. 4托里维奥
A.L.公司。
,阿拉科
B。
,阿米德
C。
,塞尔德尼奥·塔拉加
答:。
,克拉克
L。
,克利兰
一、。
,费尔利
美国。
,吉布森
R。
,Goodgame游戏
N。
,十个蹄铁
第页。
等。
2016年欧洲核苷酸档案
.核酸研究。
2017
;45
:第32页
–第36天
. 5特洛·鲁伊斯
M。
,奈塔尼
美国。
,斯坦因
J。
,古普塔
第页。
,坎贝尔
M。
,奥尔森
答:。
,世界环境学会
美国。
,普雷西
J。
,基尼扎
医学博士。
,焦
年。
等。
Gramene 2018:统一比较基因组学和植物研究途径资源
.核酸研究。
2017
;46
:D1181号
–D1189号
. 6Perez-Riverol公司
年。
,索达斯
答:。
,白
J。
,伯纳尔·利纳雷斯
M。
,赫瓦帕提拉纳
美国。
,昆都
D.J.公司。
,伊努甘蒂
答:。
,格里斯
J。
,迈耶
G.公司。
,艾泽纳赫
M。
等。
2019年PRIDE数据库及相关工具和资源:改进对量化数据的支持
.核酸研究。
2019
;47
:D442号
–D450型
. 7卡瓦略-席尔瓦
D。
,皮耶莱奥尼
答:。
,皮尼亚泰利
M。
,翁(Ong)
C。
,富米斯
L。
,卡拉马尼斯
N。
,卡莫纳
M。
,福克纳布里奇
答:。
,大力神
答:。
,麦考利
E。
等。
开放目标平台:两年来的新发展和更新
.核酸研究。
2019
;47
:D1056号
–2006年10月15日
. 8法夫雷加特
答:。
,朱佩
美国。
,马修斯
L。
,西迪罗普洛斯
英国。
,吉莱斯皮
M。
,加拉帕蒂
第页。
,唧唧
R。
,Jassal公司
B。
,科宁格
F、。
,五月
B。
等。
反应途径知识库
.核酸研究。
2018
;46
:D649号
–D655型
. 9帕帕塞奥佐鲁
一、。
,丰塞卡
不适用。
,基伊斯
M。
,唐
年。
,巴雷拉
E。
,巴赞
西。
,伯克
M。
,福尔格拉布
答:。
,富恩特斯
上午。
,乔治
N。
等。
表达图谱:多种研究和生物体的基因和蛋白质表达
.核酸研究。
2018
;46
:D246型
–D251型
. 10皮切利
美国。
,比约克隆德
英国。
,法里达尼
手术室记录。
,扎加塞尔
美国。
,温贝里
G.公司。
,桑德伯格
R。
Smart-seq2用于单个细胞中敏感的全长转录组分析
.自然方法
.2013
;10
:1096
–1098
. 11迪·托马索
P.D.公司。
,查特祖
M。
,弗洛登
E.W.公司。
,普列托·巴贾
第页。
,帕伦博
E。
,Notredame公司
C。
Nextflow支持可复制的计算工作流
.自然生物技术。
2017
;35
:316
–319
. 12布雷
不适用。
,皮门特尔
小时。
,梅尔斯特德
第页。
,Pachter公司
L。
近最优概率RNA-seq量化
.自然生物技术。
2016
;34
:525
–527
. 13.郑
G.X.年。
,特里
J.M.公司。
,贝尔格拉德
第页。
,雷夫金
第页。
,弯曲
Z.W.公司。
,威尔逊
R。
,兹莱多
。
,惠勒
财政部。
,麦克德莫特
G.P.公司。
,朱
J。
等。
单个细胞的大规模并行数字转录图谱
.国家通讯社。
2017
;8
:14049
. 14马科斯科
E.Z.公司。
,巴苏
答:。
,萨蒂亚
R。
,Nemesh公司
J。
,谢卡尔
英国。
,高盛
M。
,提罗什
一、。
,比亚拉斯
阿拉伯联合酋长国。
,Kamitaki公司
N。
,马特斯特克
E.M.公司。
等。
使用纳米液滴对单个细胞进行高度并行的全基因组表达谱分析
.单元格
.2015
;161
:1187
–1201
. 15斯里瓦斯塔瓦
答:。
,马利克
L。
,史密斯
T。
,萨德伯里
一、。
,帕特罗
R。
Alevin有效地从dscRNA-seq数据中估计准确的基因丰度
.基因组生物学。
2019
;20
:65
. 16伦
A.T.L.公司。
,里森菲尔德
美国。
,安德鲁斯
T。
,道
T.P.公司。
,戈麦斯
T。
第一届人类细胞地图集活动参与者
马里奥尼
J。
EmptyDrops:在基于液滴的单细胞RNA测序数据中区分细胞和空液滴
.基因组生物学。
2019
;20
:63
. 17Wolf公司
联邦航空局。
,格勒尔
第页。
,泰斯
F.J.公司。
SCANPY:大规模单细胞基因表达数据分析
.基因组生物学。
2018
;19
:15
. 18咕噜声
B。
,山谷
R。
,斯霍丁
答:。
,查普曼
文学学士。
,罗伊
J。
,Tomkins-Tinch公司
C.H.公司。
,瓦利埃利斯
R。
,科斯特
J。
Bioconda团队
Bioconda:生命科学的可持续综合软件分发
.自然方法
.2018
;15
:475
–476
. 19阿夫根
E。
,贝克
D。
,巴蒂
B。
,范登比克
M。
,鲍维尔
D。
,切赫
M。
,奇尔顿
J。
,克莱门茨
D。
,科拉奥尔
N。
,格林
文学学士。
等。
用于可访问、可复制和协作生物医学分析的Galaxy平台:2018年更新
.核酸研究。
2018
;46
:W537号机组
–W544号机组
. 20马龙
J。
,霍洛韦
E。
,阿达穆萨克
T。
,卡普舍斯基
M。
,郑
J。
,列斯尼科夫
N。
,祖科娃
答:。
,巴西
答:。
,帕金森
小时。
用实验因子本体建模样本变量
.生物信息学
.2010
;26
:1112
–1118
. 21GTEx财团
人类基因组学。基因型问题表达(GTEx)初步分析:人类多问题基因调控
.科学类
.2015
;348
:648
–660
. 22.程
C.Y.公司。
,克里希纳库曼
五、。
,陈
A.P.公司。
,蒂波·尼森
F、。
,朔贝尔
美国。
,城镇
客户尽职调查。
Araport11:拟南芥参考基因组的完整重新注释
.工厂J。
2017
;89
:789
–804
.
©2019年作者。由牛津大学出版社代表核酸研究出版。