摘要
Gramene公司(网址:http://www.gramene.org)是主要作物和模式植物物种的比较功能分析的知识库。当前发布的#54包含来自44个参考基因组的170多万个基因,其中大多数通过同源和副同源基因分类、全基因组比对和同源性组织成62367个基因家族。其他基因注释包括基于本体的蛋白质结构和功能;遗传、表观和表型多样性;和通路关联。Gramene的植物反应组提供了细胞级植物途径网络的知识库。具体来说,它使用精选的水稻参考途径,根据基因直系学推导出另外66个物种的途径预测,并有助于在这些途径的背景下显示基因表达、基因-基因相互作用和用户定义的组学数据。作为一个社区门户,Gramene集成了一流的软件和基础设施组件,包括Ensembl基因组浏览器、Reactome路径浏览器和Expression Atlas小部件,并定期进行数据和软件升级。通过功能强大、直观的搜索界面,用户可以轻松地跨各种门户进行查询,并通过单击各种功能(如基因组上下文、高度增强的基因树、基因表达解剖图、相关路径和外部信息资源)交互式分析搜索结果。Gramene中的所有数据都可以通过可视化和编程接口访问。
简介
Gramene数据库是一个通用资源,用于查询、可视化、分析和比较作物和模型物种的植物基因组和路径数据。我们的基因组数据门户是与Ensembl Genomes合作创建的(1,2),并与Ensembl Plants共享基础设施、专用软件组件和预先计算的数据。例如,该门户使用Ensembl的数据模型和分析工作流生成基线基因组注释,并执行全基因组比较分析,以构建44个植物参考基因组的系统发育树、同系物和全基因组比对;Ensembl基因组浏览器,用于可视化和探索基因组数据;以及用于数据分析的集成在线工具,如BLAST、BioMart、组装转换器和变量效果预测(VEP)。Plant Reactome数据库(http://plantreactome.gramene.org) (三,4)Gramene的路径门户,是与人类反应组项目合作的一项持续开发工作(5). 植物反应体包含67种植物的路径数据,这些植物代表几种模式和作物、藻类和单细胞光自养生物。如前所述,水稻被用作手动控制途径的参考物种,并推导出其他物种基于基因直系同源性的预测(三,4,6). 熟化水稻路径数据集成在中央路径管理数据库中,并由人类反应组项目维护。此外,Gramene的基因页面和Plant Reactome pathway浏览器利用EMBL-EBI的Expression Atlas生成的整体和种子解剖图来显示基线基因表达。
Gramene数据库中的所有数据都可以以各种标准格式的图形和/或表格形式下载,也可以通过应用程序编程接口(API)编程访问。Gramene还继续提供对存档的遗留数据的访问(http://www.gramene.org/archive网站) (6)包括基于Pathway Tools的代谢网络(7–9)来自CyVerse(10).
在本文中,我们描述了自上次NAR报告以来Gramene数据库中引入的新数据和功能(6). 表中提供了总结1.
Gramene数据库中的新数据和功能(2015年9月至2017年8月)
表1。Gramene数据库中的新数据和功能(2015年9月至2017年8月)
表1。Gramene数据库中的新数据和功能(2015年9月至2017年8月)
新的GRAMENE主页和集成搜索接口
2016年5月发布了一个全新的网站主页,该主页具有集成的搜索界面,构建在React Javascript框架上,以支持客户端可视化的开发(构建53)。新主页有一个类型头搜索框,便于快速搜索和链接到我们的各种门户和资源。对搜索结果中基因的基因组分布进行了总结,并将单个基因显示在一个可扩展的列表中,其中包含基因结构、基因表达、保护、相关途径和数据库交叉引用的嵌入式视图,稍后将进行描述。
当查询仅匹配注释良好的模型生物体中的基因时,可以使用同源性选项卡修改搜索以显示进化相关的基因。同源性选项卡的主要功能是一个集成的可视化组件,显示扩展的基因树,显示感兴趣的基因及其最近的注释良好的同源物。其他信息显示为每个叶节点或折叠子树旁边的轨迹。默认显示模式显示包含在多序列比对中的蛋白质区域,带有彩色编码的InterPro域。用户可以平移和缩放视图或切换到可滚动的多序列对齐模式。
由于导航搜索结果或包含数十个物种数百个家族成员的基因树可能会非常困难,而且对大多数用户来说是不必要的,因此我们实现了一个过滤器,以限制用户定义的物种子集的搜索结果。基因树修剪可以消除多序列比对中的多余间隙,从而消除不太密切物种的视觉混乱。这些开发通过在快速界面中集成各种数据,在标准视图之外增加了价值,同时让用户能够专注于与其研究最相关的物种。为web服务和搜索界面开发的所有代码都在GitHub上维护(https://github.com/warelab).
新的和更新的植物基因组
当前发布的Gramene增加了五个新的全序列参考植物基因组,并更新了四个现有基因组(图1安培,表1、和补充表S1),使总数达到44。新物种包括三种双子叶植物,普通β第(b)小节。普通人(甜菜),甘蓝型油菜(油菜)和红三叶(红三叶草)和两种红藻,鸡冠花(爱尔兰或角叉菜苔藓)和硫化加利迭氏菌,一种极端嗜微生物的单细胞物种。Gramene中的所有参考基因组组合都是在国际核苷酸序列数据库合作组织INSDC中添加的(11)这是一项确保来源和与其他在线资源的互操作性的政策。Gramene基因组的完整列表,如图所示1安培包括真双子叶植物15种,单子叶植物21种,基部被子植物1种,非开花植物7种。四个更新后的议会对应三种主要粮食作物,Zea mays公司cv.B73(玉米),小麦cv.Chinese Spring(小麦),以及双色高粱cv.BTx623(高粱)和一种原产于撒哈拉以南非洲的野生稻,长雄野生稻Gramene研究人员领导了创新性工作,以生成新的玉米参考组件(B73 RefGen_v4),该组件完全基于第三代长读序列技术,借助光学地图构建(12).
图1。
在新的Gramene数据库搜索界面中可视化查询结果。(一)Gramene构建54中44个植物参考基因组的物种树。蓝色、红色、黑色和绿色线条分别对应21个单子叶植物、15个双子叶植物和基础被子植物无油樟和7种低等植物。新的基因组组装用红色星号(*)标记,更新的组装用紫色字体突出显示(另见表1和补充表S1). (B类)定制的基因树对齐视图,由InterPro域进行颜色编码。所选物种的过滤查询结果和基因树分支将显示出来。显示所选物种的过滤器查询结果和基因树分支。(C类)详细的DNA序列比对。(D类)水稻来自传统集合的QTL、SSR和RFLP重新合并到IRGSP1组合(由KeyGene提供映射)。Q-TARO(Yonemaru)的QTL等,2010)也可用。
该程序集发布时带有一组由MAKER-P管道生成的新基因注释(13)通过单分子测序获得的111 000个长阅读Iso-Seq转录本(14). 这种方法使每个基因的替代转录物数量增加了一倍多,从1.5个增加到3.8个,解决了间隙和组装错误,纠正了链,整合了基因模型,并锚定了以前未锚定的基因(12). Earlham Institute(前身为TGAC)生产的新型面包小麦组合TGACv1包括以前IWGSCv1染色体调查序列组合中重新定位的约99%的基因(15). 为了便于组件之间的基因组坐标转换,我们继续维护一个易于使用的在线组装转换器工具。例如,使用此实用程序,现在可以遍历三个玉米B73参考组件RefGen_v2、RefGen_v3和RefGen_v4(http://ensembl.gramene.org/Zea_mays/Tools/AssemblyConverter?db=core).
最新注释和比较基因组学
使用InterProScan在Gramene中对基因及其编码蛋白进行功能注释(16),允许在以基因为中心的系统发育学框架内比较InterPro功能域和基因本体术语。54版包括更新的玉米、小麦和高粱基因组序列组合的修订基因模型,以及拟南芥(阿拉波特11;https://www.araport.org/data/araport11)虽然后者的基因组组装没有更新。
我们的系统发育分析使用了Compara方法(17)通过将同源基因聚类到家族中,构建具有稳定ID的基因树以供将来参考,并分类成对的同源和同源关系,重建基因的进化历史。共识树的每个节点都分配了一个分类日期,以确定进化谱系中发生基因重复的点,并指定基因家族出现的共同祖先。对于亲缘关系密切的物种,构建了同源性图以揭示保守基因序列的区域(18,19). 这些图谱由显示保守基因间和基因区域的全基因组比对补充(19). 可以使用基于web的Ensembl浏览器可视化这些数据(20,21)并使用BioMart进行开采(22,23),两者都可以通过编程访问。这些数据已被用于广泛的应用,包括蛋白质-蛋白质相互作用网络进化的研究拟南芥(24)玉米全基因组关联研究中候选基因富集方法的发展(25),以及小麦和大麦基因组规模知识网络的构建(26). 此外,Compara分析允许我们识别基因注释错误(分裂基因模型),建议注释不太清楚的直系同源基因的功能注释,以及从精选水稻路径到其他物种的投影映射。
新植物遗传多样性与突变序列变异
Gramene继续为12个基因组提供单核苷酸多态性(SNP)和/或结构变异数据(6,27–42;http://1001genomes.org). 我们最近为添加了新的变体拟南芥、粳米、,O.glumaepatula葡萄球菌高粱和小麦。
自上次NAR更新以来,我们为高粱和小麦添加了总计超过880万个甲基磺酸乙酯(EMS)衍生突变。高粱数据集(41)包括约150万EMS诱导的G/C到A/T转换突变,从BTx623背景中6400突变库中选择的252 M3家族中进行注释。小麦数据集包括约740万个EMS型变异体,这些变异体来源于四倍体(280万cv.“Kronos”)和六倍体(460万cv“Cadenza”)TILLING群体的测序。突变最初被称为IWGSC CSS支架,如Krasileva所述等。(42)以及高度自信(热MC5HomMC3)然后将突变投射到TGAC Chinese Spring支架上。小麦EMS突变体数据也可在加利福尼亚大学戴维斯分校、罗瑟姆研究所、厄勒姆研究所和约翰·因内斯中心联合项目生成的专业数据库中获得。研究人员和育种人员可以搜索此在线数据库,识别目标基因不同拷贝中的突变,并通过项目在线搜索工具(网址:http://www.wheat-tilling.com和http://dubcovskylab.ucdavis.edu/whit-tilling。也可以从英国SeedStor资源发出种子请求(https://www.seedstor.ac.uk/shopping-cart-tilling.php). 的数量O.glumaepatula葡萄球菌来自的变体水稻基因组进化项目(Stein等。,已提交)目前为490万。对于玉米、小麦和高粱的组装更新,变异被重新映射到最新的基因组坐标系(例如,玉米、小麦以及互作小麦变异的HapMap SNP)。我们还整合了Gramene档案中的水稻QTL(6) (http://archive.gramene.org/qtl)和Q-TARO数据库(43;http://qtaro.abr.affrc.go.jp)以及我们档案中的传统水稻SSR/RFLP数据(http://archive.gramene.org/markers网站)重新映射到IRGSPv1程序集。
我们继续使用Ensembl VEP工具分析和指定基因变体的假定功能和结构后果(4,44). 这些结果的可视化是在转录物结构和蛋白质结构域的背景下提供的。对于许多研究,我们还提供了有关单个植物材料的基因型及其表型的信息。
植物基因表达图谱
植物基因表达图谱(https://www.ebi.ac.uk/gxa/plant/实验)包含18种植物731个实验的转录组数据。这些数据已被手动整理、质量控制,并使用标准化分析管道进行分析(45). 来自14种植物的RNA-seq实验的基线表达数据显示了“正常”条件下基因产物在不同组织(叶片、根等)、发育阶段、品种和生态型中的表达水平。可从Gramene数据库的基因页面以及Plant Reactome Pathway Browser中访问EMBL-EBI expression Atlas中所有组织样本和生长阶段的单个基因的基线表达谱。差异基因表达数据,包括对环境胁迫、基因突变和细菌感染的反应,可用于从15种植物中进行2000多个手动管理的成对比较,并包括来自微阵列和RNA-seq实验的数据。目前,差异表达数据可以在expression Atlas网站上查看,并按需(非自动)显示在Gramene基因页面和基因组浏览器上,作为基因组特征轨迹。其他功能包括可视化给定表达式数据中的GO、Pathway和Interpo域丰富性。基线实验页面允许用户查找具有类似表达谱的基因。此外,为了对Expression Atlas中的所有实验进行适当的注释,EMBL-EBI实验因子本体(46)(EFO)补充了植物本体(47,48)(PO)和Brenda组织和酶源本体(EFO)。使用一个自动、可扩展的框架将手动管理的本体注释传播到匹配的样本属性,确保未来加载到Expression Atlas中的所有新工厂实验都将受益于现有的本体注释,而无需进一步手动管理。每天,一条自动分析管道在欧洲核苷酸档案馆的38种植物中发现新的RNA-seq序列,然后进行质量控制,将其与集合植物中的基因组参考比对,并量化基因和外显子的表达。当一个新的基因组组合被发布时,这条管道也会重新排列给定物种中的所有序列。迄今为止,已经处理了33000次运行,结果可通过RNASeq-er API获得(http://www.ebi.ac.uk/fg/rnaseq/api)以及BioPython模块和CPAN Perl库。Expression Atlas中的所有实验数据都可以作为R对象从相应的实验页面下载。实验也可以通过本体论搜索找到,并从ExpressionAtlas Bioconductor包中检索(https://www.bioconductor.org/packages/release/bioc/html/ExpressionAtlas.html). 最后,Expression Atlas中植物物种的可缩放矢量图形(SVG)格式的高质量解剖图由专业医学插图画家绘制,并在基线表达视图中突出显示组织的表达。
强化工厂反应入口
Plant Reactome数据库(三,4) (http://plantreactome.gramene.org)是一种统一的资源,用于描述与植物代谢、发育和分化相关的途径,以及它们对各种环境刺激的调节。植物反应体使用粳稻(欧·萨提娃)作为在植物细胞结构框架内手动管理路径的参考。在当前版本中,该数据库包含241条参考路径,包括229条精选的和12条预测的水稻路径;后者来源于与DNA复制、囊泡运输和翻译等进化保守过程相关的精心策划的人类路径的投影。自上次报告以来,我们添加了~25条新的人工调控水稻途径,包括胆碱生物合成、心磷脂生物合成、甘氨酸甜菜碱生物合成、木栓素生物合成、色氨酸生物合成、酪氨酸生物合成、赖氨酸降解II、细胞间和细胞内生长素转运、对低温的反应、昼夜节律、,花序发育,从营养枝顶端分生组织向生殖枝顶端分分生组织的过渡。
水稻路径的参考集用于为其他物种生成基于基因同源性的路径预测(4). 自我们上一次NAR报告以来,植物反应组中可用的物种数量翻了一番,从33个增加到66个,相当于Gramene中所有44个具有测序参考基因组的物种,以及另外22个具有公开可用测序基因组和/或转录组的物种(http://plantreactome.gramene.org/stats.html). 直向同源物的存在或不存在驱动了给定物种的同源反应和路径图的投影。用户可以以图形和表格格式访问任何成员物种的路径数据,并将预测路径与参考水稻路径进行比较。
如图所示2,我们的新“Fireworks”路径可视化平台显示路径的层次图,允许按功能类别探索路径,将路径浏览器链接到各种公共外部资源和基因组数据库,这些数据库提供有关各种路径实体的补充信息,显示基因的表达谱(从EMBL-EBI的基因表达图谱中远程获取),并提供通过PSICQUIC web服务从EBI的INTACT数据库显示基因-基因交互数据的选项。我们还支持上传、可视化和分析用户定义的转录组、蛋白质组、代谢组和基因-基因交互数据,这些数据可以以各种标准格式下载。
图2。
植物反应体途径视图和功能。(一)“Fireworks”路径可视化平台在路径查看器窗口中显示一个导航面板(左侧)和路径层次图,其中包含各种相关功能,例如求和、下载选项和外部公共资源链接,这些资源提供了有关各种路径实体的补充信息。(B类)植物反应体途径视图显示了基因-基因相互作用数据的叠加。MADS15和MADS14转录因子的两个常见相互作用体(红色框中显示的MAD1 ORYS和MAD6 ORYS)通过web服务从IntAct数据库导入。(C类)在路径浏览器上分析和可视化用户上传的基因表达数据,可选择探索同源物的完整表达谱并下载结果。
综合搜索
对于Gramene的每个版本,我们运行管道从Ensembl、Reactome、Expression Atlas和其他外部参考资源中提取数据和注释术语,将其转换为JSON文档,并将其加载到MongoDB集合中。基因集合中的文档最初是从Ensembl核心MySQL数据库生成的,扩展到包括来自Ensemb Compara的同源信息、来自Plant Reactome的相关反应和途径以及相关的本体术语。本体论、InterPro域层次结构、路径层次结构和分类树具有内在结构,其中父术语比子术语更通用。当基因与特定术语关联时,我们还将相应本体中的任何祖先术语包含在索引中,使用户能够找到与任何不太具体但相关的术语关联的基因。我们还将InterPro域注释集成到基因树文档中,以支持它们在我们的基因树浏览器中显示。为了支持自由文本搜索和过滤器的复杂组合,我们转换了基因文档的集合,以便在Apache Solr中使用。为了增强type-ahead搜索功能,我们还准备了一个来自各种MongoDB集合的建议索引。每个建议文档都包含定义基因索引过滤器的字段。此设计指导用户选择从受控词汇表中提取的术语,并鼓励他们通过添加或修改过滤器来迭代优化搜索。我们用招摇(http://swagger.io网站)定义、记录和服务我们的API,这些API通过以下方式访问MongoDB集合和Solr核心中的数据http://data.gramene.org。我们部署了Ensembl和Reactome REST API的自定义安装,以支持构建管道和搜索界面中的特定可视化。
社区外联和培训
Gramene组织社区外联活动,旨在培训处于职业生涯不同阶段的植物生物学家,包括高中生和教师、本科生和研究生、博士后研究员、技术人员、数据库管理员、高级研究人员和小组组长。我们定期通过Gramene News博客、脸书和推特(参见http://gramene.org/extraction网站).
我们定期组织在线研讨会,并在Gramene Youtube频道上提供录制的视频教程(https://goo.gl/ln9RLD网址)培训研究人员使用我们的资源和生物信息学工具,以及访问公共存储库中的数据,使用Gramene的比较基因组和途径工具进行分析。我们在动植物基因组会议和植物生物学会议期间举办了年度现场研讨会,向植物界介绍最新更新和新的Gramene特性,并向用户提供个性化帮助。我们还与各种植物研究人员和公共数据库(如AgBioData Consortium、GrapeIS(49),WheatIS)关于数据标准的开发和改进。
讨论和未来方向
在本报告中,我们描述了自上次NAR更新以来对我们的网站所做的两项主要改进:Gramene的新主页具有集成的搜索界面,以及Plant Reactome的改进视图和功能。我们当前的主页支持同步搜索所有Gramene门户网站的内容,并生成带有可点击链接的摘要输出,允许详细探索。Plant Reactome现在利用“Fireworks”路径可视化平台进行路径组织和导航,并为用户提供在路径图上覆盖基因-基因交互数据的选项(通过外部资源的API远程获取或通过上传自己的数据)。
在过去2年中,Gramene所有门户网站(基因组浏览器、植物反应组、Expression Atlas、外联和培训材料等)涵盖的物种数量以及相应的注释都有所增加。Gramene将继续开发增值的基因组和通路资源,并在所有数据类型上扩展和开发平台。未来,我们有望在植物反应组中超过75个注释基因组和相应的通路预测,并包括这些新物种的表达数据集。此外,我们将制作子站点,重点关注具有多重测序基因组的重要作物物种(即泛基因组),如玉米、高粱、水稻、小麦和葡萄,以提供泛特异性视图并促进比较分析。我们将改进和开发分析和可视化工具,特别强调对全球作物和新兴植物模型物种生成的小规模和大规模数据集进行种间和种内分析。我们将继续改进我们的集成搜索界面,增强用户界面,为交互式搜索结果摘要提供新的可视化,并为探索功能保护提供集成的基因树显示模式。
此外,我们将继续培训当前和未来的植物生物学家如何生成准确可靠的数据集,以及如何使用、重复使用和分析基因组数据。Gramene正在与植物研究人员和其他基因组学社区合作,制定标准格式和指南,用于制作异质数据集,包括基因和基因组、种质和高通量基因表达数据、表型、代谢组和蛋白质组,以及可访问、可重用和可互操作的注释。我们支持植物生物学家努力学习如何使用社区标准和本体概念准确注释和格式化其数据集。其中一个关键挑战是如何扩大策展活动的规模。为了解决这一问题,Gramene正在与美国植物生物学家学会(ASPB)及其期刊合作植物生理学和植物细胞改进手稿制作过程中数据格式和注释标准的采用。验证和集成期刊中发布的数据和数据库中的数据将提高两者的效用。
通过我们每月的网络研讨会系列和现场研讨会,我们将继续帮助研究人员充分利用可用的基因组资源,并寻求他们对改进我们的工具、数据模型和资源的建议。我们希望我们的用户将这些技能应用于构建新的假设、验证现有知识以及表征植物基因的各个方面,包括它们的功能、表达、在途径中的作用、表型以及相关的功能和结构变异。
补充数据
补充数据NAR在线提供。
致谢
作者感谢Gramene的用户、研究人员和众多合作者共享他们的项目生成的数据集,并提供有价值的建议和反馈,帮助我们提高Gramene作为社区资源的整体质量。我们还感谢冷泉港实验室(CSHL)和Dolan DNA学习中心、俄勒冈州立大学基因组研究和生物计算中心(CGRB)以及安大略省癌症研究所(OICR)对基础设施的支持。我们感谢Keygene Inc.的Anker P.Sörensen从Q-TARO和Gramene的档案数据库中重新定位水稻QTL。我们还感谢冷泉港实验室的Peter van Buren提供的系统管理支持,以及David Croft(EBI)和Robin Haw(OICR)为工厂反应器开发提供的技术支持。资助者在研究设计、数据分析或本手稿的准备中没有任何作用。
基金
国家科学基金项目(IOS-1127112);美国农业部农业研究局[58-1907-4-030和8062-21000-041-00D to D.W.];英国生物技术和生物科学研究理事会[B/I008071/1,BB/J00328X/1,BB/P016855/1 to P.K.]。通过美国国立卫生研究院(U41 HG003751 to L.S.)的拨款,Reactome数据库项目为工厂反应器的开发和运行提供了实物基础设施和智力支持;欧盟拨款[LSHG-CT-2005–518254];'安大略省研究基金ENFIN’;和EBI行业计划。俄勒冈州立大学(OSU)为OSU的研究生提供了部分支持。开放接入费用的资金:国家科学基金会授予Gramene项目1127112号奖金。
利益冲突声明。未声明。
参考文献
1凯西
P.J.公司。
,艾伦
J.E.公司。
,亚美尼亚语
一、。
,博杜
秒。
,螺栓
B.J.公司。
,卡瓦略-西尔瓦
D。
,克里斯滕森
M。
,戴维斯
第页。
,法林
洛杉矶。
,格拉布米勒
C、。
等
2016年集成基因组:更多基因组,更复杂
.核酸研究。
2016
;44
:D574型
–D580型
. 2凯西
P.J.公司。
,艾伦
J.E.公司。
,分配
答:。
,巴巴
M。
,博德杜
秒。
,螺栓
B.J.公司。
,卡瓦略-西尔瓦
D。
,克里斯滕森
M。
,戴维斯
第页。
,格拉布米勒
C、。
等
2018年集成基因组:非脊椎动物物种的集成组学基础设施
.核酸研究。
2017
;. 三。古普塔
第页。
,奈塔尼
秒。
,特洛·鲁伊斯
M.K.医学博士。
,Chougule公司
英国。
,德尤斯塔奇
第页。
,法夫雷加特
答:。
,焦
年。
,基伊斯
M。
,李
Y.K.公司。
,库马里
秒。
等
Gramene数据库:植物比较基因组资源导航
.货币。植物生物学。
2016
;7–8
:10
–15
. 4奈塔尼
秒。
,普雷西
J。
,德尤斯塔奇
第页。
,古普塔
第页。
,阿马拉辛格
五、。
,护法
P.D.公司。
,吴
G.公司。
,法夫雷加特
答:。
,其他
法学博士。
,威瑟
J。
等
植物反应体:植物途径和比较分析的资源
.核酸研究。
2017
;45
:D1029号
–D1039号
. 5法夫雷加特
答:。
,西迪罗普洛斯
英国。
,加拉帕蒂
第页。
,吉莱斯皮
M。
,豪斯曼
英国。
,唧唧
对。
,Jassal公司
B。
,朱佩
秒。
,科宁格
F、。
,麦凯
秒。
等
反应体途径知识库
.核酸研究。
2016
;44
:D481号
–D487号
. 6特洛·鲁伊斯
M.K.医学博士。
,斯坦因
J。
,世界环境学会
秒。
,普雷西
J。
,奥尔森
答:。
,奈塔尼
秒。
,阿马拉辛格
五、。
,护法
第页。
,焦
年。
,穆尔瓦尼
J。
等
Gramene 2016:比较植物基因组学和路径资源
.核酸研究。
2016
;44
:D1133号
–D1140型
. 7摩纳哥
M.K.医学博士。
,森
T.Z.公司。
,护法
P.D.公司。
,任
L。
,谢弗
M。
,奈塔尼
秒。
,阿马拉辛格
五、。
,托马森
J。
,哈珀
L。
,加德纳
J。
玉米代谢网络构建与转录组分析
.植物基因组
.2013
;6
,. 8摩纳哥
M.K.医学博士。
,斯坦因
J。
,奈塔尼
秒。
,世界环境学会
秒。
,护法
第页。
,库马里
秒。
,阿马拉辛格
五、。
,Youens-Clark公司
英国。
,托马森
J。
,普雷西
J。
等
Gramene 2013:比较植物基因组学资源
.核酸研究。
2014
;42
:D1193号
–第1199天
. 9护法
第页。
,任
L。
,阿马拉辛格
五、。
,摩纳哥
M。
,托马森
J。
,拉文斯克罗夫特
D。
,麦考克
秒。
,器皿
D。
,监狱
第页。
水稻基因组级代谢网络及其对生物胁迫下色氨酸、生长素和5-羟色胺生物合成调控的分析
.赖斯(纽约)
.2013
;6
:15
. 10商户
N。
,里昂
E.公司。
,高夫
秒。
,沃恩
M。
,器皿
D。
,米克洛斯
D。
,安汀
第页。
iPlant协作:支持生命科学数据发现的网络基础设施
.《公共科学图书馆·生物》。
2016
;14
:e1002342号
. 11中村
年。
,科克伦
G.公司。
,Karsch-Mizrachi公司
一、。
国际核苷酸序列数据库,C。
国际核苷酸序列数据库合作
.核酸研究。
2013
;41
:D21号机组
–第24天
. 12焦
年。
,佩卢索
第页。
,史
J。
,梁
T。
,蒂茨
M.C.公司。
,王
B。
,坎贝尔
医学硕士。
,斯坦因
J.C.公司。
,世界环境学会
十、。
,下巴
碳钢。
等
利用单分子技术改良玉米参考基因组
.自然
.2017
;546
:524
–527
. 13.坎贝尔
医学硕士。
,法学
M。
,霍尔特
C、。
,斯坦因
J.C.公司。
,莫赫
总直径。
,赫夫纳格尔
D.E.公司。
,雷
J。
,阿查瓦南塔昆
对。
,焦
D。
,劳伦斯
C.J.公司。
等
MAKER-P:快速创建、管理和质量控制植物基因组注释的工具包
.植物生理学。
2014
;164
:513
–524
. 14王
B。
,郑
E.公司。
,雷古尔斯基
M。
,克拉克
T.A.公司。
,荣誉
T。
,焦
年。
,卢
Z.公司。
,奥尔森
答:。
,斯坦因
J.C.公司。
,器皿
D。
通过单分子长读测序揭示玉米转录组的复杂性
.国家公社。
2016
;7
:11708
. 15国际小麦基因组测序。
六倍体面包小麦(Triticum aestivum)基因组基于染色体的草图序列
.科学类
.2014
;345
:1251788
. 16琼斯
第页。
,宾斯(Binns)
D。
,张
香港。
,弗雷泽
M。
,锂
西。
,麦卡努拉
C、。
,麦克威廉
H。
,马塞伦
J。
,米切尔
答:。
,努卡语
G.公司。
等
InterProScan 5:基因组尺度蛋白质功能分类
.生物信息学
.2014
;30
:1236
–1240
. 17维莱拉
A.J.公司。
,塞韦林
J。
,尿道Vidal
答:。
,恒
L。
,杜宾
对。
,伯尼
E.公司。
EnsembCompara GeneTrees:脊椎动物的完整、重复软件系统发育树
.基因组研究。
2009
;19
:327
–335
. 18施奈布尔
附笔。
,器皿
D。
,富尔顿
钢筋混凝土。
,斯坦因
J.C.公司。
,世界环境学会
F、。
,帕斯捷尔纳克
秒。
,梁
C、。
,张
J。
,富尔顿
L。
,坟墓
T.A.公司。
等
B73玉米基因组:复杂性、多样性和动态
.科学类
.2009
;326
:1112
–1115
. 19Youens-Clark公司
英国。
,巴克勒
E.公司。
,卡斯特文斯
T。
,陈
C、。
,德克莱尔
G.公司。
,德温特
第页。
,护法
第页。
,监狱
第页。
,凯西
第页。
,卡斯基
美国科学院。
等
2010年Gramene数据库:更新和扩展
.核酸研究。
2011
;39
:D1085号
–D1094号
. 20弗利切克
第页。
,艾哈迈德
一、。
,Amode公司
M.R.公司。
,巴雷尔
D。
,比尔
英国。
,布伦特
秒。
,卡瓦略-西尔瓦
D。
,克拉彭
第页。
,科茨
G.公司。
,费尔利
秒。
等
2013年合奏
.核酸研究。
2013
;41
:D48号
–D55型
. 21弗利切克
第页。
,Amode公司
M.R.公司。
,巴雷尔
D。
,比尔
英国。
,比利斯
英国。
,布伦特
秒。
,卡瓦略-西尔瓦
D。
,克拉珀姆
第页。
,科茨
G.公司。
,菲茨杰拉德
秒。
等
恩森布尔2014
.核酸研究。
2014
;42
:D749号
–D755型
. 22勺子
西。
,Youens-Clark公司
英国。
,染色
D。
,器皿
D。
GrameneMart:Gramene项目的BioMart数据门户
.数据库(牛津)
.2012
;2012
:巴056
. 23金塞拉
R.J.公司。
,卡哈里
答:。
,海德尔
秒。
,萨莫拉
J。
,普罗克托
G.公司。
,斯普迪赫
G.公司。
,阿尔梅达国王
J。
,染色
D。
,德温特
第页。
,科霍努
答:。
等
Ensembl BioMarts:跨分类空间的数据检索中心
.数据库(牛津)
.2011
;2011
:棒030
. 24拟南芥互作组映射,C。
拟南芥互作组图谱中网络进化的证据
.科学类
.2011
;333
:601
–607
. 25陈
C、。
,德克莱克
G.公司。
,田
F、。
,勺子
西。
,麦考克
秒。
,巴克勒
E.公司。
PICARA,一种分析管道,为植物全基因组关联QTL的先验候选基因提供概率推断
.公共科学图书馆一号
.2012
;7
:电子46596
. 26哈萨尼·帕克
英国。
,卡斯特洛特
M。
,埃什
M。
,Hindle公司
M。
,利森科
答:。
,陶贝特
J。
,罗林斯
C、。
开发综合作物知识网络以推进候选基因发现
.申请。Transl.公司。基因组。
2016
;11
:18
–26
. 27阿特维尔
秒。
,Huang(黄)
Y.S.公司。
,维尔贾姆松
B.J.公司。
,威廉姆斯
G.公司。
,霍顿
M。
,锂
年。
,孟
D。
,普拉特
答:。
,塔罗内
上午。
,胡
T.T.公司。
等
拟南芥自交系107个表型的基因组关联研究
.自然
.2010
;465
:627
–631
. 28克拉克
相对湿度。
,施魏克特
G.公司。
,图马健
C、。
,奥索斯基
秒。
,泽勒
G.公司。
,Shinn公司
第页。
,沃特曼
N。
,胡
T.T.公司。
,傅
G.公司。
,Hinds公司
国防部。
等
影响拟南芥遗传多样性的常见序列多态性
.科学类
.2007
;317
:338
–342
. 29福克斯
瑞典。
,普雷西
J。
,金布雷
J.A.公司。
,马奇尼
G.L.公司。
,圣人
答:。
,Youens-Clark公司
英国。
,克鲁赞
医学学士。
,监狱
第页。
山葵(禾本科)的测序和从头转录组组装
.申请。植物科学。
2013
;1
,. 30甘
十、。
,炖牛肉
O。
,贝尔尔
J。
,斯特芬
J.G.公司。
,德鲁
第页。
,希尔德布兰德
K.L.公司。
,林索
对。
,舒尔特海斯
S.J.公司。
,奥斯本
E.J.公司。
,斯里达兰
增值税。
等
拟南芥的多参考基因组和转录组
.自然
.2011
;477
:419
–423
. 31福克斯
瑞典。
,基尼扎
M。
,哈努马帕
M。
,奈塔尼
秒。
,沙利文
C、。
,普雷西
J。
,蒂瓦里
V.K.公司。
,其他
J。
,伦纳德
J.M.公司。
,圣人
答:。
等
二倍体小麦单粒小麦光形态发生过程中的从头转录组组装和基因表达分析
.公共科学图书馆一号
.2014
;9
:电子96855
. 32国际大麦基因组测序。
迈耶
K.F.公司。
,沃
对。
,棕色
J.W.公司。
,舒尔曼
答:。
,兰里奇
第页。
,普拉策
M。
,芬奇
通用电气公司。
,穆尔鲍尔
G.J.(通用)。
,佐藤
英国。
等
大麦基因组的物理、遗传和功能序列组装
.自然
.2012
;491
:711
–716
. 33.梅斯
E.S.公司。
,泰语
秒。
,镀金
英国。
,锂
年。
,普伦蒂斯
P.J.公司。
,卞(音)
L。
,坎贝尔
公元前
,胡
西。
,客栈
D.J.公司。
,汉族
十、。
等
全基因组测序揭示了非洲本土谷物作物高粱尚未开发的遗传潜力
.国家公社。
2013
;4
:2320
. 34麦克纳利
K.L.公司。
,儿童
K.L.公司。
,博内特
对。
,戴维森
相对湿度。
,赵
英国。
,乌拉特
V.J.公司。
,泽勒
G.公司。
,克拉克
相对湿度。
,Hoen公司
D.R.公司。
,局
T.E.公司。
等
全基因组SNP变异揭示了水稻地方品种和现代品种之间的关系
.程序。国家。阿卡德。科学。美国。
2009
;106
:12273
–12278
. 35莫里斯
G.P.公司。
,拉穆
第页。
,德什潘德
S.P.公司。
,搞砸
C.T.公司。
,沙阿
T。
,乌帕迪亚亚
H.D.公司。
,里埃拉·利扎拉祖
O。
,棕色
P.J.公司。
,阿查里亚
中央银行。
,米切尔
瑞典。
等
高粱农业气候性状的群体基因组和全基因组关联研究
.程序。国家。阿卡德。科学。美国。
2013
;110
:453
–458
. 36迈尔斯
秒。
,芡欧鼠尾草
J.M.公司。
,赫尔维茨
B。
,西蒙
C、。
,钟
G.Y.(通用)。
,巴克勒
E.公司。
,器皿
D。
葡萄属的快速基因组特征
.公共科学图书馆一号
.2010
;5
:电子8219
. 37赵
英国。
,赖特
M。
,金贝尔
J。
,艾曾加
G.公司。
,麦克朗
答:。
,科瓦奇
M。
,泰吉
西。
,阿里
M.L.公司。
,东
C.W.公司。
,雷诺
答:。
等
水稻基因组多样性和渐渗揭示了驯化和育种对水稻基因组的影响
.公共科学图书馆一号
.2010
;5
:电子10780
. 38郑
洛杉矶。
,Guo(郭)
X、S、。
,他
B。
,太阳
洛杉矶。
,彭
年。
,东
S.S.公司。
,线路接口单元
财政部。
,江
秒。
,拉马钱德兰
秒。
,线路接口单元
客户经理。
等
甜高粱和粒用高粱(高粱双色)遗传变异的全基因组模式
.基因组生物学。
2011
;12
:114兰特
. 39番茄基因组测序。
阿弗里托斯
秒。
,希杰伦
E.公司。
,德容
H。
,德瑞德
D。
,史密特
秒。
,芬克斯
对。
,王
J。
,张
G.公司。
,锂
N。
等
用全基因组测序法研究番茄(茄科番茄)枝的遗传变异
.植物J。
2014
;80
:136
–148
. 40芡欧鼠尾草
J.M.公司。
,歌曲
C、。
,布拉德伯里
P.J.公司。
,科斯蒂奇
D。
,德莱昂
N。
,德布勒
J。
,埃尔希尔
R.J.公司。
,高特
B。
,盖勒
L。
,格拉比茨
J.C.公司。
等
玉米HapMap2鉴定通量中基因组的现存变异
.自然遗传学。
2012
;44
:803
–807
. 41焦
年。
,伯克
J。
,乔普拉
对。
,伯洛
G.公司。
,陈
J。
,王
B。
,海耶斯
C、。
,埃蒙达克
年。
,器皿
D。
,Xin(新)
Z.公司。
高粱突变体资源作为禾本科植物基因发现的有效平台
.植物细胞
.2016
;28
:1551
–1562
. 42克拉西列娃
K.V.公司。
,Vasquez-Gross公司
高级管理人员。
,豪厄尔
T。
,贝利
第页。
,帕莱索
F、。
,克利索尔德
L。
,西蒙兹
J。
,拉米雷斯·冈萨雷斯
相对湿度。
,王
十、。
,博里尔
第页。
等
揭示多倍体小麦的隐性变异
.程序。国家。阿卡德。科学。美国。
2017
;114
:E913型
–E921型
. 43雷古尔斯基
M。
,卢
Z.公司。
,肯德尔
J。
,多诺霍
麻省理工学院。
,赖因德斯
J。
,利亚卡
五、。
,德尚
秒。
,史密斯
答:。
,征收
D。
,麦康比
W.R.公司。
等
玉米甲基体影响mRNA剪接位点,并揭示由小RNA引导的广泛的类似排列的开关
.基因组研究。
2013
;23
:1651
–1662
. 44陈
年。
,坎宁安
F、。
,里奥斯
D。
,迈凯轮
W.M.公司。
,史密斯
J。
,普里查德
B。
,斯普迪赫
总经理。
,布伦特
秒。
,库莱沙
E.公司。
,马林·加西亚
第页。
等
集成变体资源
.BMC基因组学
.2010
;11
:293
. 45彼得里扎克
对。
,基伊斯
M。
,唐
Y.A.公司。
,丰塞卡
不适用。
,巴雷拉
E.公司。
,伯德特
T。
,地堑
答:。
,富恩特斯
上午。
,朱普
秒。
,科斯基宁
秒。
等
Expression Atlas更新–人类、动物和植物基因和蛋白质表达的综合数据库
.核酸研究。
2016
;44
:D746号
–D752号
. 46马龙
J。
,霍洛韦
E.公司。
,阿达穆萨克
T。
,卡普什基
M。
,郑
J。
,列斯尼科夫
N。
,祖科娃
答:。
,巴西
答:。
,帕金森
H。
用实验因子本体建模样本变量
.生物信息学
.2010
;26
:1112
–1118
. 47库珀
L。
,监狱
第页。
植物本体论:植物基因组学的工具
.方法分子生物学。
2016
;1374
:89
–114
. 48库珀
L。
,墙壁
相对湿度。
,其他
J。
,甘多尔福
文学硕士。
,史蒂文森
D.W.公司。
,史密斯
B。
,普雷西
J。
,阿特里亚
B。
,蒙加尔
C.J.公司。
,伦辛
秒。
等
植物本体论作为比较植物解剖学和基因组分析的工具
.植物细胞生理学。
2013
;54
:第1页
. 49亚当·布隆登
空军。
,阿拉克斯
M。
,波米耶
C、。
,坎图
D。
,程
Z.M.公司。
,克拉默
G.R.公司。
,戴维斯
C、。
,德尔洛
秒。
,德吕克
L。
,迪·加斯佩罗
G.公司。
等
建立一个开放的葡萄信息系统
.霍尔特人。物件。
2016
;三
:16056
.
牛津大学出版社代表2017年核酸研究出版。
本作品由(a)美国政府雇员撰写,在美国属于公共领域。