跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2009; 2009年:bap005。
2009年5月8日在线发布。 数字对象标识:10.1093/数据库/bap005
预防性维修识别码:项目经理2790302
PMID:20157478

Gramene QTL数据库:开发、内容和应用

摘要

Gramene是一种植物比较信息资源,它集成了不同数据领域的数据。在本文中,我们描述了数量性状位点(QTL)数据库的发展,并说明了如何利用它来促进正向和反向遗传学研究。QTL数据库包含世界上最大的水稻QTL数据在线收集。利用侧翼标记作为锚,最初在单个遗传图谱上报告的QTL已与水稻序列进行了系统性比对,可作为标准基因组特征进行搜索。研究人员可以确定一个QTL是否与独立实验中检测到的其他QTL共定位,并可以结合多个研究的数据来提高QTL位置的分辨率。根据本体术语提供的功能注释,可以识别QTL区间内的候选基因,并推断其与特定表型的关系。在功能基因组学群体和关联映射面板中发现的突变可以与QTL区域对齐,以便于精细映射和验证基因-表型关联。QTL数据库通过汇集和整合跨物种和生物复杂性水平的各种类型的数据和信息,增强了在生物研究中理解和利用QTL信息的潜力。

介绍

Gramene是一个植物比较基因组数据库,集成了有关遗传和物理图谱、序列、标记、种质资源、基因、蛋白质、途径和表型的信息(1–3). 用户可以浏览或查询数据库,以发现感兴趣的基因和表型之间的关系。他们可以利用来自多种植物的数据来比较和对比基因、基因组、通路和表型的特征。

本文描述了Gramene中数量性状位点(QTL)的注释,并说明了如何使用该资源通过正向和反向遗传学方法识别QTL下的基因和调控序列。QTL数据库是一种资源;它包含世界上最大的水稻QTL数据在线收集,是国际水稻研究界的知识库。它有助于研究其他谷物共线区的QTL,并使研究人员能够通过使用受控词汇,在广泛的植物物种中识别与类似性状或表型相关的序列和QTL。通过提供一套完整的工具,它为植物生物学家和遗传学家提供了一种探索基因组变异和复杂表型变异之间关系的方法(4–7).

在Gramene中,QTL被确定为基因组的一个区域,该区域被预测包含一个或多个与特定性状相关的基因。QTL作图涉及对群体的分析,其中群体中的单个植物、系或家族具有一组分布良好的分子标记多态性以及一个或多个数量性状的特征。当分子多态性的分离与可测量的表型之间存在统计关联时,使用群体中的单个分离子作为复制品,则宣布QTL。感兴趣的表型可能是整个植物、器官或组织的特征,也可能是与DNA、RNA或蛋白质相关的特征。QTL分析的目的是确定共同决定感兴趣性状或表型的遗传因素的位置和相对重要性(6,8).

QTL筛选有助于水稻基因组的功能注释。QTL实际上起着基因组占位符的作用;它们标记了基因组中包含感兴趣特征基因的位置。QTL作图与农业群落特别相关,因为它提供了一种从遗传学上剖析自然发生的种质资源中发现的数量变异的方法,并提供了对控制不同感兴趣性状的基因和QTL之间的连锁和上位关系的见解。此外,植物育种家能够直接利用QTL结果进行育种项目中的标记辅助选择。QTL分析也被分子遗传学家用作基于图的克隆研究的第一步,它为定量遗传学家和进化生物学家提供了基因网络结构的全局视图,使他们能够识别与定量变异相关的关键速率限制步骤(5,7). 通过缩小搜索空间,QTL信息更容易识别数量性状下的单个基因,并提供有关每个遗传因子的位置和相对重要性的全局信息(4,9). QTL具有很高的信息量,因为它们具有连接植物生物学中不同信息领域的综合能力。这对理解复杂性状的生物学至关重要,并在数据库管理和设计中发挥关键作用。

培育QTL最紧迫的原因之一是,近年来,世界各地在动植物QTL研究方面投入了大量资源;这在已发表的文献中产生了大量的QTL信息。信息资源或中央存储库可以跨物种和生物复杂性水平汇集和整合QTL信息,其价值体现在信息以不同的格式报告,并且数据高度异质,往往是零碎的。公共数据库有责任利用尽可能多的信息,并将其组织成有用的在线资源,供不同的研究团体使用(8,10,11).

1994年至2007年间发表的大多数水稻QTL都是从文献中筛选出来的,目前可在Gramene数据库中找到。这是通过从高度异质的文本描述中提取表型信息并使用结构化词汇表和本体对其进行编码来实现的(2,10,11). 同时,用于绘制数百个不同群体QTL的数千个不同分子标记与可与水稻基因组对齐的序列相关。因此,每个QTL编码的表型和基因型之间的复杂关系现在已经被组织成一个基因组背景下的属性和信息网络,该基因组可以在Gramene数据库中搜索和检索。

材料和方法

QTL数据源

文学类

为了确定报告水稻QTL的出版物,Gramene馆长使用关键词查询了公共图书馆数据库,包括PubMed、Agricola、BIOSIS Previews和CAB摘要,例如“水稻/水稻和数量性状位点/QTL’。在筛选搜索结果的相关性后,将为每个待策展的出版物分配一个唯一的参考ID,并且所有策展的QTL都引用了原始论文。总之,在1994年至2007年间,数千篇研究论文被扫描以获取QTL数据,并保存在Gramene文献数据库中。从文献中提取的QTL数据包括QTL名称、符号、性状、相关的共定位和相邻标记、亲本菌株、杂交类型和其他相关信息。

要输入数据库的信息是根据一组优先级提取的。首要任务包括建立QTL基因组位置所需的信息,以及描述与每个QTL相关的性状或表型的信息。将性状描述映射到受控词汇,包括性状本体(to)、植物本体(PO)和植物生长阶段本体(GSO)(10–12). QTL管理的详细标准操作程序(SOP)专为处于建立QTL数据库初始阶段的策展人和研究人员设计,可在http://ascus.plbr.cornell.edu/~gramene/qtl-ms/sop/.

玉米GDB和籽粒基因QTL的整合

与MaizeGDB合作(网址:http://www.maizegdb.org/)和谷物基因(http://wheat.pw.usda.gov/GG2/index.shtml),来自玉米、小麦、大麦和燕麦的QTL,最初由这些数据库管理(13,14)已整合到Gramene中。对这两个数据库和Gramene的模式进行了比较,并确定了数据条目之间的对应关系。必要时进行额外的护理,以满足Gramene制定的标准。

在Gramene中定义单个QTL

每个实验定义的QTL在Gramene中被视为一个独立的实体。这是为了减少策展人面临的跟踪/合并问题的数量,并确保QTL被视为统计假设,而不是被确认的遗传实体。这样,如果QTL在两篇不同的论文中报道(即使来自同一组并且具有相似的遗传材料),或者如果在同一位置检测到同一性状的两个QTL,但基于不同年份或地点的实验,或者,如果QTL是通过不同的QTL分析方法鉴定的(例如,单因素方差分析(ANOVA)与复合区间作图),则每个QTL引文都作为一个独立的实体进行管理,即使作者将其报告为单个QTL。这允许数据库用户根据数据权衡QTL存在的证据;他们可以评估在不同实验中在类似位置报告假定QTL的次数。这种方法避免了单一遗传因素不可避免地对特定表型负责的假设,一旦特定基因或功能等位基因被克隆和表征,就留下了确认的空间。

QTL命名

每个QTL在Gramene中被分配一个唯一的登录标识符,例如“NQA001”。在这种情况下,第一个字符(N)用作跟踪机制,以识别处理信息的馆长;Q代表QTL;第三个字符(A)表示参考;并且以下三位数字用于区分来自同一出版物的不同QTL。这个命名法很有用,因为它提供了一种机制来跟踪由特定策展人管理的所有QTL/QTL集或与特定研究或论文相对应的所有QTL。该系统还解决了模式中的管理问题,最重要的是提供了一种允许用户从数据库查询和下载QTL的机制。

QTL研究中的遗传信息处理

与QTL相关的遗传信息的处理在Gramene中分两个阶段进行,即首先编译QTL图数据,然后分配QTL区间,如下所述。

QTL图数据

有关QTL图谱的信息由策展人填写,他首先验证相同的种群和遗传图谱信息是否已用于Gramene中已管理的先前数据集。如果数据库中已经存在此信息,则必须进行检查,以查看研究之间是否对地图集进行了任何修改。为了确定这一点,馆长必须比较两项研究中的信息,以确定它们在人口规模和结构、男性和女性父母身份、标记物类型和数量以及相应的地图显示方面是否相同。如果地图集与先前管理的地图集相同,则数据库中已有的数据将用作参考地图。如果地图集的详细信息显著不同,则会根据当前论文创建一个新的数据文件。地图上所有标记的离散位置必须输入到地图文件中。在许多情况下,已发表的论文可能不会报告所有标记的精确地图位置/间隔距离。在这种情况下,馆长联系论文的对应作者或第一作者,以获取所需信息。

QTL区间的分配

从已发表论文中提取的第二类重要信息是QTL区间。该区间表示与QTL相关的搜索空间,并且QTL下的任何基因都将驻留在该搜索空间内。如果QTL区间已明确确定(即论文规定QTL从标记延伸b条,或来自cMx个至cM在地图上,QTL的区间位置将用作染色体上的特征开始(上部)和特征停止(下部)位置。如果在论文中没有清楚地描绘QTL区间,但确定了一个“峰值标记”,则将两个最紧密相连的侧翼标记的位置(在QTL峰值的两侧)用作该QTL的起始和终止位置(上标记位置作为起始位置,下标记位置作为终止位置)。如果只提及与QTL相关的单个标记(即单点分析的结果),则该标记的位置单独用作QTL的起始和终止位置。数据表中还包括特定QTL映射到的连锁群或染色体数。

遗传区间对基因组序列的锚定

Gramene对水稻QTL到基因组位置的定位进行了如下标准化。QTL是通过从最初公布的QTL图谱中识别出的侧翼分子标记或紧密相连的分子标记来定义的。当标记为限制性片段长度多态性(RFLPs)时,获得其核苷酸序列和BLAT(类BLAST比对工具)(15)以获得该RFLP标记的基因组位置。如果标记是微卫星或简单序列重复序列(SSR),则获取引物序列并进行e-PCR以确定已测序基因组上的标记位置。如果一个关键的RFLP或SSR标记不能明确地映射到水稻基因组,但与特定QTL相关的间隔中的一个或多个标记可以映射到预期的基因组区域,则该标记用于将QTL锚定到基因组,其位置定义了QTL在基因组图上的位置。

QTL研究中表型信息的处理

Gramene的馆长建立了提取和编码与QTL研究相关的高度异质性表型信息的协议,使用本体论、证据代码和自由文本赋值的组合。这些协议概述如下。

发展描述植物表型的词汇

Gramene策展人是植物本体联盟(POC)的开发人员和合作者(http://www.plantology.org/). POC为植物本体论(PO)和植物生长发育(GSO)开发和维护受控词汇或本体,以进行注释(10,11,16). Gramene中使用的其他词汇/本体,如环境本体(EO)和特征本体(TO),都是在内部开发的。TO(收件人)(12)是基于在农学和植物育种界广泛使用的表型分析和词汇开发的。当策展人或用户要求对新的表型特征进行注释时,这些本体正在持续维护,并积极添加新的术语。

与本体术语的关联

每个QTL都与to中一个术语对应的性状名称相关联。性状符号来自性状名称,例如。植物高度带有符号PTHT,用于显示联动组上的QTL位置。QTL在比较地图查看器CMap中显示为地图上的要素(http://gmod.org/wiki/CMap)以及在水稻基因组浏览器中。与农艺或植物育种分类相对应的性状有九类,它们包括产量、籽粒品质、生物胁迫、非生物胁迫、不育/育性、活力、解剖学、发育和生物化学。

QTL的已发布符号与作者在原始出版物中描述的名称或符号相对应。每个QTL还与解剖部分植物和特定生长或发育阶段与评估性状的器官或组织和发育时间相对应。在Gramene中,来自PO的条款(10)和GSO(11)用来描述这些解剖特征和发育阶段。此外,使用EO中的术语记录环境条件和用于确定表型的任何补充治疗。

证据代码的使用

在Gramene中,所有QTL注释都由证据代码的使用支持。这些代码表明了文献中可用的数据,以支持各种推断,包括“通过基因型与表型的关联推断”(IAGP)、“由策展人推断”(IC)、“起始材料”(SM)。此外,除了基因本体数据库开发的证据代码外,内部还开发了一些证据代码。证据代码还用于根据描述QTL的已发表论文中的信息表示与本体术语的特定关联。

数据库架构

为QTL数据库开发的模式和所有QTL数据均可从Gramene ftp网站下载:ftp://ftp.gramene.org/pub/gramene/CURRENT_RELEASE/data/database_dump/mysql-dumps。

结果

与QTL相关的表型使用提供对比表型状态的特定遗传材料进行评估。从历史上看,来自对照杂交的双亲群体被用于鉴定QTL,但越来越多的QTL是通过关联或连锁不平衡作图来鉴定的(17). 在任何QTL研究中,特定性状或表型特征都是在一组确定的环境条件下进行分析的。描述表型和基因型之间关系的遗传学研究将体现遗传背景中基因座和等位基因之间的一系列相互作用,以及基因型和分析种群的环境之间的相互作用。馆长利用生物信息学工具、本体论和自由文本的组合,解决了描述每个不同数据元素(基因、等位基因、遗传群体、表型和环境)之间的关系以及将每个元素与数据库中所有其他条目链接的复杂问题。

QTL数据采集及其意义

1988年发表了第一篇植物QTL论文(18),自那时以来,已经发表了数千项植物QTL研究,包括617篇报道水稻QTL的论文,454篇报道小麦QTL,364篇报道玉米QTL。图1总结了水稻、小麦、玉米、番茄和拟南芥在过去21年的四大参考数据库中。在格拉梅,已经为大米策划了230多篇论文。这一数字仅占水稻出版物总数的38%,因为Gramene馆长对数据库中的内容提出了某些要求。他们的标准包括:(i)地图集信息的可用性;(ii)使用基于序列的标记将QTL锚定在基因组上(例如,扩增片段长度多态性(AFLP)和多态性DNA随机扩增(RAPD)标记无法对齐);(iii)以英语发布信息的可用性。在剔除不符合这些标准的论文后,合格水稻QTL论文的数量被削减到略低于40%。

保存图片、插图等的外部文件。对象名称为bap005f1.jpg

水稻、小麦、玉米、,拟南芥以及1987年至2007年间的番茄。根据PubMed、Agricola、CAB Abstracts和BIOSIS Previews四个公开文献数据库的非冗余数据,图表显示了1987年至2007年间报告五种主要植物QTL的出版物稳步增加。

Gramene Build 28中的QTL统计

Gramene中的QTL模块有助于水稻基因组的功能注释,这是一个涉及到已测序基因组上连续分层信息的过程,它将基因组划分为数千个特定区域,这些区域很可能包含控制数量性状的基因。2003年开始在Gramene数据库中积极筛选QTL,自那时以来,已筛选出11000多个属于水稻、珍珠粟、谷子、玉米、小麦、大麦和燕麦的QTL(表1). 水稻的QTL数量远高于其他物种,反映出Gramene优先关注水稻作为第一个测序作物基因组,这与水稻QTL识别率较高相对应。已投射到12条水稻染色体上的水稻QTL数量见表2.QTL论文发表数量的快速增长(图1)需要一致的努力来获取这些信息,将其集成到数据库中并保持最新。QTL管理是劳动密集型的,很少有专家准备处理这方面的数据管理,因此信息分阶段提取,并且正在开发新的方法来帮助自动化这一过程。已经制定了广泛的质量控制协议并付诸实施,以确保所收集数据的准确性。

表1。

10种谷物Gramene数据库中QTL及其相关特征的总结

根据构建28更新。大米玉米小麦四倍体小麦燕麦大麦高粱珍珠粟Foxtail小米野生稻总计
QTL86461747238375299136284654111624
TO:特征23777107301927210332
TO:特征类别b条9825756159
PO:结构c(c)381952687152548
PO:生长阶段d日1996255772520
地图集e(电子)89892182511126
亲本种质(f)91442271222108
共定位标记30950361573148883353341031874237369
相邻标记小时16422312037145612585585351227421671
已发表论文24656112192611335

TO:traits-由TO术语定义的用于注释QTL的独特表型性状的数量。

b条TO:特征类别——TO中命名的九类特征;TO中的这个高阶节点用于聚类相关性状。

c(c)PO:structure—用于描述QTL的解剖学术语数量(唯一术语总数=48)。

d日PO:growth-stage用于描述QTL的生长阶段术语数量(唯一术语总数=20)。

e(电子)图谱集——QTL研究中使用的唯一图谱群体标记数据集的数量。

(f)亲本种质——QTL定位研究中用作亲本的不同菌株或材料的数量。

共定标标记——在QTL区间内作图的标记;>已筛选出37000个标记,并用于将QTL锚定到水稻序列图上。

小时邻近标记是QTL区间两侧的标记;>已经收集了21000个相邻标记,并用于构建比较地图。

表2。

水稻QTL的分布

变更。变更。长度(Mb)QTL数量具有基因组位置的QTL与性状类别术语Vigor相关的QTLb条与株高相关的QTL
143.612741026255157
235.98435909644
36.31069755181102
435.276950011360
529.96675129953
631.28266328430
729.76534488228
828.36464537831
9235193927846
1022.93973124831
1128.55464229240
1227.54372514916
总计372864662931255638

由于某些出版物(如AFLP、RAPD等)缺乏必要的信息,在已测序的水稻基因组上具有位置的QTL数量少于所收集的QTLs总数。

b条TO性状类别术语“活力”对与出苗率、生物量积累等有关的性状进行了注释。

QTL图谱集、标记和亲本杂交

Gramene的QTL数据库现在包含10个不同物种的126个QTL图谱集,包括11 624个QTL、40 553个标记、37 369个QTL共定位标记和21 671个QTL相邻标记。QTL图谱集是有价值的在线资源,研究人员广泛使用这些资源来寻找有关不同种质资源和作图群体的等位基因组成的信息。表3总结了来自五个不同物种的选定地图集(共126个)的信息,并突出显示了与每个物种相关的特定特征。

表3。

禾本科五个物种7个QTL图谱集的相关信息样本

映射集名称物种QTL(数量限制)地图上的标记数量共定位标记相邻标记亲本种质相关QTL研究数量
1.康奈尔IR64/Azu DH QTL 2001大米275588287203IR64,阿祖塞纳9
2.IRRI IR64/Azu DH QTL 2003大米137228125292636IR64,阿祖塞纳23
3.JRGP Nip/Kas F2 QTL 2000大米3513263127321185日本,卡萨拉斯33
4.UWM B73/Mo17 RFLP SSR QTL 1996玉米66186125120B73,17月
5.合成/Opata RI RFLP/SSR QTL 1995小麦194311合成,Opata4
6.Steptoe/Morex DH RFLP QTL 2006大麦33312166莫雷克斯·斯特普托1
康奈尔·坎/奥格尔QTL 1995燕麦375249888528卡诺塔,奥格尔1

“合成”意味着母体为Altar84/A3。角鲨糖(219)IGM86.940。

在Gramene中QTL以两种方式显示;使用通用模型生物数据库(GMOD)CMap应用程序,这是一个可以同时显示多张地图的比较地图查看工具(http://gmod.org/wiki/CMap),并使用基于集成的基因组浏览器(2),在参考基因组和相关注释的背景下显示QTL位置。

基于本体的QTL注释

已发表的表型描述中的语义异质性问题一直是科学界面临的一个长期挑战。自由文本描述是数据管理中的一个主要障碍,在基因组数据库中,描述性信息必须规范化或标准化,以便机器可读,然后才能与基因组中的其他特征相关联。这与基因组和蛋白质序列数据的标准化和高度自动化表示形成了鲜明对比。由于必须注释的数据规模很大,数据库中数据类型之间的关联也很复杂,Gramene策展人和开发人员参与或率先开发了几个关键本体(10–12,16).

本体论提供了一个受控词汇网络,通过反映其描述的生物现实的关系连接起来,用于促进基于机器的查询,从而可以从数据库中快速提取信息。来自TO、PO、GSO和EO的术语用于记录每个研究的基本表型信息。TO目前由973个术语或概念组成,用于描述植物性状或表型分析,在当前版本的数据库中,344个TO术语用于注释QTL(表1). PO有两个方面,一个涉及植物解剖,另一个涉及到植物生长阶段。PO中有853个术语,GSO中有275个术语,但大多数QTL仅在少数可能的组织、器官和生长阶段进行了分析。目前,49个独特的解剖学术语和水稻生命周期的大约15个不同阶段与策划的QTL有关(表1). EO中有超过496个术语描述了植物生长的主要环境,包括温度、水分和日照条件、营养状况、虫害和病原体暴露,以及是否在温室、生长室或田间条件下进行实验等。然而,大多数历史QTL研究提供的关于定义植物生长条件的特定环境参数的信息很少,因此,只有大约27个EO术语被用于注释Gramene中的QTL,其中许多与作为处理施加的特定生物或非生物胁迫有关。

用不同本体的术语注释QTL提高了数据库的查询潜力(有关Gramene中TO和QTL数据库的逐步使用,请参阅pdf教程http://www.gramene.org/tutorials/QTL_tutorial.pdf). 例如,TO注释支持诸如“显示与水稻开花时间或幼苗活力相关的所有QTL”或“显示水稻、大麦和玉米的所有开花时间QTL。”。此外,因为每个QTL都被定义为基因组上的一个位置,用户可以问:“显示标记之间与开花时间相关的所有QTLX(X)和标记在水稻6号染色体上。带有PO术语的注释允许用户询问“显示与“小穗分生组织”或“胚胎发育”相关的所有QTL”(10). EO可以查询与植物对特定环境条件(如白叶枯病或日照时长)的响应相关的QTL。

显示和导航功能

条目

Gramene的QTL模块的主要入口点是通过Gramene导航栏上的“QTL”链接。用户可以通过性状名称、性状符号、性状类别、连锁组、已发布的QTL符号、Gramene QTL登录号或QTL相关基因和标记或PO术语等关联来搜索QTL。QTL搜索界面将用户对QTL的规范传输到数据库,并将响应呈现为包含可下载的QTL记录子集或特定QTL详细信息页面的单个网页。

与其他模块的链接

QTL数据库与标记、地图、基因组浏览器、本体、文献、基因和遗传多样性数据库等其他模块链接。此外,还提供了与其他QTL数据托管在Gramene中的数据库的链接,例如MaizeGDB和GrainGenes。

其他

整个数据库目前每年有两个数据发布周期,QTL发布说明已更新,当前统计数据可在ftp://ftp.gramene.org/pub/gramene/CURRENT_RELEASE/data/statistics/qtl_statistics/

广泛的PDF教程可帮助新用户浏览QTL数据库(http://www.gramene.org/tutorials/QTL_tutorial.pdf). QTL页面上的反馈按钮允许用户与Gramene管理员和开发人员进行交流。反馈查询通常在48小时内得到响应。

利用QTL模块进行基因发现的广义模型

正向遗传学

在下面的例子中,我们将演示如何整合来自Gramene的数据和信息,以便于基于正向遗传学方法识别QTL下的基因或调控序列。

株高是一个复杂的性状,反映了植物对环境中内部发育信号和外源刺激物的反应能力。它在谷物中得到了广泛的研究,并被广泛用作田间植物活力的指标和植物育种项目中的选择标准。在我们的例子中,一位水稻遗传学家在已发布的IR64/Azucena QTL图谱上鉴定出一个株高QTL,该QTL在第9染色体上跨越39.2 cM区间,两侧有两个RFLP标记(RZ206和RZ12)(19,20)QTL被管理为“CQAX26”,可以在数据库中使用此ID进行搜索。我们希望使用Gramene数据库对QTL进行数字精细定位,并从遗传图上的QTL区间移动到物理或序列图上的位置,再移动到候选基因列表。

通过查询“CQAX26”并点击链接,用户可以找到有关QTL的信息,包括“映射位置”、“关联标记”、“关联基因”、“关联本体”和“数据库交叉引用”。点击“Map Positions”(映射位置)可提供有关QTL在序列图上的位置、QTL所包含区域的物理大小(7.62 Mb)以及遗传(QTL)图的链接的信息。在QTL图谱类型中,我们可以打开“CMap预览”链接,查看IR64/Azucena作图群体中与第9染色体相关的所有QTL,并允许用户查看与水稻序列图对齐的株高QTL(RZ206、RZ422、RZ228和RZ12)两侧标记的位置(补充图1). 在序列图类型中,可以单击“基因组浏览器中的视图”来识别该区域的众多分子标记,包括100多个SSR和十几个RFLP(补充图2a). 如果研究人员想要实验性地精细定位QTL,这些可能是有用的。例如,可以点击感兴趣的标记,并从Gramene标记数据库中打开一个页面,以获得有关引物对、PCR条件或标记分析的其他特性的信息(补充图2b). 利用可用的标记和序列信息,研究人员可以进行湿式实验,以在大规模精细绘图群体中寻找信息丰富的重组子。

随着精细绘图的进行,Gramene的基因组浏览器可以用来提供水稻9号染色体特定部分的高分辨率视图(补充图3)从而可以根据一组候选基因明确侧翼标记的精确位置。从该区域的详细视图中,她/他可以确定构成候选基因第一通过列表的基因模型。

基于GO本体注释和Gramene中可用的BLAST搜索工具,基因序列列表可用于查找其他模式生物中的同源物,例如拟南芥或者玉米。在许多情况下,候选基因可能与生化途径有关(http://www.gramene.org/pathway网站/)和/或基于GO注释的假定基因功能(http://www.gramene.org/plant_ontology/index.html). Gramene还提供了与已知功能和/或可测量表型变异基因相关的自然和诱导突变的信息[即来自具有侧翼序列标签(FSTs)的功能基因组学群体](补充图4). 已知图谱位置的功能突变可以对齐,以确定哪些(如果有的话)属于目标QTL区域。

仔细观察第9染色体上株高QTL内的基因模型,发现该区域的四个预测基因是株高QTL CQX26下基因的合理候选基因。其中,三个(LOC_Os09g24800、LOC_Os 09g24810和LOC_Os09g24840)是拟南芥用GO术语注释的基因吉布林相关'或'油菜素甾醇相关’ (补充图5)众所周知,这两个术语都与植物生长发育相关的途径有关。此外,基因LOC_Os09g25150是油菜素类固醇途径的一部分,如Gramene内的途径数据库RiceCyc所述(http://pathway.gramene.org/RICE/server.html?). 在Gramene中的另一次搜索发现了7条T-DNA插入线(CL522872.1号文件,CL523877.1类,CL523487.1号等)(21)FST定位在小而精细的QTL区域内(14704764–15064206bp)。

位置信息、突变体、标记、种质和表型的组合为数据库用户提供了多种方法来解决鉴定QTL基因的问题。突变株系可能对互补实验和功能分析感兴趣,而这些实验和分析最终需要验证表型基因假说。这里概述的例子清楚地说明了QTL数据,以及来自Gramene的其他类型的数据和工具,可以如何用于促进缩小QTL区域的工作,选择和验证影响复杂表型的候选基因(图2). 如果没有发现候选基因,数据库将主要用作识别序列多态性和澄清位置信息的资源,以便进行精细定位和位置克隆。一旦对定量遗传表型起因果作用的基因或序列变体得到确凿证明,该数据库也将作为该信息的存储库,以便下一代用户在将基因型变异和表型变异联系起来时可以利用该数据库。

保存图片、插图等的外部文件。对象名为bap005f2.jpg

候选基因发现的广义模型。该图显示了Gramene数据库中信息模块的简化视图。该图旨在显示虚线上方复杂性状的正向遗传解剖和粗虚线下方反向遗传调查的路径。实际上,如箭头所示,可以从任何入口点访问数据库,并且用户可以导航到所需的信息。Gramene提供了显示在淡灰色框左侧的自动分析工具,以及使用显示在虚线框右侧的本体和受控词汇表进行手动管理,以增强数据库的数据挖掘潜力。浅灰色框中包含的QTL和EST模块之间的关联突显了这样一个事实,即用户可以系统地关注复杂表型和感兴趣的候选基因之间关系的信息。如图所示,性状或复杂表型通过定位图和标记与被鉴定为QTL的基因组区域以及之前注释到基因组区域的EST和基因模型相关联;因此,QTL数据库具有将分子或基因型信息与复杂表型联系起来的关键功能,更广泛地说,它将分子生物学领域与数量遗传学和植物育种领域联系起来。

反向遗传学

下一个示例从反向遗传学的角度说明了数据库导航。在本例中,我们将重点关注水稻中的铁吸收,这是一种特征鲜明的代谢途径。

铁是植物几乎所有维持生命的生理和细胞过程中的基本元素。它是呼吸、光合作用、DNA合成、N2固着和荷尔蒙生成[综述,见Guerinot(22)]. 植物利用两种主要的、严格调控的铁吸收机制:还原和螯合。包括一些转录因子在内的这些途径的几个基因已经被克隆并鉴定(23,24).

将来自生物化学和分子研究的信息整合到应用育种项目中面临着几个挑战。机械信息不容易转化为在市场上取得成功的新品种。这就提出了一个问题:我们能否将我们所了解的关键生化途径的分子机制转化为有关表型的预测信息,这些表型可以在田间条件下在整体水平上进行测量?是否有一种系统的数据挖掘方法可以让我们提取线索,了解如何操纵特征明确的生化途径和基因网络,以在农业生产的背景下实现一组期望的表型结果?

缺铁性黄化(IDC)或绿色色素损失是影响植物无法获得和利用铁的条件。这些植物的幼叶发生叶片失绿,导致产量损失,特别是在碱性土壤中,高pH值降低了铁的溶解度。因此,碱性土壤中的IDC不是由于缺铁,而是由于缺乏铁吸收(25). 相反,当水稻生长在淹水、厌氧条件下或酸性水稻土中时,植物根系中铁的过度积累会导致铁中毒。由于游离铁催化活性氧物种的形成,这会对植物造成严重损害(26,27). 因此,为了提高厌氧土壤和需氧土壤的生产力,有必要选择对铁的过量或不足作出适当反应的植物,了解铁吸收途径及其调控有助于实现这一目标。

有关Fe-摄取途径的遗传和生物化学的治愈信息出现在Gramene内的几个不同的子数据库中,即基因、蛋白质、途径和QTL数据库。虽然已经发表了几个“铁毒性”QTL,但尽管该问题普遍存在,但还没有水稻IDC的QTL报告(28,29).

我们利用反向遗传学进行了一项研究,试图根据分子和生化信息确定已知在Fe摄取途径中重要的基因与利用Gramene数据库可能与IDC症状相关的QTL相关的性状或表型之间的关系。我们的基本假设是,IDC在水稻中可能被描述为一个整体表型,其与Fe-摄取途径的联系可能并不明显(图3).

保存图片、插图等的外部文件。对象名称为bap005f3.jpg

水稻的吸铁途径:通过途径、基因和QTL将基因克隆到复杂性状。与左上角所示的水稻第3号染色体的CMap视图对齐的叶片衰老QTL;水稻第3染色体QTL区域的基因组浏览器视图及相关基因模型如中心所示;DMA代谢途径如右上角所示;水稻植株表现出耐铁黄化表型和铁毒性表型。木瓜酸(MA)或植物铁载体是DMA代谢途径的最终产物。MA的生物合成与缺铁密切相关,并受到高度调节,以避免因过量铁吸收而产生毒性。该图代表了策划的DMA路径的部分内容;从该途径克隆的基因的基因组位置用于在该区域追踪合适的QTL候选。对这些QTL进行分析的群体可用于育种计划,以培育耐缺铁或铁过量土壤环境的水稻品种。

为了启动我们的搜索,我们观察了与铁黄化相关的主要生理过程之一(光合作用,特别是幼叶中绿色色素沉着的丧失),并搜索了具有相关表型表达的QTL。水稻中的植物铁载体生物合成途径称为脱氧铜绿酸(DMA)途径,有两个关键的酶步骤,分别由烟酰胺合成酶(OsNAS1=LOC_OsO3g19427;OsNAS2=LOC_OsO3g19420;和OsNAS3=LOC_OsO7g48980)和烟酰胺转移酶(Os NAAT1=LOC-OsO3g 13390)催化。我们通过搜索NCBI数据库获得了这些酶的基因序列,并对这些基因序列进行BLAT分析,以确定其基因组位置。然后,利用基因的物理位置,我们在Gramene中搜索QTL数据库,以确定所有与基因模型重叠的QTL。

我们通过输入QTL模块并搜索通配符(*)获得数据库中所有QTL的列表。然后,我们可以通过连锁群进行筛选,然后对物种进行第二次筛选,以仅获得水稻第3染色体上的QTL。该列表可以下载并按位置排序,以识别感兴趣的内容。一旦确定了这一QTL子集,就可以通过性状名称进行搜索,以确定与铁黄化相关的那些QTL,并且QTL页面中列出的“共定位”和“相邻”标记可以用于将遗传图(cM)与序列图(bp)对齐(如[补充图1]). 更正式地说,我们搜索了分配给NAS和NAAT基因的GO注释与分配给QTL的PO和to注释之间的交叉点,以确定可能与IDC合理相关的QTL。最显著的是与“叶片衰老”相关的QTL,这些QTL定位于第3染色体上的OsNAS基因区域。这种想法背后的基本原理是:(i)光合作用是与DMA途径相关的主要生理过程,(ii)由NAS和NAAT基因介导的缺铁吸收导致光合作用受损,以及(iii)光合作合作用受损导致叶片失绿,最终导致叶片衰老。为了支持这一逻辑,最近的研究表明,衰老加剧与缺铁诱导的基因表达有关(30). 在缺铁条件下生长的水稻幼苗诱导了与叶片衰老典型相关的基因(31).

这个例子展示了QTL数据库如何帮助整合信息,使研究人员能够探索不同数据域、表型描述符、种质资源、基因、蛋白质和通路之间的关系(图3). 它强调了IDC的遗传机制与叶片衰老的遗传机制之间存在逻辑上但数字上隐蔽的联系。这为询问我们是否可以利用在铁充足和缺铁条件下观察到的叶片衰老变化来鉴定可能在植物育种项目中作为IDC抗性供体有用的种质或群体提供了依据。通过这种方式,QTL模块可以帮助研究界开始弥合我们对遗传机制的理解与我们识别携带有价值等位基因的作物改良种质资源的能力之间的差距。

讨论

Gramene QTL数据库在基因发现中的应用

QTL的最初概念是由萨克斯首次提出的(32)早在DNA标记技术出现之前。今天,遗传学家面临的最大挑战之一是确定QTL背后的基因或调控序列,了解它们的分子功能以及它们如何在生化和调控途径中相互作用以确定表型(5). 在开发Gramene中的QTL模块时,我们遇到了遗传学界在实现这一目标方面面临的几个主要障碍:(i)有关QTL的信息深深地埋藏在数百种不同的出版物或研究人员的文件中,这使得研究界很难共享信息;(ii)使用不同的名称、术语和概念来定义或描述不同物种和研究群体的解剖部位、发育阶段和感兴趣的特征;(iii)QTL使用不同的标记和作图群体绘制到不同的遗传图谱上,这使得很难比较不同群体、图谱和物种的QTL位置;和(iv)QTL区间通常包含较大的基因组区域,通常覆盖10–20 cM,可能包括至多2000个基因(6)这使得基于个别研究确定QTL下的基因几乎是不可能的。因此,精细作图被广泛用于更准确地定位QTL,即定位到包含<25个基因的<1cM区域,但这种策略需要投入大量时间和资源,并且无法有效利用历史数据。

为了应对上述挑战,Gramene策展人开发了一种QTL资源,提高了研究人员更有效地利用先前发布的数据来识别QTL背后的基因的能力。首先,他们收集了有关水稻和相关谷物物种QTL的出版物,并建立了一个中央文献库。接下来,从已发布的来源中手动提取QTL信息,并使用受控词汇表和自由文本进行注释。使用受控词汇,仔细描述和定义了与解剖学术语或发育阶段相关的农艺性状和QTL。这使得在研究和跨物种之间比较与QTL相关的表型成为可能。

对于QTL,使用侧翼标记作为介体,最初在单个遗传图谱上报告的QTL已经系统地与水稻序列图对齐,现在可以作为标准基因组特征进行搜索。以水稻基因组为共同平台,研究人员现在能够确定感兴趣的QTL是否与独立QTL实验中检测到的与相同或相似性状相关的其他QTL共定位。该数据库还便于组合来自多个数据集的数据,以提高QTL位置的分辨率。研究人员可以更可靠地识别与目标QTL共定位的候选基因列表,然后他们可以使用GO术语作为功能分隔符来选择候选基因的短列表。最终,来自大规模高通量实验的表达和代谢数据,如微阵列或蛋白质数据,可以与QTL结果集成。此外,双亲QTL研究中使用的亲本种质和子代系(双单倍体系、重组系、近等基因系)、具有标记感兴趣突变的FST的功能基因组学群体以及关联映射面板也可以联合用于进一步精细定位和基因功能验证。尽管研究人员很少引用用于促进基因发现工作的数据库,但Gramene被广泛用于支持此类活动(33,34).

QTL数据库在植物育种中的应用

QTL和trat-associated标记在植物育种和选择中的应用至关重要。Gramene中有两类QTL相关标记,共定位QTL标记和相邻QTL标志。除此信息外,研究人员还可以使用Gramene从其他地图上的相应区域轻松识别其他标记,然后使用CMap将感兴趣的区域相互对齐并与水稻基因组对齐。然后,研究人员可以从目标区域的可用标记列表中选择一组有用的标记,用于精细定位或直接促进标记辅助育种程序中的性状选择。

Gramene还提供了QTL研究中使用的种质和遗传材料的信息。这类信息为植物育种家提供了一种有用的资源,他们寻求识别包含有利等位基因的亲本种质和后代系,或在特定农艺性状的有利和不利等位基因之间发生有利重组事件。这些品系也可以作为关联作图实验的遗传材料。最后,利用基于序列的共识图作为桥梁,研究人员能够识别突变株系,例如T-DNA插入株系,其中FST信息表明T-DNA元素可能改变了在感兴趣的QTL区域内映射的基因的表达或功能。因此,Gramene提供了一种独特的数据集成形式,使研究人员能够轻松找到有关QTL-FST共定位的信息,并弥合遗传研究和育种应用之间的主要差距。

在本文中,我们重点关注QTL信息资源的开发和利用,该资源有助于将分子信息与表型信息和传统育种应用联系起来。然而,除了通过杂交和基因重组操纵自然发生的遗传变异外,基因工程的使用对植物育种家来说也是非常有趣的。Gramene的QTL数据库提供了有价值的信息,有助于识别候选基因和优势等位基因,以用于常规杂交和选择方案以及转基因在植物改良中的应用。合理利用遗传多样性是所有成功的作物改良战略的基础,关于物种内部和物种之间存在的组成和变异范围的知识,是植物育种家努力建设性地操纵遗传变异以实现全球农业系统长期生产力和可持续性的基础。

QTL数据库的比较能力

禾本科植物基因同源性和保守联系的进化研究(35–37)支持将草视为单一遗传系统的观点。Gramene数据库以系统发育学的基本原理为中心。最近,Gramene扩大了其在植物界的覆盖范围,包括几个关键的双子叶植物物种,使其成为植物更强大的比较基因组资源,并扩大了其广泛的用户群。

基因分型和重测序技术成本的下降和效率的提高推动了关联绘图项目的产生,该项目生成的数据集由数千或数百万个SNP组成,这些SNP对许多植物物种中的数百或数千个个体进行了评估。大量多样性数据为比较表型、基因型和表达分析的新方法奠定了基础。随着Gramene数据库扩展其模式以吸收这些新数据,分离QTL基因的挑战变得更加容易。正向遗传学方法通过比较基因组可与水稻对齐的不同物种的表型和基因组信息来促进,而反向遗传学方法则通过广泛物种候选基因的功能信息的不断增加而得到加强。CMap广泛用于远程比较绘图,基因组浏览器提供保守基因和区域的特写视图。通过使用本体和改进的数据挖掘工具,表型比较大大增强。

未来发展

Gramene的QTL数据库发展迅速,从管理简单的核心QTL信息到使用各种统计方法注释多维遗传多样性数据的模型。目前正在努力收集和注释一些大规模QTL和关联图谱研究的原始表型和基因型数据。收集原始数据将使研究人员能够应用公开可用的软件,如TASSEL(T型莱特a的分析不锈钢关联,电子进化和L(左)墨迹)(38,39)和R/qtl(网址:http://www.rqtl.org/),重新分析现有数据集,以通过深度数据挖掘捕获新特征,并通过集成多个QTL和关联映射数据集来提高分析的分辨率。通过这一努力,遗传学家将能够更准确地识别特定QTL的峰值标记,识别包含不同性状的有利等位基因的育种系和基因组资源,评估特定品系的育种值,并量化特定基因或QTL在给定材料集中解释的表型变异百分比。Gramene致力于以标准化格式开发一个大型、多物种的原始QTL数据存储库,这将大大加强在这一级别上的数据挖掘。此外,我们希望与发表QTL论文的期刊合作,开发一种机制,将已发表的数据可靠地传输/捕获到Gramene数据库中。

为了增强Gramene的分析能力,以确定QTL下的候选基因,并将这些基因映射到相关的生化途径,还正在进行更多的努力。这些工作的基础是开发算法和新的统计方法,以便于在比较环境中进行基因发现。这些新方法将增强现有信息和战略的效用。

最后,我们旨在增强数据库的查询能力并提供批量下载功能。借助Gramene Mart和其他搜索界面简化数据挖掘和查询例程,用户很快将能够处理关于遗传、遗传机制和数量遗传性状进化的日益复杂的查询。

补充数据

补充数据可在数据库在线。

基金

国家科学基金会,植物基因组研究计划(DBI 0703908 to L.S;subward to S.McC.)。

利益冲突:未声明。

致谢

我们感谢众多QTL出版物的作者通过个人交流与我们分享有关QTL、标记和地图的信息。我们感谢MaizeGDB的Carolyn Lawrence和Mary Schaeffer,GrainGenes的Dave Matthews和Victoria Carollo,Oryzabase的Yukiko Yamazaki,IRIS的Richard Bruskiewich和Graham McLaren,感谢他们的合作和数据共享。我们非常感谢Lois Swales的格式化。

工具书类

1Ware DH、Jaiswal P、Ni J等。禾本科植物基因组学工具Gramene。植物生理学。2002;130:1606–1613. [PMC免费文章][公共医学][谷歌学者]
2Jaiswal P、Ni J、Yap I等。禾本科植物:谷类基因组鸟瞰图。核酸研究。2006;34:D717–D723。 [PMC免费文章][公共医学][谷歌学者]
三。Liang C、Jaiswal P、Hebbard C等。禾本科植物:一种生长中的植物比较基因组学资源。核酸研究。2008;36:D947–D953。 [PMC免费文章][公共医学][谷歌学者]
4Ballini E、Morel J-B、Droc G等。水稻抗稻瘟病基因和数量性状位点的全基因组meta分析为部分和完全抗性提供了新的见解。分子-植物-微生物相互作用。2008;21:859.[公共医学][谷歌学者]
5McMullen MD、Byrne PF、Snook ME等。数量性状位点和代谢途径。程序。美国国家科学院。科学。美国。1998;95:1996–2000. [PMC免费文章][公共医学][谷歌学者]
6价格A。信不信由你,QTL是准确的。植物科学趋势。2006;11:213–216.[公共医学][谷歌学者]
7Wentzell AM,Rowe HC,Hansen BG等。将代谢QTL与控制生物合成途径的网络和顺式eQTL联系起来。公共科学图书馆-遗传学。2007;:e162。 [PMC免费文章][公共医学][谷歌学者]
8Peters LL、Robledo RF、Bult CJ等。小鼠作为人类生物学模型:复杂性状分析资源指南。Nat.Rev.基因。2007;8:58–69.[公共医学][谷歌学者]
9Vergne E、Ballini E、Droc G等,《ARCHIPELAGO:利用水稻抗病调控的过去、现在和未来基因组数据的专用资源》。分子-植物-微生物相互作用。2008;21:869.[公共医学][谷歌学者]
10Ilic K,Kellogg EA,Jaiswal P等。植物结构本体论,开花植物解剖学和形态学的统一词汇。植物生理学。2007;143:587–599. [PMC免费文章][公共医学][谷歌学者]
11Pujar A、Jaiswal P、Kellogg EA等。被子植物的全植物生长阶段本体及其在植物生物学中的应用。植物生理学。2006;142:414–428. [PMC免费文章][公共医学][谷歌学者]
12.Jaiswal P,Ware D,Ni J,等。禾本科植物:水稻性状和基因本体的发展与整合。公司。功能。基因组学。2002;:132–136. [PMC免费文章][公共医学][谷歌学者]
13.O'Sullivan H.谷物基因:小麦科和燕麦属的基因组数据库。作者:Edwards D,编辑。植物生物信息学:方法和协议。人类出版社:布里斯托尔;2008年,第301-314页。[谷歌学者]
14Lawrence CJ、Schaeffer ML、Seigfried TE等。MaizeGDB的新数据类型、资源和活动。核酸研究。2007;35:D895–D900。 [PMC免费文章][公共医学][谷歌学者]
15肯特·WJ。BLAT–类似BLAST的对齐工具。基因组研究。2002;12:656–664. [PMC免费文章][公共医学][谷歌学者]
16Avraham S,Tung CW,Ilic K,et al.植物本体数据库:植物结构和发育阶段控制词汇和注释的社区资源。核酸研究。2008;36:D449–D454。 [PMC免费文章][公共医学][谷歌学者]
17荷兰JB。植物复杂性状的遗传结构。货币。操作。植物生物学。2007;10:156–161.[公共医学][谷歌学者]
18Paterson AH、Lander ES、Hewitt JD等。利用限制性片段长度多态性的完整连锁图将数量性状解析为孟德尔因子。自然。1988;335:721–726.[公共医学][谷歌学者]
19Huang N,Courtois B,Khush GS,等。水稻株高数量性状位点与主要矮秆基因的关联。遗传。1996;77:130–137. [谷歌学者]
20Ramalingam J、Vera Cruz CM、Kukreja K等。水稻、大麦和玉米的候选防御基因及其与水稻质和量抗性的关系。分子-植物-微生物相互作用。2003;16:14.[公共医学][谷歌学者]
21Jeon J-S,Lee S,Jung K-H,等。水稻功能基因组的T-DNA插入突变。工厂J。2000;22:561–570.[公共医学][谷歌学者]
22Guerinot ML.这是最基本的:加强Fe3+还原可以提高水稻产量。程序。美国国家科学院。科学。美国。2007;104:7311–7312. [PMC免费文章][公共医学][谷歌学者]
23Koike S、Inoue H、Mizuno D等。OsYSL2是一种受铁调节并在韧皮部表达的水稻金属-烟酰胺转运蛋白。工厂J。2004;39:415–424.[公共医学][谷歌学者]
24Ogo Y、Itai RN、Nakanishi H等。水稻bHLH蛋白OsIRO2是铁缺乏条件下参与铁吸收的基因的重要调节器。工厂J。2007;51:366–377.[公共医学][谷歌学者]
25Kim SA,Guerinot ML,《铁矿开采:植物中的铁吸收和运输》。FEBS信函。2007;581:2273–2280.[公共医学][谷歌学者]
26Guerinot ML,Yi Y.铁:营养丰富,有毒,不易获得。植物生理学。1994;104:815–820. [PMC免费文章][公共医学][谷歌学者]
27Briat JF,Lebrun M.《植物对金属毒性的反应》。C.R.学院。科学。(三)。1999;322:43–54.[公共医学][谷歌学者]
28O'Rourke JA、Charlson DV、Gonzalez DO等。近等基因大豆品系缺铁性黄化的微阵列分析。BMC基因组学。2007;8:476. [PMC免费文章][公共医学][谷歌学者]
29Wang J,McClean PE,Lee R,等。大豆(Glycine max L.Merr.)高级育种系缺铁性黄化基因座的关联作图。理论。申请。遗传学。2008;116:777–787.[公共医学][谷歌学者]
30Sperotto RA,Boff T,Duarte GL,等。缺铁导致水稻根系衰老相关基因表达增加和脂质过氧化。植物细胞代表。2008;27:183–195.[公共医学][谷歌学者]
31Speroto RA,Ricachenevsky FK,Fett JP。水稻芽缺铁:利用RDA鉴定新的诱导基因及其与叶片衰老的可能关系。植物细胞代表。2007;26:1399–1411.[公共医学][谷歌学者]
32Sax K。菜豆大小差异与种皮图案和色素沉着的关系。遗传学。1923;8:552–560. [PMC免费文章][公共医学][谷歌学者]
33Evans MM。玉米的不确定配子体1基因编码胚囊和叶片发育所需的LOB域蛋白。植物细胞。2007;19:46–62. [PMC免费文章][公共医学][谷歌学者]
34Hazen SP、Hawley RM、Davis GL等。谷物细胞壁组成的数量性状位点和比较基因组学。植物生理学。2003;132:263–271. [PMC免费文章][公共医学][谷歌学者]
35Ahn S,Tanksley SD。水稻和玉米基因组的比较连锁图。程序。美国国家科学院。科学。美国。1993;90:7980–7984. [PMC免费文章][公共医学][谷歌学者]
36Bennetzen JL,Freeling M.Grasses作为单一遗传系统:基因组组成、共线性和兼容性。趋势Genet。1993;9:259–261.[公共医学][谷歌学者]
37凯洛格EA。禾草的进化史。植物生理学。2001;125:1198–1205. [PMC免费文章][公共医学][谷歌学者]
38Broman KW,Wu H,Sen S,等。R/qtl:qtl在实验杂交中的定位。生物信息学。2003;19:889–890.[公共医学][谷歌学者]
39Bradbury PJ,Zhang Z,Kron DE,et al.TASSEL:不同样本复杂性状关联映射软件。生物信息学。2007;23:2633–2635.[公共医学][谷歌学者]

文章来自数据库:生物数据库与治疗杂志由以下人员提供牛津大学出版社