dbWFA：用于功能注释的基于web的数据库 小麦 抄本

数据库还包含关于夏块菌转录因子（2891个转录）、泛素蛋白酶体系统的E3泛素连接酶（876个转录），激素应答基因（467个转录）和种子贮藏蛋白（55个转录；图1). 转录因子UniGenes从wDBTF数据库中检索(34). E3连接酶和激素反应性UniGenes从NCBI和TAIR数据库中使用所有拟南芥和欧·萨提娃E3连接酶和激素反应序列作为使用BLASTn、BLASTx和tBLASTx程序进行同源搜索的查询(36). 使用e值阈值10筛选BLAST点击⁻⁵以及超过80 bp的对准长度。使用InterProScan程序检查所有序列的一致性和是否存在特定的蛋白质特征(http://www.ebi.ac.uk/Tools/pfa/iprscan/). 对于种子贮藏蛋白UniGenes，使用BLASTx和夏块菌种子贮藏蛋白序列作为参考。BLASTx结果未使用初步过滤器。相反，所有的比对都被仔细检查，种子贮藏蛋白的已知保守关键区域的相似性优先于e值和BLAST评分。在dbWFA中，管理的UniGene注释被分配给夏块菌没有任何中间BLAST结果的成绩单。

遵循国际小麦基因组测序联合会（IWGSC）的注释建议夏块菌基因组序列(三)覆盖率（相对于同源蛋白的长度）和身份用于为转录本指定功能注释。在dbWFA中，用户可以定义这两个参数的值，但我们强烈建议使用IWGSC建议的截止值，其中标识>45%且覆盖率>50%的BLAST结果被分配了一个“假定函数”，标识和覆盖率>90%的BLAST结果被分配一个“已知函数”。

所有数据都存储在MySQL数据库中。数据库的集成允许将上述任何系统的功能注释分配给感兴趣的抄本，反之亦然。因此，dbWFA数据库为注释夏块菌UniGenes。为了从dbWFA中找到最常见的信息类型，可以通过基于web的界面发送简单但相关的查询及其参数(图2). 结果以html页面的形式交付，并且可以使用导出过程在电子表格中检索数据。html结果页面提供链接，将用户重定向到不同注释系统的网站，允许对注释结果进行全局分析。该web界面还可用于为搜索结果自动创建MapMan映射文件。尽管dbWFA web界面只允许对常见查询进行数据挖掘，但可以使用SQL数据库执行特定查询，该数据库可以从dbWFA-网站下载。数据库的模块化将促进新夏块菌作为转录物的数据通过不同的管道进行测序和注释。

dbWFA数据库web界面的屏幕截图。（A）用于查询PMN路径的页面。类似的页面可用于查询MIPS功能类别、TAIR基因家族、GO和MapMan容器。可以同时查询GO列表。（B）查询UniGene或全长cDNA序列注释的页面。（C）注释UniGenes的结果页。

图2

dbWFA数据库web界面的屏幕截图。（A）用于查询PMN路径的页面。类似的页面可用于查询MIPS功能类别、TAIR基因家族、GO和MapMan容器。可以同时查询GO列表。（B）用于查询UniGene或全长cDNA序列注释的页面。（C）注释UniGenes的结果页。

使用dbWFA:Annotated UniGenes的百分比，比较夏块菌UniGene和拟南芥和欧·萨提娃全基因组注释和查询示例

UniGene构建#55、#58、#59和#60的转录序列中，分别有百分之三十四（13713个转录序列）、40%（14843）、35%（20 016）和35%（20 034）的转录序列在至少一个注释资源中具有假定的功能注释。TriFLDB的17 541个全长cDNA序列中，有81%在至少一个注释资源中具有假定的功能注释。不同资源中注释的转录本和全长cDNA序列的数量见表1BLASTn分析显示，12478个全长cDNA序列与UniGene集合（构建#60）中覆盖率和同一性阈值分别>50%和90%的序列相匹配。在这12478个对应中，分别有10996个和5932个全长cDNA序列和UniGene序列在至少一个注释资源中具有假定的功能注释。这一结果突出了全长cDNA序列带来的额外信息。

表1

新标签中打开

从NCBI UniGene集合（构建#60）和从TriFLDB数据库检索到的全长cDNA（FL cDNA）序列中提取的小麦赤霉转录本的数量，在至少一个注释系统中用假定功能注释（覆盖率>50%，身份>45%）

功能注释系统	带注释的成绩单数量
	欧·萨提娃		拟南芥		总计^一
	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA
MIPS功能分类			12 943	10 864	12 943	10 864
PlantCyc途径反应	2193	2106	2093	2208	3067	2911
政府官员	13 142	8014	10 444	10 850	16 079	12 279
TAIR公司拟南芥基因家族			4498	3797	4498	3797
MapMan垃圾箱	19 248	14 032	13 202	10 897	20 033	14 224
固化路径或功能
激素反应基因					467
泛素蛋白酶体系统					876
转录因子					2891

功能注释系统	带注释的成绩单数量
	欧·萨提娃		拟南芥		总计^一
	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA
MIPS功能分类			12 943	10 864	12 943	10 864
PlantCyc途径反应	2193	2106	2093	2208	3067	2911
政府官员	13 142	8014	10 444	10 850	16 079	12 279
楼梯拟南芥基因家族			4498	3797	4498	3797
MapMan垃圾箱	19 248	14 032	13 202	10 897	20 033	14 224
固化路径或功能
激素反应基因					467
泛素蛋白酶体系统					876
转录因子					2891

^一在至少一个模式物种中用假定功能注释的转录本和全长cDNA序列的数量。

表1

新标签中打开

从NCBI UniGene集合（构建#60）和从TriFLDB数据库检索到的全长cDNA（FL cDNA）序列中提取的小麦赤霉转录本的数量，在至少一个注释系统中用假定功能注释（覆盖率>50%，身份>45%）

功能注释系统	带注释的成绩单数量
	紫花苜蓿		拟南芥		总计^一
	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA
MIPS功能分类			12 943	10 864	12 943	10 864
PlantCyc途径反应	2193	2106	2093	2208	3067	2911
政府官员	13 142	8014	10 444	10 850	16 079	12 279
TAIR公司拟南芥基因家族			4498	3797	4498	3797
MapMan垃圾箱	19 248	14 032	13 202	10 897	20 033	14 224
固化路径或功能
激素反应基因					467
泛素蛋白酶体系统					876
转录因子					2891

功能注释系统	带注释的成绩单数量
	欧·萨提娃		拟南芥		总计^一
	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA	NCBI UniGene公司	FL cDNA
MIPS功能分类			12 943	10 864	12 943	10 864
PlantCyc途径反应	2193	2106	2093	2208	3067	2911
政府官员	13 142	8014	10 444	10 850	16 079	12 279
TAIR公司拟南芥基因家族			4498	3797	4498	3797
MapMan垃圾箱	19 248	14 032	13 202	10 897	20 033	14 224
固化路径或功能
激素反应基因					467
泛素蛋白酶体系统					876
转录因子					2891

^一在至少一个模式物种中用假定功能注释的转录本和全长cDNA序列的数量。

通过比较所有转录本的MapMan bin注释来说明注释方法的质量夏块菌NimbleGen 40 k微阵列（使用UniGene构建#55开发）和TriFLDB的全长cDNA序列，带有注释拟南芥和欧·萨提娃从MapMan导入并记录在数据库中。这里使用MapMan垃圾箱是因为该注释系统可用于这三个物种。总的来说，这三个物种之间没有明显的差异(图3)，这三个物种的26个类别中的基因百分比具有良好的相关性(夏块菌与拟南芥:第页= 0.96,P（P）< 0.001;夏块菌与欧·萨提娃:第页= 0.69,P（P）<0.001），无明显偏差(P（P）< 0.001). 发现与拟南芥与…相比欧·萨提娃主要是因为DNA库中的注释转录本较少欧·萨提娃比拟南芥和夏块菌(第页=0.90适用于夏块菌与欧·萨提娃如果不考虑此箱子）。对于从TriFLDB和其他公共数据库检索到的全长编码序列夏块菌和拟南芥以及介于夏块菌和欧·萨提娃都是一样的(第页= 0.90,P（P）< 0.001). 所呈现的四个MapMan bin注释之间的成对相关性非常高，当省略DNA bin时，所有注释均>0.9。PlantCyc途径反应和GO也获得了类似的结果（数据未显示）。

MapMan bin注释的雷达图（对数标度），用于A.thaliana、O.sativa和T.aestivum UniGene（构建#60）和全长编码序列。数据占MapMan bin注释总数的百分比（表1）。构建#55、#58和#59获得了类似的结果（数据未显示）。为了使数字更清晰，一些垃圾箱已经合并。

图3

MapMan bin注释的雷达图（对数刻度）拟南芥,欧·萨提娃和夏块菌UniGene（构建#60）和全长编码序列。数据占MapMan bin注释总数的百分比(表1). 构建#55、#58和#59获得了类似的结果（数据未显示）。一些箱子已经合并，以使图形更清晰。

与许多注释工具不同，dbWFA可以同时查询多个注释系统。为了演示dbWFA数据库的各种功能，中给出了一些查询示例方框1，使用网站或本地计算机上安装的数据库。

方框1。查询示例

为了证明dbWFA的有用性，本文介绍了几个可以使用当前系统执行的生物相关查询。在这些示例中，使用了UniGene构建#55，覆盖率和身份阈值分别为50%和45%，这是IWGSC的建议，以将假定功能分配给转录本。

查询1

找到所有可能具有植物烯合酶活性的普通小麦转录本

非重复序列			匹配序列		路线参数
身份证号码	表示序列	说明	身份证号码	说明	覆盖率（%）	身份（%）
塔41960	塔_S16057905	夏块菌克隆wr1.pk0139.g3:fis，全插入mRNA序列	地点：06g51290	植物酮合成酶，叶绿体前体，推测，表达	59.7	81.4
			AT5G17230型	八氢番茄红素合酶	58	79.6

塔66029	塔_S26027774	FGAS000498标准夏块菌FGAS：图书馆2号门3？夏块菌cDNA、mRNA序列	LOC_OS06G51290	光气合酶，叶绿体前体，推测，表达	55.3	48.9
			AT5G17230型	八氢番茄红素合酶	59.7	47.08

非重复序列			匹配序列		路线参数
身份证号码	表示序列	说明	身份证号码	说明	覆盖率（%）	身份（%）
塔41960	塔_S16057905	夏块菌克隆wr1.pk0139.g3:fis，全插入mRNA序列	LOC_OS06G51290	植物酮合成酶，叶绿体前体，推测，表达	59.7	81.4
			AT5G17230型	八氢番茄红素合酶	58	79.6

塔66029	塔_S26027774	FGAS000498标准夏块菌FGAS：2号图书馆3号门？夏块菌cDNA、mRNA序列	LOC_OS06G51290	光气合酶，叶绿体前体，推测，表达	55.3	48.9
			AT5G17230型	八氢番茄红素合酶	59.7	47.08

类胡萝卜素生物合成的第一个关键步骤是两个香叶基香叶基二磷酸分子通过植物烯合成酶缩合生成植物烯，它催化质体化类胡萝卜素途径中的速率控制步骤(43). 我们可以使用其web界面查询PlantCyc途径反应2.5.1.32的数据库。此查询的结果显示在上表中。两个夏块菌转录本上标注了推测的植物烯合酶活性。先前的研究表明，禾本科植物具有一个重复的植物烯合酶基因(44). 对两个带注释的UniGene序列进行的彻底分析证实，它们与在禾本科植物中发现的重复的植物烯合酶基因相对应。第三个八氢番茄红素合成酶已在Z.五月和夏块菌(45,46). 虽然这三个欧·萨提娃植物烯合酶基因存在于数据库中夏块菌在dbWFA中未发现该植物烯合成酶基因的UniGene。

植物烯合酶活性也对应于GO:0016767 MapMan bin 16.1.4.1。在dbWFA中搜索此GO或MapMan bin会得到与上面相同的结果。当数据库安装在本地计算机上时，可以在单个MySQL查询中组合多个覆盖系统（例如PlantCyc pathway reaction和GO）。根据预期结果，还可以使用MySQL比较和生成查询的并集或交集。

查询2

尽可能多地查找有关成绩单列表的信息

非重复序列		GO（开始）	TAIR公司	混合动力系统	植物周期	地图管理员
身份证号码	匹配	GO（开始）	TAIR公司	混合动力系统	植物周期	地图管理员
塔41960	AT5G17230型	去：0009507		01.06.06.13	2.5.1.32	16.1.4.1
	八氢番茄红素合酶	编号：0016117		70.26.03	2.5.1.32
		GO:0016767号
		去：0046905

非重复序列		GO（开始）	TAIR公司	混合动力系统	植物周期	地图管理员
身份证号码	匹配	GO（开始）	TAIR公司	混合动力系统	植物周期	地图管理员
塔41960	AT5G17230型	转到：0009507		01.06.06.13	2.5.1.32	16.1.4.1
	八氢番茄红素合酶	编号：0016117		70.26.03	2.5.1.32
		GO:0016767号
		去：0046905

数据库的效率源于其多个注释系统。dbWFA的跨系统注释功能集成在“Transcript（s）annotation”搜索方法的web界面中。这种类型的查询可以用于获取在dbWFA中集成的不同注释系统中感兴趣的UniGenes列表的信息。查询查询1中检索到的第一个植物烯合成酶转录物的UniGene集合会产生上表所示的注释。在web界面上，用户可以选择仅显示最佳点击（如上表所示）或五个最佳点击，覆盖率和标识百分比大于用户设置的阈值。用户还可以选择要包含在查询和模型物种中的注释系统。结果将用户重定向到不同注释系统的网页，从而可以在感兴趣的抄本列表注释中获得更详细的信息。

查询3

在MapMan中找到与糖酵解途径相关的所有转录物进行转录组分析

Bin代码	姓名	标识符	说明	类型
4.1	糖酵解.胞质分支	塔_S16058223	类似于UTP–葡萄糖-1-磷酸尿苷基转移酶，推定，表达	T型
4.1	糖酵解.胞质分支	塔_S16058223	覆盖率：99.5745%，身份：92.75%	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048872	类似于醛脱氢酶	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048872	覆盖率：100%，身份：87.1%	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048873	类似于醛脱氢酶	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048873	覆盖率：100%，身份：79.23%	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S15902802	类似醛缩酶超家族蛋白	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S15902802	覆盖率：50.1873%，身份：85.07%	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S17888674	类似醛缩酶超家族蛋白	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S17888674	覆盖率：88.5475%，身份：48.91%	T型

Bin代码	姓名	标识符	说明	类型
4.1	糖酵解.胞质分支	塔_S16058223	类似于UTP–葡萄糖-1-磷酸尿苷酰转移酶，推测表达	T型
4.1	糖酵解.胞质分支	塔_S16058223	覆盖率：99.5745%，身份：92.75%	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048872	类似于醛脱氢酶	T型
4.1.10	糖酵解.细胞溶质分支.非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048872	覆盖率：100%，身份：87.1%	T型
4.1.10	糖原溶解。胞质分支。非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048873	类似于醛脱氢酶	T型
4.1.10	糖原溶解。胞质分支。非磷酸化甘油醛3-磷酸脱氢酶（NPGAP-DH）	塔_S13048873	覆盖率：100%，身份：79.23%	T型
4.1.11	糖原溶胞分支醛缩酶	塔_S15902802	类似醛缩酶超家族蛋白	T型
4.1.11	糖原溶胞分支醛缩酶	塔_S15902802	覆盖率：50.1873%，身份：85.07%	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S17888674	类似醛缩酶超家族蛋白	T型
4.1.11	糖酵解.胞质分支.醛缩酶	塔_S17888674	覆盖率：88.5475%，身份：48.91%	T型

在搜索方法“MapMan映射文件生成器”中，用户可以选择代谢途径并自动创建映射文件，以可视化使用夏块菌使用组学数据查看和分析工具MapMan定制NimbleGen 40 k微阵列。糖酵解途径对应于bin代码4。上面显示了dbWFA为此查询生成的表的前五行。当数据库安装在本地计算机上时，可以同时查询多个路径以创建自定义夏块菌MapMan的映射文件。

籽粒发育早期和晚期特异表达单基因的鉴定与注释

UniGene集合（构建#55）中总共有39 029个转录本，以及wDBTF数据库中1613个转录因子，UniGene集中没有这些转录因子夏块菌NimbleGen 40 k微阵列(36). 以前的研究表明，这些转录本中的18140（44.6%）在夏块菌粮食开发(47). 在dbWFA中，34-40%（取决于构建）的这些转录本具有假定的功能注释。

夏块菌籽粒发育包括几个不同的阶段，首先是合胞体阶段，然后是细胞化阶段（花后约0–100°C天），然后是胚乳细胞活跃分裂（ECD）、膨胀和分化的第一个分化阶段（花后约100–250°C天后），第二个分化阶段是贮藏聚合物迅速积累的阶段（花后约250–750°C天），成熟阶段是籽粒迅速干燥的阶段（花后约750–900°C天(48,49). 这些阶段之间的转换与谷物转录组的主要变化有关(5,36,50,51)和蛋白质组(52,53).

为了验证数据库的基本原理，并提供dbWFA有用性的另一个例子，我们分析了在谷物发育的ECD或SPA阶段中特别表达的转录本的功能注释。我们使用自定义的转录组数据夏块菌用于夏块菌品种Recital在温室标准条件下生长，开花后132至686°C天内每34–117°C天取样一次(35). 使用J-Express 2012软件包对不同表达模式的转录本进行分类(54)使用基于欧几里德距离的k-means聚类。在本分析中，聚类数量根据经验设置为25，因为这使我们能够清楚区分特定于谷物发育的ECD和SPA阶段的基因表达聚类。一个由238个基因组成的集群包含仅在ECD阶段表达的基因(图4A和B）。另外两个簇包含SPA阶段独家表达的基因。后两个簇合并为一个包含195个基因的SPA簇。然后使用dbWFA从两个簇中检索转录物的功能分类。使用了MIPS功能分类，因为它是与先前研究进行比较时信息最丰富、最直观的。

在小麦籽粒发育的早期细胞分裂或晚期SPA阶段特异表达的基因的功能注释。（A）早期和晚期发育特异性基因的表达热图。（B）早期和晚期发育特异性基因簇的正常表达。标准化表达<7的转录本不被认为是表达的（即与背景噪声没有差异）。数据为两个UniGene簇基因的中位数±1 SD。（C）MIPS功能类别。

图4

细胞分裂早期或SPA晚期特异表达基因的功能注释夏块菌粮食发展。（A）早期和晚期发育特异性基因的表达热图。（B）早期和晚期发育特异性基因簇的正常表达。标准化表达<7的转录本不被认为是表达的（即与背景噪声没有差异）。数据为中位数±1 SD。（C）两个UniGene簇基因的MIPS功能类别。

使用IWGSC推荐的覆盖率（50%）和身份（45%）百分比，分别将68（29%）个ECD特异性转录本和129（66%）个SPA特异性转录物分配到MIPS功能类别(图4C） ●●●●。注释结果与之前的转录组一致(5,51)和蛋白质组(52,53)发展研究夏块菌和六棱大麦(55)颗粒。基因簇的功能分类不同。毫不奇怪，12个涉及细胞命运和细胞类型、组织分化和器官分化的转录物在ECD阶段特异性表达，而没有SPA阶段特异性转录物被注释为属于这些MIPS功能类别。同样与我们对谷物发育的了解相一致的是，在SPA阶段，55个种子贮藏蛋白转录物被特异表达，而在注释的ECD特异基因中没有发现任何转录物。

还观察到这两组转录本注释的数量差异。SPA特异性簇中的几个转录物涉及细胞拯救、防御和毒力以及与环境的相互作用。特别是，参与植物激素调节的转录物在SPA特异性基因簇中过度表达。编码参与蛋白质合成的蛋白质和具有代谢功能的蛋白质的转录物在ECD簇中过度表达。这些结果与之前的转录组一致(5,36,56)和蛋白质组分析(53). 最后，我们注意到MIPS功能类别“具有结合功能或辅因子要求的蛋白质”存在重大差异，ECD簇中更多的转录物参与DNA结合，SPA簇中更多转录物参与RNA结合。

所有这些数据都显示出与发布的结果非常相似夏块菌和六棱大麦，反映了dbWFA提供的自动注释的准确性。与其他几种不同夏块菌转录组分析，在该分析中，必须进行一个复杂的过程来为选定的转录物和/或蛋白质指定功能注释(5,57)在这里，只向dbWFA数据库发出了一个请求，以检索45%感兴趣的转录本的功能分类，以及40642个转录本的40%夏块菌NimbleGen 40 k微阵列。注释成绩单的这一百分比与之前报告的（38%）相似夏块菌Affymetrix GeneChip®微阵列(4).

见解

dbWFA数据库是通过集成大量数据源创建的。因此，它是一个实用的异构数据源，用于功能注释夏块菌抄本。该网站允许访问可应用于数据库的最常见查询，而免费提供的MySQL数据库是一个功能强大的工具，可用于更具体的请求。尽管需要进一步分析以确认dbWFA注释结果，但该数据库为获取广泛的功能信息提供了一个高效快速的解决方案。cDNA资源有助于从基因组序列预测外显子区域；因此，对UniGene资源进行注释的工作将对正在进行的序列数据的分析做出重大贡献夏块菌倡议和其他基因组测序项目。

这里介绍的dbWFA版本是可操作的，但目的不是将数据库限制为存储欧·萨提娃和拟南芥注释，但随着功能注释变得更加一致，将其扩展到包括来自其他植物物种基因组的数据。InterProScan的集成(58)在工作流中可以是增强流程的一种有价值的方法。此外，AFAWE的集成(59)将使用不同的功能预测工具提供注释工作流。然而，AFAWE的当前版本不能独立于其web界面使用，因此必须使用其工作流中调用的工具来实现，这些工具可用作web服务。最后，即将在工作流中集成的BLAST程序将允许用户注释自己的序列，并使dbWFA适用于其他物种。

致谢

作者感谢Etienne Paux博士和Catherine Feuillet博士（INRA，UMR1095 GDEC，Clermont-Fleard，France）的有益讨论和建议，感谢Sébastien Reboux先生、Claire Viseux女士和Michael Alaux先生（INRA、URGI、Versailles，France，）在URGI服务器上安装和维护数据库。

基金

这项工作得到了法国高等教育和研究部对J.V.的博士学位资助。

利益冲突。未申报。

工具书类

1

费伊莱特

C类

,

Eversole公司

K（K）

.

小麦基因组的物理制图：为基因组测序奠定基础并为育种人员开发工具的协调努力

,

以色列。植物科学杂志。

,

2007

，体积。

55

（第

307

-

313

)

2

费伊莱特

C类

,

浸出

JE公司

,

罗杰斯

J型

等

作物基因组测序：教训和原理

,

植物科学趋势。

,

2011

，体积。

16

（第

77

-

88

)

三

勒罗伊

P（P）

,

吉约

N个

,

酒井

H（H）

等

TriAnnot：植物基因组自动注释的多功能高性能管道

,

前面。植物科学。

,

2012

，卷。

三

（第

1

-

14

)

4

布伦奇利

R（右）

,

斯潘纳格尔

M（M）

,

普法伊费尔

M（M）

等

面包小麦全基因组鸟枪测序分析

,

自然

,

2012

，卷。

491

（第

705

-

710

)

5

万

Y（Y）

,

普尔

RL公司

,

赫特人

阿克

等

六倍体小麦籽粒发育的转录组分析

,

BMC基因组学

,

2008

，卷。

9

第页。

121

6

佩尔尼

TK公司

,

洛夫格罗夫

A类

,

弗里曼

J型

等

发育中小麦淀粉胚乳的细胞壁：成分和RNA-Seq转录组的比较

,

植物生理学。

,

2012

，卷。

158

（第

612

-

627

)

7

科勒

J型

,

Baumbach公司

J型

,

陶贝特

J型

等

用ONDEX对实验结果进行基于图形的分析和可视化

,

生物信息学

,

2006

，卷。

22

（第

1383

-

1390

)

8

利森科

A类

,

辛德尔

MM（毫米）

,

陶贝特

J型

等

植物基因组学数据集成——拟南芥数据库

,

生物信息学简介

,

2009

，体积。

10

（第

676

-

693

)

9

拉佐

希腊

,

赵

S公司

,

Hummel公司

尽职调查

，等人

小麦表达序列标签（EST）资源的开发(小麦L.）：16000-locus bin-delinated图的EST生成、单基因分析、探针选择和生物信息学

,

遗传学

,

2004

，卷。

168

（第

585

-

593

)

10

张

H（H）

,

斯列尼瓦苏鲁

N个

,

韦斯科

W公司

等

基于表达序列标签的大麦转录组大规模分析

,

工厂J。

,

2004

，卷。

40

（第

276

-

290

)

11

阿洛伊斯。

S公司

,

摩尔。

G公司

,

贝莱克。

A类

等

六倍体小麦的构建及特性(小麦L.）参考种质“中国春天”的BAC文库

,

谷物研究委员会。

,

2003

，卷。

31

（第

331

-

338

)

OpenURL占位符文本

12

萨法尔

J型

,

巴托斯

J型

,

詹达

J型

等

大而复杂的基因组解剖：面包小麦个体染色体的流分选和BAC克隆

,

工厂J。

,

2004

，卷。

39

（第

960

-

968

)

13

威尔金森

PA公司

,

温菲尔德

卫生官员

,

巴克

GLA公司

等

谷物数据库2.0：植物育种家和科学家的综合资源

,

BMC生物信息学

,

2012

，卷。

13

第页。

219

14

赖

K（K）

,

伯克曼

PJ公司

,

洛伦茨

M（M）

等

WheatGenome.info：小麦基因组信息的集成数据库和门户

,

植物细胞生理学。

,

2012

，卷。

53

第页。

第2页

15

东

问

,

施吕特

标准偏差

,

布伦德尔

V（V）

.

PlantGDB，植物基因组数据库和分析工具

,

核酸研究。

,

2004

，卷。

32

数据库问题

（第

D354号

-

D359号

)

16

费伊莱特

C类

,

斯坦因

N个

,

罗西尼

L（左）

等

整合谷物基因组学以支持小麦科的创新

,

功能。集成。基因组学

,

2012

，卷。

12

（第

573

-

583

)

17

关闭

TJ公司

,

瓦纳梅克

S公司

,

鲁斯

毫升

等

HarvEST公司

,

方法分子生物学。

,

2007

，卷。

406

（第

161

-

177

)

18

埃斯特尔

JC公司

,

贝内特森

JL公司

.

植物基因组中基因和转座元件注释的DAWGPAWS管道

,

工厂方法

,

2009

，卷。

5

第页。

8

19

持田

K（K）

,

吉田

T型

,

樱井

T型

等

TriFLDB：小麦科簇状全长编码序列数据库及其在比较草基因组学中的应用

,

植物生理学。

,

2009

，卷。

150

（第

1135

-

1146

)

20

马尼卡维鲁

A类

,

川村

K（K）

,

上好佳

K（K）

等

普通小麦表达序列标签的综合功能分析(小麦)

,

DNA研究。

,

2012

，卷。

19

（第

165

-

177

)

21

拟南芥基因组计划

开花植物基因组序列分析拟南芥

,

自然

,

2000

，卷。

408

（第

796

-

815

)

公共医学

22

于

J型

,

胡

S公司

,

王

J型

等

水稻基因组序列草图(水稻L.ssp.公司。印度）

,

科学类

,

2002

，卷。

296

（第

79

-

92

)

23

国际水稻基因组测序项目

基于地图的水稻基因组序列

,

自然

,

2005

，卷。

436

（第

793

-

800

)

公共医学

24

Schnable公司

PS（聚苯乙烯）

,

器皿

D类

,

富尔顿

RS系列

等

B73玉米基因组：复杂性、多样性和动态

,

科学类

,

2009

，卷。

326

（第

1112

-

1115

)

25

施穆茨

J型

,

加农炮

某人

,

施吕特

J型

等

古多倍体大豆的基因组序列

,

自然

,

2010

，卷。

463

（第

178

-

183

)

26

帕特森

AH（AH）

,

鲍尔斯

JE公司

,

布鲁格曼

R（右）

，等人

高粱双色基因组与禾本科植物的多样性

,

自然

,

2009

，卷。

457

（第

551

-

556

)

27

国际钪倡议

模式草短梗草基因组测序及分析

,

自然

,

2010

，卷。

463

（第

763

-

768

)

公共医学

28

迈耶

KFX公司

,

沃

R（右）

,

兰里奇

P（P）

等

大麦基因组的物理、遗传和功能序列组装

,

自然

,

2012

，卷。

491

（第

711

-

716

)

29

范·贝尔

M（M）

,

普鲁斯特

S公司

,

Wischnitzki公司

E类

等

利用PLAZA比较基因组学平台解剖植物基因组

,

植物生理学。

,

2012

，卷。

158

（第

590

-

600

)

30

达萨纳亚克

M（M）

,

哦

DH（决断高度）

,

哈斯

JS公司

等

极端嗜热十字花科菌Thellungiella parvula的基因组

,

自然遗传学。

,

2011

，卷。

43

（第

913

-

918

)

31

科内萨

A类

,

哥茨

S公司

,

加西亚-戈梅兹

吉咪

等

Blast2GO：功能基因组学研究中注释、可视化和分析的通用工具

,

生物信息学

,

2005

，卷。

21

（第

3674

-

3676

)

32

拉梅什

P（P）

,

贝拉尔迪尼

TZ公司

,

锂

D类

，等人

拟南芥信息资源（TAIR）：改进的基因注释和新工具

,

核酸研究。

,

2011

，卷。

40

（第

D1202号

-

210天

)

33

欧阳

S公司

,

朱

W公司

,

汉密尔顿

J型

等

TIGR水稻基因组注释资源：改进和新特点

,

核酸研究。

,

2007

，卷。

35

（第

D883型

-

D887型

)

34

阿尔特舒尔

旧金山

,

马登

TL公司

,

Schäffer公司

AA公司

等

缺口BLAST和PSI-BLAST：新一代蛋白质数据库搜索程序

,

核酸研究。

,

1997

，卷。

25

（第

3389

-

3402

)

35

罗默夫

我

,

泰西（Tessier）

D类

,

达尔德韦

M（M）

等

wDBTF：研究小麦转录因子家族的综合数据库资源

,

BMC基因组学

,

2010

，卷。

11

第页。

185

36

Capron公司

D类

,

穆泽亚尔

S公司

,

巨砾状的

A类

等

小麦籽粒发育过程中E3连接酶和激素相关基因的转录谱分析

,

BMC植物生物学。

,

2012

，卷。

12

第页。

35

37

勒斯滕霍尔茨

C类

,

舒莱

F类

,

劳希耶

C类

等

3B染色体3000-loci转录图揭示了六倍体小麦基因岛的结构和功能特征

,

植物生理学。

,

2011

，卷。

157

（第

1596

-

1608

)

38

阿什伯恩

M（M）

,

球

加利福尼亚州

,

布莱克

青年成就组织

，等人

基因本体论：生物学统一的工具

,

自然遗传学。

,

2011

，卷。

25

（第

25

-

29

)

39

张

P（P）

,

德勒埃

K（K）

,

卡斯基

A类

等

建立全基因组代谢途径数据库毛果杨利用新方法重建和管理植物代谢途径

,

植物生理学。

,

2010

，卷。

153

（第

1479

-

1491

)

40

Thimm公司

O（运行）

,

布莱辛

O（运行）

,

吉邦

Y（Y）

等

Mapman：一个用户驱动的工具，用于在代谢途径和其他生物过程的图表上显示基因组数据集

,

工厂J。

,

2004

，卷。

37

（第

914

-

939

)

41

Ruepp公司

A类

,

佐尔拉

A类

,

迈尔

D类

等

FunCat，一种用于全基因组蛋白质系统分类的功能注释方案

,

核酸研究。

,

2004

，卷。

32

（第

5539

-

5545

)

42

李（Rhee）

SY公司

,

比维斯

W公司

,

贝拉尔迪尼

TZ公司

等

拟南芥信息资源（TAIR）：一个模型生物数据库，提供了一个集中式的、有计划的途径，可以访问拟南芥子生物学、研究材料和社区

,

核酸研究。

,

2003

，卷。

31

（第

224

-

228

)

43

坎宁安

外汇

,

甘特图

E类

.

植物类胡萝卜素生物合成的基因和酶

,

每年。植物生理学修订版。植物分子生物学。

,

1998

，卷。

49

（第

557

-

583

)

44

加拉赫

总工程师

,

马修斯

PD公司

,

锂

F类

等

类胡萝卜素生物合成途径中的基因复制先于禾本科植物的进化

,

植物生理学。

,

2004

，卷。

135

（第

1776

-

1783

)

45

锂

F类

,

瓦拉布哈尼

R（右）

,

沃策尔

电子技师

.

PSY3是禾本科植物烯合酶基因家族的一个新成员，也是非生物胁迫诱导根胡萝卜素生成的调节因子

,

植物生理学。

,

2008

，卷。

146

（第

1333

-

1345

)

46

迪巴里

B类

,

穆拉特

F类

,

肖松

A类

等

解读禾草中与胡萝卜素生成相关的植物烯合成酶的基因组结构、功能和进化

,

BMC基因组学

,

2012

，卷。

13

第页。

221

47

罗默夫

我

.

识别生物信息学blétendre转录工作人员(小麦)et mise enévidence des factors de transcription impliques s dans la synthèse des protéines de réserve

,

2010

博士论文《克莱蒙特-法尔德第二大学》，布莱斯·帕斯卡，克莱蒙特–法尔德，法国，第223页

48

贝内特

医学博士

,

拉奥

迈克科尔斯

,

史密斯

接线盒

等

花药、胚珠和种子中的细胞发育小麦L.Var.中国春天

,

菲洛斯。T.R.Soc.B公司

,

1975

，卷。

266

（第

6

-

81

)

OpenURL占位符文本

49

埃弗斯

T型

,

米勒

S公司

.

谷物的结构和发育：对品质的一些影响

,

谷物科学杂志。

,

2002

，卷。

36

（第

261

-

284

)