摘要
国家生物资源项目(NBRP)是一个日本项目,旨在建立一个收集、保存和提供生物资源的系统,用作生命科学研究的实验材料。它由27个核心资源设施和一个信息中心推动,每个设施都涉及一组特定的生物体。NBRP数据库是该项目的一个产品。已经创建了30个数据库和一个集成数据库检索系统(生物资源世界:BRW),并通过NBRP主页提供(网址:http://www.nbrp.jp). 这30个独立数据库有各自的特点,直接反映了每个资源设施维护的数据。BRW是为需要跨多个资源进行搜索而不需要从一个数据库移动到另一个数据库的用户设计的。BRW提供了450万条关于生物资源的记录,包括野生物种、近交系、突变体、基因工程系、DNA克隆等。BRW支持摘要浏览、关键字搜索以及通过DNA序列或基因本体进行搜索。搜索结果提供了在线请求分发研究材料的链接。流通系统允许用户提交使用NBRP资源进行的研究发表的论文的详细信息。
简介
日本用于生命科学研究的生物资源已有80年的历史。虽然在这段时间里积累了一些独特而宝贵的资源,但其中一些资源最近由于提供者年龄的增长或资金短缺而分散和丢失,因此提供有用资源的系统变得不足。为了改善这种状况,有必要建立一个可持续的环境,使研究人员能够随时获得生物资源,因此国家生物资源项目(NBRP)于2002年开始。项目中包括的物种是根据它们是日本本土物种或它们是目前正在研究或预计将由大量研究人员在未来研究的模式生物而选择的。
该项目的一个主要特点是,它促进了资源和信息的集中,以确保连续性。资源是按物种或生物群组织的,为了集中信息,在资源和信息中心之间建立了一个交互系统[隶属于国家遗传研究所(NIG)]。数据库中的所有信息都是公开的,并且正在对数据库的内容和所提供的服务进行一些改进。
在这里,我们概述了BioResourceWorld(BRW)集成数据库和几个具有代表性的组件数据库的一些细节。所有描述的信息都可以在网址:http://www.nbrp.jp/.
NBRP信息网站是访问NBRP所有信息的网关。标题“资源中心”下方左侧的菜单提供了指向所有30个单独数据库的链接,并允许用户直接访问感兴趣生物体的适当数据库。页面上中心附近的“关键字”文本框是一个查询框,用于输入BRW集成数据库的关键字搜索。用户可以通过单击页面顶部附近菜单栏中的“资源集成搜索站点”直接访问BRW主页。此菜单栏还提供了其他页面的链接:“期刊”提供了到研究资源循环(RRC)网站的链接,用于浏览和提交使用NBRP获得的资源报告研究的论文;”“Japan Genetic Resources”(日本遗传资源)提供了一个链接,指向NBRP集团以外的日本资源的URL列表;“全球遗传资源”提供了指向全球生物资源URL列表的链接。页面左上角的蓝绿色方框中显示了数据库中所有生物源的当前可用记录总数以及三个单独分类(动物、植物和微生物)的小计。
NBRP数据库
一个集成的NBRP数据库检索系统:BioResourceWorld
BRW是一个集成的数据库检索系统,它允许用户使用NBRP保存的关于许多生物体的信息体来检索资源。所有资源(约450万项)均可分配。BRW的关键字搜索可直接从NBRP主页获得。执行搜索的用户可以从下拉菜单中指定有机体和资源类别。(默认值为“All organics”和“All categories”。)当用户输入关键字并使用默认设置执行搜索时,将显示结果总数以及菌株数量和DNA克隆数量的细分。接下来是按生物体分类的资源列表。通过单击列表上所需的资源,用户可以访问一个详细信息页面,该页面为每个数据库(如果存在)提供分发请求站点的链接。
BRW主页从NBRP主页的顶部菜单栏链接,包含上述搜索功能和四个选项卡(ALL、DNA、BLAST和Gene Ontology)。这四个选项卡分别提供了按生物体组显示的所有资源的摘要、按生物体组列出的DNA克隆的摘要、BLAST搜索和基因本体(GO)搜索。
BLAST搜索允许用户搜索所有有机体组,还可以指定特定有机体或类别,例如基因组克隆、cDNA克隆或库。搜索结果显示为排列图,其中有机体或有机体群名称的缩写以彩色编码的方式出现在图的左侧,以帮助用户识别特定有机体。点击中的单个序列与NCBI有链接(1)、DDBJ(2)和BRW,它允许用户访问网站,从中可以订购适当的资源。
BRW的最新服务是基于GO的资源搜索。用户可以检查GO术语的层次结构,并使用GO ID、GO术语或GO Gene进行查询。例如,如果用户在GO-ID(或GO-Term)中输入“0000038”(或“超长链脂肪酸代谢过程”),则会显示包含“鼠标(5/5)、果蝇(2/4)、拟南芥(10/10)”的资源列表。括号中的数字表示与此GO-ID(左)及其子代(右)关联的资源数量。因此,该服务允许用户进行更语义的搜索,并为他们提供更广泛的资源。
GO搜索目前处于测试阶段,因为并非所有资源都包含GO信息。将显示映射到GO Term的资源总数,通过单击这些数字可以获得相关资源的列表。与其他搜索模式一样,GO允许从搜索结果中对资源进行排序。我们计划通过增加支持生物本体数据,如表型、解剖和发育,来加强跨生物体的资源搜索。
BRW中包含的信息与各个数据库中的信息同时更新。
资源研究循环
如果研究人员使用NBRP资源获得了良好的结果,那么这样的结果可能对使用相同资源的后续研究人员有用。因此,我们要求研究人员反馈有关报告其研究结果的论文的信息,我们还收集使用NBRP资源的其他论文。此信息用于创建与NBRP资源相关的论文的开放数据库(RRC)。RRC还提供了一个在线注册系统,通过该系统,只需输入PubMed识别号和论文中使用的资源名称即可提交论文。我们已经要求许多研究人员使用该系统对他们发表的论文进行反馈。如果像DNA数据库的登录号一样,我们可以建立一个系统,从公共数据库中获取论文“材料和方法”部分所述生物源的详细信息,而且,材料本身很容易获得。
NBRP数据库
表1显示了NBRP成分数据库的名称和特征,按生物体组组织。如所示表1自然交配系(包括野生种、栽培种、近交系和自然突变体);(ii)基因工程生物体(包括诱导突变株、转基因株、转座子插入株、缺失株、辅酶系、全基因组敲除株和增强子陷阱系);和(iii)DNA(质粒、载体和基因组/cDNA克隆)。资源记录的数量因生物组和分类中的资源而异(三)占总数的95%。中的外部数据库列表1表示与模型生物的外部综合数据库具有单向链接或交叉链接的数据库。括号内的协作数据库表示NBRP数据库与之协作的外部数据库。
| 数据库名称 | 出租车 | 野生/近交系/地方品种 | 突变体 | 质粒/载体/克隆 | 地图(物理或链接) | 基因(突变基因/所有基因) | 表型 | 单核苷酸多态性 | 喷砂服务 | 图像 | 外部DB(协作DB)[参考] | 特色内容/服务 |
1 | NBRP手册 | 脊椎动物-哺乳动物-动物 | o个 | | o个 | | | | | | | | |
2 | NBRP-Mouse(里肯BRC) | 脊椎动物-哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | 管理信息[三],(IMSR、JMSR;http://www.shigen.nig.ac.jp/mouse/jmsr/) | |
三 | NBRP-红色 | 哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | RGD公司[4],(JMSR) | 表型数据的图形显示 |
4 | NBRP-Xenous公司 | 脊椎动物-两栖动物 | o个 | | o个 | | | | | o个 | | | |
5 | NBRP-Zebrafish公司 | 脊椎动物-放线鱼-副鳍目动物-danio | | o个 | | | M(M) | o个 | | | o个 | ZFIN公司[5] | |
6 | NBRP-梅达卡 | 脊椎动物-放线虫-柱形目-稻纵形目 | o个 | o个 | o个 | 对 | M(M) | o个 | | o个 | o个 | | 地图集,系统发育树 |
7 | NBRP-Ciona公司 | 海鞘纲 | | o个 | o个 | | M(M) | o个 | | | o个 | (幽灵[6]CIPRO;http://cipro.ibio.jp/new/) | |
8 | NBRP-嗜酸性粒细胞(DGRC) | 节肢动物-昆虫-二翅果蝇科 | o个 | o个 | o个 | 对 | A类 | o个 | o个 | o个 | o个 | FlyBase飞基[7] | |
9 | NBRP-家蚕(家蚕基地) | 节肢动物-昆虫-表膜翅目-蜂鸟 | | o个 | | 我 | M(M) | o个 | | | o个 | | laeva周期时间 |
10 | 国家可再生能源公司-秀丽线虫 | 假性体腔动物门 | | o个 | | | M(M) | | | | | 蚯蚓酶[8] | |
11 | NBRP-Rice(水稻酶) | Viridiplanate-poaceae-oryzeae(绿车前) | o个 | o个 | | P、 L(左) | A类 | o个 | | o个 | o个 | 格拉姆烯[9],内部收益率;http://beta.irr.org/index.php/Home/Welcome/Frontpage.html | 发育阶段 |
12 | NBRP-巴利 | 豌豆科小黑小麦科大麦 | o个 | | o个 | 我 | | o个 | | o个 | o个 | | 表型数据 |
13 | NBRP-加热(KOMUGI) | 毒车前草-白蜡树科 | o个 | o个 | o个 | 我 | A类 | o个 | | o个 | o个 | (三层FLDB[10]) | 基因目录 |
14 | NBRP公司-拟南芥(里肯BRC) | 绿车前草狂犬病 | | o个 | o个 | | | o个 | | o个 | o个 | | |
15 | NBRP公司-菊花 | Viridiplantae-asterids-菊花 | o个 | | | | | o个 | | | o个 | | |
16 | NBRP-晨光 | 紫锥菊-茄科 | | o个 | o个 | 我 | M(M) | o个 | | | o个 | | |
17 | NBRP-大豆/甘氨酸(豆科) | 蚕豆科 | o个 | o个 | o个 | 我 | M(M) | o个 | | | o个 | (宫崎骏.jp[11],大豆全长cDNA数据库[12]) | |
18 | NBRP-托马托 | Viridiplanate-solanales-lycopersicon(绿车前) | | | o个 | | | | | | | (卡夫·汤姆;网址:http://www.pgb.kazusa.org.jp/kaftom/、MiBASE[13]) | |
19 | NBRP-藻类 | 14门(真核生物和细菌) | o个 | | | | | o个 | | | o个 | | 照片,系统发育树 |
20 | NBRP-酵母 | 真菌-子囊菌 | | o个 | o个 | 对 | A类 | | | | | SGD公司[14],通用数据库[15] | |
21 | NBRP-微孔黏菌 | 真菌-双ctyostelliida | | | o个 | | | | | | | 字典库[16] | |
22 | NBRP-原核生物大肠杆菌 | 细菌-蛋白菌 | | o个 | o个 | 对 | A类 | | | o个 | | PEC公司[17]、生态基因[18],经济周期[19],中心距[20],国家商业银行[1]、SwissProt[21]、GTOP[22]、KEGG[23]、InterPro[24] | |
23 | NBRP-原核生物枯草杆菌 | 细菌-硬杆菌-杆菌科 | | o个 | | | M(M) | | | | | | |
24 | NBRP-病原微生物 | 细菌和原生动物 | o个 | | | | | o个 | | | o个 | | |
25 | NBRP-普通微生物(Riken BRC,JCM) | 细菌 | o个 | | | | | | | | | | |
| 数据库名称 | 出租车 | 野生/近交/长白猪 | 突变体 | 质粒/载体/克隆 | 地图(物理或链接) | 基因(突变基因/所有基因) | 表型 | 单核苷酸多态性 | 喷砂服务 | 图像 | 外部DB(协作DB)[参考] | 特色内容/服务 |
1 | NBRP手册 | 脊椎动物-哺乳动物-动物 | o个 | | o个 | | | | | | | | |
2 | NBRP小鼠(瑞肯BRC) | 脊椎动物-哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | MGI公司[三],(IMSR、JMSR;http://www.shigen.nig.ac.jp/mouse/jmsr/) | |
三 | NBRP-红色 | 哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | RGD公司[4],(JMSR) | 表型数据的图形显示 |
4 | NBRP-Xenous公司 | 脊椎动物-两栖动物 | o个 | | o个 | | | | | o个 | | | |
5 | NBRP-Zebrafish公司 | 脊椎动物-放线鱼-副鳍目动物-danio | | o个 | | | M(M) | o个 | | | o个 | ZFIN公司[5] | |
6 | NBRP-梅达卡 | 脊椎动物-放线虫-柱形目-稻纵形目 | o个 | o个 | o个 | 对 | M(M) | o个 | | o个 | o个 | | 地图集,系统发育树 |
7 | NBRP西奥纳 | 海鞘纲 | | o个 | o个 | | M(M) | o个 | | | o个 | (幽灵[6]CIPRO;http://cipro.ibio.jp/new/) | |
8 | NBRP-嗜酸性粒细胞(DGRC) | 节肢动物-昆虫-二翅果蝇科 | o个 | o个 | o个 | 对 | A类 | o个 | o个 | o个 | o个 | FlyBase飞基[7] | |
9 | NBRP-家蚕(家蚕基地) | 节肢动物-昆虫-表膜翅目-蜂鸟 | | o个 | | 我 | M(M) | o个 | | | o个 | | laeva周期时间 |
10 | NBRP公司-秀丽线虫 | 假性体腔动物门 | | o个 | | | M(M) | | | | | 蚯蚓酶[8] | |
11 | NBRP-Rice(水稻酶) | Viridiplanate-poaceae-oryzeae(绿车前) | o个 | o个 | | P、 L(左) | A类 | o个 | | o个 | o个 | 格拉姆烯[9],内部收益率;http://beta.irr.org/index.php/Home/Welcome/Frontpage.html | 发育阶段 |
12 | NBRP-巴利 | Viridiplante-poaceae-triticae-大麦 | o个 | | o个 | 我 | | o个 | | o个 | o个 | | 表型数据 |
13 | NBRP-加热(KOMUGI) | 毒车前草-白蜡树科 | o个 | o个 | o个 | 我 | A类 | o个 | | o个 | o个 | (三层FLDB[10]) | 基因目录 |
14 | NBRP公司-拟南芥(里肯BRC) | 绿车前草狂犬病 | | o个 | o个 | | | o个 | | o个 | o个 | | |
15 | NBRP公司-菊花 | Viridiplantae-asterids-菊花 | o个 | | | | | o个 | | | o个 | | |
16 | NBRP-晨光 | 紫锥菊-茄科 | | o个 | o个 | 我 | M(M) | o个 | | | o个 | | |
17 | NBRP-大豆/甘氨酸(豆科) | 蚕豆科 | o个 | o个 | o个 | 我 | M(M) | o个 | | | o个 | (宫崎骏.jp[11],大豆全长cDNA数据库[12]) | |
18 | NBRP-托马托 | Viridiplanate-solanales-lycopersicon(绿车前) | | | o个 | | | | | | | (卡夫·汤姆;http://www.pgb.kazusa.or.jp/kaftom网站/、MiBASE[13]) | |
19 | NBRP-藻类 | 14门(真核生物和细菌) | o个 | | | | | o个 | | | o个 | | 照片,系统发育树 |
20 | NBRP-酵母 | 真菌-子囊菌 | | o个 | o个 | 对 | A类 | | | | | 新加坡元[14],通用数据库[15] | |
21 | NBRP-微孔黏菌 | 真菌-双ctyostelliida | | | o个 | | | | | | | dictyBase(字典库)[16] | |
22 | NBRP-原核生物大肠杆菌 | 细菌-蛋白菌 | | o个 | o个 | 对 | A类 | | | o个 | | PEC公司[17]、生态基因[18],EcoCyc公司[19],中心距[20]、NCBI[1]、SwissProt[21]、GTOP[22]、KEGG[23]、InterPro[24] | |
23 | NBRP原核生物枯草杆菌 | 细菌-硬杆菌-杆菌科 | | o个 | | | M(M) | | | | | | |
24 | NBRP-病原微生物 | 细菌和原生动物 | o个 | | | | | o个 | | | o个 | | |
25 | NBRP-普通微生物(Riken BRC,JCM) | 细菌 | o个 | | | | | | | | | | |
| 数据库名称 | 出租车 | 野生/近交/长白猪 | 突变体 | 质粒/载体/克隆 | 地图(物理或链接) | 基因(突变基因/所有基因) | 表型 | 单核苷酸多态性 | 爆破服务 | 图像 | 外部DB(协作DB)[参考] | 特色内容/服务 |
1 | NBRP手册 | 脊椎动物-哺乳动物-动物 | o个 | | o个 | | | | | | | | |
2 | NBRP-Mouse(里肯BRC) | 脊椎动物-哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | MGI公司[三],(IMSR、JMSR;http://www.shigen.nig.ac.jp/mouse/jmsr/) | |
三 | NBRP-红色 | 哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | RGD公司[4],(JMSR) | 表型数据的图形显示 |
4 | NBRP-Xenous公司 | 脊椎动物-两栖动物 | o个 | | o个 | | | | | o个 | | | |
5 | NBRP-Zebrafish公司 | 脊椎动物-放线鱼-副鳍目动物-danio | | o个 | | | M(M) | o个 | | | o个 | ZFIN公司[5] | |
6 | NBRP Medaka公司 | 脊椎动物-放线虫-柱形目-稻纵形目 | o个 | o个 | o个 | 对 | M(M) | o个 | | o个 | o个 | | 地图集,系统发育树 |
7 | NBRP-Ciona公司 | 海鞘纲 | | o个 | o个 | | M(M) | o个 | | | o个 | (幽灵[6]CIPRO;http://cipro.ibio.jp/new/) | |
8 | NBRP-嗜酸性粒细胞(DGRC) | 节肢动物-昆虫-二翅果蝇科 | o个 | o个 | o个 | 对 | A类 | o个 | o个 | o个 | o个 | FlyBase飞基[7] | |
9 | NBRP-家蚕(家蚕基地) | 节肢动物-昆虫-表膜翅目-蜂鸟 | | o个 | | 我 | M(M) | o个 | | | o个 | | laeva周期时间 |
10 | NBRP公司-秀丽线虫 | 假性体腔动物门 | | o个 | | | M(M) | | | | | 蚯蚓酶[8] | |
11 | NBRP-Rice(水稻酶) | 禾谷病毒介 | o个 | o个 | | P、 L(左) | A类 | o个 | | o个 | o个 | 格拉姆烯[9],内部收益率;http://beta.irr.org/index.php/Home/Welcome/Frontpage.html | 发育阶段 |
12 | NBRP-巴利 | Viridiplante-poaceae-triticae-大麦 | o个 | | o个 | 我 | | o个 | | o个 | o个 | | 表型数据 |
13 | NBRP-加热(KOMUGI) | 毒车前草-白蜡树科 | o个 | o个 | o个 | 我 | A类 | o个 | | o个 | o个 | (三层FLDB[10]) | 基因目录 |
14 | NBRP公司-拟南芥(里肯BRC) | 绿车前草狂犬病 | | o个 | o个 | | | o个 | | o个 | o个 | | |
15 | NBRP公司-菊花 | Viridiplantae-asterids-菊花 | o个 | | | | | o个 | | | o个 | | |
16 | NBRP-晨光 | 紫锥菊-茄科 | | o个 | o个 | 我 | M(M) | o个 | | | o个 | | |
17 | NBRP莲花/甘氨酸(豆类碱) | 蚕豆科 | o个 | o个 | o个 | 我 | M(M) | o个 | | | o个 | (宫崎骏.jp[11],大豆全长cDNA数据库[12]) | |
18 | NBRP-托马托 | Viridiplanate-solanales-lycopersicon(绿车前) | | | o个 | | | | | | | (卡夫·汤姆;网址:http://www.pgb.kazusa.org.jp/kaftom/、MiBASE[13]) | |
19 | NBRP-藻类 | 14门(真核生物和细菌) | o个 | | | | | o个 | | | o个 | | 照片,系统发育树 |
20 | NBRP-酵母 | 真菌-子囊菌 | | o个 | o个 | 对 | A类 | | | | | 新加坡元[14],通用数据库[15] | |
21 | NBRP-微孔黏菌 | 真菌-双ctyostelliida | | | o个 | | | | | | | dictyBase(字典库)[16] | |
22 | NBRP-原核生物大肠杆菌 | 细菌-蛋白菌 | | o个 | o个 | 对 | A类 | | | o个 | | PEC公司[17]、生态基因[18],经济周期[19],中心距[20]、NCBI[1]、SwissProt[21]、GTOP[22]、KEGG[23]、InterPro[24] | |
23 | NBRP-原核生物枯草杆菌 | 细菌-硬杆菌-杆菌科 | | o个 | | | M(M) | | | | | | |
24 | NBRP-病原微生物 | 细菌和原生动物 | o个 | | | | | o个 | | | o个 | | |
25 | NBRP-普通微生物(Riken BRC,JCM) | 细菌 | o个 | | | | | | | | | | |
| 数据库名称 | 出租车 | 野生/近交/长白猪 | 突变体 | 质粒/载体/克隆 | 地图(物理或链接) | 基因(突变基因/所有基因) | 表型 | 单核苷酸多态性 | 喷砂服务 | 图像 | 外部DB(协作DB)[参考] | 特色内容/服务 |
1 | NBRP手册 | 脊椎动物-哺乳动物-动物 | o个 | | o个 | | | | | | | | |
2 | NBRP小鼠(瑞肯BRC) | 脊椎动物-哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | MGI公司[三],(IMSR、JMSR;http://www.shigen.nig.ac.jp/mouse/jmsr/) | |
三 | NBRP-红色 | 哺乳动物-鼠 | o个 | o个 | o个 | 对 | M(M) | o个 | o个 | o个 | o个 | RGD公司[4],(JMSR) | 表型数据的图形显示 |
4 | NBRP-Xenous公司 | 两栖脊椎动物 | o个 | | o个 | | | | | o个 | | | |
5 | NBRP-Zebrafish公司 | 脊椎动物-放线鱼-副鳍目动物-danio | | o个 | | | M(M) | o个 | | | o个 | ZFIN公司[5] | |
6 | NBRP-梅达卡 | 脊椎动物-放线虫-柱形目-稻纵形目 | o个 | o个 | o个 | 对 | M(M) | o个 | | o个 | o个 | | 地图集,系统发育树 |
7 | NBRP-Ciona公司 | 海鞘纲 | | o个 | o个 | | M(M) | o个 | | | o个 | (幽灵[6]CIPRO;http://cipro.ibio.jp/new/) | |
8 | NBRP-嗜酸性粒细胞(DGRC) | 节肢动物-昆虫-二翅果蝇科 | o个 | o个 | o个 | 对 | A类 | o个 | o个 | o个 | o个 | FlyBase飞基[7] | |
9 | NBRP-家蚕(家蚕基地) | 节肢动物-昆虫-表膜翅目-蜂鸟 | | o个 | | 我 | M(M) | o个 | | | o个 | | laeva周期时间 |
10 | NBRP公司-秀丽线虫 | 假性体腔动物门 | | o个 | | | M(M) | | | | | 蠕虫[8] | |
11 | NBRP-Rice(水稻酶) | Viridiplanate-poaceae-oryzeae(绿车前) | o个 | o个 | | P、 L(左) | A类 | o个 | | o个 | o个 | 格拉姆烯[9],内部收益率;http://beta.irr.org/index.php/Home/Welcome/Frontpage.html | 发育阶段 |
12 | NBRP-巴利 | Viridiplante-poaceae-triticae-大麦 | o个 | | o个 | 我 | | o个 | | o个 | o个 | | 表型数据 |
13 | NBRP-加热(KOMUGI) | 毒车前草-白蜡树科 | o个 | o个 | o个 | 我 | A类 | o个 | | o个 | o个 | (三层FLDB[10]) | 基因目录 |
14 | NBRP公司-拟南芥(里肯BRC) | 绿车前草狂犬病 | | o个 | o个 | | | o个 | | o个 | o个 | | |
15 | 国家可再生能源公司-菊花 | Viridiplantae-asterids-菊花 | o个 | | | | | o个 | | | o个 | | |
16 | NBRP-晨光 | 紫锥菊-茄科 | | o个 | o个 | 我 | M(M) | o个 | | | o个 | | |
17 | NBRP-大豆/甘氨酸(豆科) | 蚕豆科 | o个 | o个 | o个 | 我 | M(M) | o个 | | | o个 | (宫崎骏.jp[11],大豆全长cDNA数据库[12]) | |
18 | NBRP-托马托 | Viridiplanate-solanales-lycopersicon(绿车前) | | | o个 | | | | | | | (卡夫·汤姆;http://www.pgb.kazusa.or.jp/kaftom网站/、MiBASE[13]) | |
19 | NBRP-藻类 | 14门(真核生物和细菌) | o个 | | | | | o个 | | | o个 | | 照片,系统发育树 |
20 | NBRP-酵母 | 真菌-子囊菌 | | o个 | o个 | 对 | A类 | | | | | 新加坡元[14],通用数据库[15] | |
21 | NBRP细胞黏菌 | 真菌-双ctyostelliida | | | o个 | | | | | | | 字典库[16] | |
22 | NBRP-原核生物大肠杆菌 | 细菌-蛋白菌 | | o个 | o个 | 对 | A类 | | | o个 | | PEC公司[17]、生态基因[18],EcoCyc公司[19],中心距[20]、NCBI[1]、SwissProt[21]、GTOP[22]、KEGG[23]、InterPro[24] | |
23 | NBRP-原核生物枯草杆菌 | 细菌-硬杆菌-杆菌科 | | o个 | | | M(M) | | | | | | |
24 | NBRP-病原微生物 | 细菌和原生动物 | o个 | | | | | o个 | | | o个 | | |
25 | NBRP一般微生物(Riken BRC,JCM) | 细菌 | o个 | | | | | | | | | | |
资源的类型和名称(标识符)以及分配/沉积方法(如MTA)是所有资源的基本信息。对于DNA克隆,DNA数据库中的登录号以及同源序列是所有生物群共有的信息项。NBRP还包括一些活动,其中资源分配需要规定的审查程序(如人类ES细胞和猕猴)。那些无法通过扩散获得资源,但需要非侵入性采样或从死动物中采样的活动,仅为符合规定标准的研究提供[例如大猩猩信息网络(GAIN)]。全球生物多样性信息基金;网址:http://www.gbif.org/)是一项国际项目的日本节点活动,该项目涉及收集和创建博物馆保存的标本和观测数据数据库。来自GBIF的信息以及来自GAIN和Macaque数据库的资源通常不被分发,因此它们不包括在BRW中。
作为上述特征的示例,水稻数据库,大肠杆菌,秀丽隐杆线虫下面更详细地描述了大鼠,并给出了RIKEN生物资源中心数据库的一些细节。
NBRP-冰(水稻酶)(25)
水稻酶是目前许多研究人员使用的一个综合数据库,它继承了1995年启动的资源和性状基因数据库。基因组信息已添加到资源和基因数据库中,因此它已变得全面,现在用作NBRP数据库。特色野生珍藏包括三个不同的核心珍藏。核心收集1级涉及9个基因组中的18个物种,包含详细的表型数据和许多照片。独特突变菌株的收集包括已鉴定出性状基因的菌株,以及表型未知的相关基因的菌株。前一组菌株可以根据遗传信息检索,后一组菌株则可以根据表型检索。两组菌株的数据包括照片。
我们不断用从已发表的论文中提取的数据更新性状基因词典,我们也一直在推动利用物理图谱建立性状基因与DNA序列的登录号、基因组项目的ORF数和染色体显示之间的对应关系。水稻酶还提供了一个用于在线提交新水稻基因的网站,该网站基于水稻基因符号化、命名和链接委员会(CGSNL)确定的水稻基因命名系统(26). 用户可以通过该基因的详细页面提供关于单个基因的反馈。
有关水稻的基本信息,包括组织特异性发育阶段(如胚、花序、叶、根、花药、胚珠、花粉母细胞、气孔或维管束)的定义,以及组织特异性或发育阶段特异性基因表达的信息也可通过该网站获得。
Textpresso是一个由通用模型生物数据库开发的科学论文文本管理系统,适合水稻使用,该系统已经构建完成,可通过水稻糖酶获取。它提供了PubMed中总计约20000篇与大米相关的论文(摘要和标题)的访问,并与Textpresso的主页链接。
水稻糖酶链接到两个外部数据库:Gramene和IRRI。遗传信息链接到前一个数据库,野生植物信息链接到后一个数据库。Oryzabase还允许通过所有基因组或染色体进行BLAST搜索,提供了一种提取基因组序列特定区域的工具,并且可以提供几乎所有信息的可下载文本文件。
NBRP公司-大肠杆菌
在NBRP收集的所有生物中,大肠杆菌是第一个确定其基因组序列的人。NBRP的一个特点-大肠杆菌是其全基因组基因工程菌株集合。在NBRP的网站上-大肠杆菌(http://www.shigen.nig.ac.jp/ecoli/strain网站/),用户可以浏览集合的大纲和列表,搜索完整数据或通过指定详细信息执行查询。尽管在线请求可用,但由于MTA过程的复杂性,这些请求通常需要时间。为了方便用户,引入了一个跟踪系统,允许用户实时检查其请求的进度。
信息中心维护对大肠杆菌染色体(PEC),基本信息项目的信息站点大肠杆菌基因(27). 通过PEC,信息中心提供了基因组图和遗传信息。NBRP中包含的资源信息-大肠杆菌与PEC交叉链接,以允许通过地图访问资源。例如,通过单击广泛缺失突变体的缺失区域,或通过单击基因单元突变的突变体的基因部分,用户可以访问链接到资源请求页面的详细页面。PEC与外部数据库有许多链接,包括NCBI、UniProtKB、COG、EcoCyc、GTOP、EcoGene和KEGG。我们还对基因序列进行相似性搜索,以添加来自Pfam和PROSITE的域信息。此外,PEC通过两个不同的菌株MG1655和W3110提供BLAST搜索;所有ORF和必需基因。还提供了指定基因组序列所需片段的工具。数据库中的几乎所有信息都可以以文本文件的形式下载。
NBRP公司-秀丽线虫
NBRP公司-秀丽线虫(http://www.shigen.nig.ac.jp/c.elegans网站/)是一个比上面讨论的两个数据库更小的数据库。每个记录仅包含缺失菌株的等位基因、基因的系统识别标签(CGC名称)、基因在染色体上的位置信息、缺失区域位置信息和引物信息。然而,CGC名称、等位基因和序列与WormBase(一个关于秀丽线虫,提供对该数据库的轻松访问。对于此资源,请求的变体在请求后从池中隔离。用户可以在线查看隔离的进度状态。被隔离一次的突变体将被列为可用突变体(隔离),以便其他用户可以请求相同的突变体。NBRP公司-秀丽线虫是独一无二的,因为从这个项目中获得变种的研究人员的信息在网上公开。由于几乎所有使用资源的论文都包含这些资源的名称,并且信息是从纸质注册网站反馈的,因此秀丽线虫数据库自动反映RRC中的信息。这是一个资源和研究之间良性循环的典型案例。
NBRP大鼠
因为老鼠资源数据库(http://www.anim.med.kyoto-u.ac.jp/NBR/)包含来自个人资源的大量特征数据,并有许多工具用于浏览这些数据,这可以有效地让研究人员从一系列特征信息中找到最适合他们研究的资源。例如,顶部页面显示一个饼图,其中显示了使用资源的研究领域的细分,通过单击感兴趣的研究领域,用户可以获得与该特定研究领域相关的资源列表。另一个例子,“物候项目”在九个表和应变分布图中提供109项生理、行为和解剖物候数据,用户选择这两项作为横坐标轴和纵坐标轴。用户可以通过单击地图中的数据点访问菌株的详细页面。”“基因组”提供了从150多个菌株的调查中获得的357个简单序列长度多态性(SSLP)标记的多态性数据。还提供了由多态性数据构建的系统发育树,用户可以通过该树访问资源的详细页面。
除了特征数据外,数据库还包含关于资源的详细页面,包括保存状态、遗传状态、研究类别、起源、基因型、参考文献以及大鼠基因组数据库(RGD)的链接。最近的改进包括一个用于F344和LE BAC末端序列的BAC浏览器,以及通过比较多个菌株之间的16个疾病相关基因突变而获得的功能多态性数据。ENU诱导的突变档案(28)该站点也提供了。
NBRP-RIKEN BRC公司
里肯生物资源中心(BRC)成立于2001年,旨在成为世界上最好的核心生物源设施。自那时以来,它一直致力于收集主要由日本科学家开发的生物资源。这些生物资源包括活的小鼠菌株和拟南芥RIKEN BRC已被NBRP指定为国家核心设施的人类和动物细胞、DNA材料和各种微生物。RIKEN BREC在严格的质量控制条件下保存这些生物源,以供科学界使用。RIKEN BRC还收集生物资源的去向和特征信息,建立数据库,并向日本国内外的研究团体提供生物资源信息。
动物搜索系统(http://www2.brc.riken.jp/lab/animal/search.php)允许对RIKEN BRC提供的2000多个小鼠菌株进行关键词搜索,包括转基因、敲除、近交、野生衍生、ENU突变和同源菌株。该系统还提供关于每个菌株的详细信息,例如菌株名称、描述、基因详细信息、参考文献、可用性状态、健康报告、存款人、特定的分销条款和条件,以及捕获菌株特征的图像。一些基因符号与小鼠基因组信息学(MGI)数据库有链接,可以获得有关特定基因的更多详细信息。除了可以公开获取外,有关小鼠的最新信息也会发送给国际小鼠菌株资源(IMSR,网址:http://www.findmice.org/)数据库,RIKEN BRC是其中的一个贡献存储库。RIKEN BRC小鼠表型数据库(RMPD)(http://www.brc.riken.jp/rmpd/mouse_penome_top.html)包含近交系、突变系、野生衍生系和重组近交系小鼠的生理学、生物化学、血液学和形态学的表型数据,使生物医学研究人员能够找到适合他们研究的菌株。
这个拟南芥转座子标记的行可以在基于web的目录中搜索(http://www.brc.riken.jp/lab/epd/catalog/transposon.html)其中,可以获得15000多个株系的转座子和相邻基因的插入位置信息。SENDAI公司拟南芥种子库存中心(SASSC)数据库(http://www.brc.riken.jp/lab/epd/SASSC/)提供有关其集合(野生型和突变型)的信息,例如菌株名称、集合区域和表型备注。RIKEN公司拟南芥全长cDNA克隆数据库(http://www.brc.riken.jp/lab/epd/catalog/cdnaclone.html)包含25万多个克隆,用户可以通过NCBI登录号、AGI代码、克隆名称或序列同源性检索克隆。系统整合拟南芥和其他植物资源(SABRE)数据库(http://saber.epd.brc.riken.jp/sabre/SABRE0101.cgi)提供BRC植物DNA资源在其所含物种中的搜索。
人类和动物细胞数据库(http://www2.brc.riken.jp/lab/cell/search.php)其起源于RIKEN Cell Bank的数据库,该数据库于1987年开始收集和分发细胞资源。它从一个供内部使用的独立数据库开始,经过改造,可以通过互联网搜索单元格资源和提供相关信息。由于细胞库是作为BRC的一个部门开始活动的,随着各种新型细胞资源的增加,其库存清单也在增加,如爱泼斯坦-巴尔病毒转化的B细胞系、人类体细胞干细胞、胚胎干细胞系和诱导多能干细胞系。相应地,数据库的功能得到了增强,以允许显示不同资源的其他信息项。因此,可用信息取决于资源;例如,对于常规细胞系资源,可以获得关于起源、形态、培养条件、分布限制、短串联重复分析结果、图像等的信息。
在建立BRC之前,作为RIKEN DNA库的一项活动,DNA材料被收集和分发。关键词搜索系统(http://www.brc.riken.jp/lab/dna/search/index.html)可用于DNA克隆、载体和重组腺病毒。资源通过质粒名称、基因名称或符号或登录号检索。在Geneset Bank数据库中(http://www.brc.riken.jp/lab/dna/en/GENESETBANK/index.html),实现了20多个主要基因通路的插图,并且可以根据它们所属的基因通路轻松找到DNA材料。
RIKEN微生物资源采集中心成立于1980年,是日本微生物采集中心(JCM),从一开始就开始为该采集中心建立数据库。基于Web的在线目录数据库(http://www.jcm.riken.jp/jcm/catalogue.shtml)它于1995年推出,此后得到了改进和更新。它现在提供了11000多个可用菌株的信息,可通过其登录号、学名和菌株数据的关键字进行搜索。也可以搜索与其他培养物集合中的菌株等效的JCM菌株。该数据库包含关于菌株的各种有用信息,例如培养基和条件、历史(包括分离源)、分类数据和参考文献。DNA序列数据对系统发育至关重要,基因组数据与每个菌株的DDBJ数据库相连。
未来发展方向
我们将继续改进单个数据库的内容,并升级综合数据库检索站点的可用功能。我们还希望扩大对数据库的外部访问,并扩大与其他数据库的协作,以允许更广泛的用户访问我们的资源。特别是,我们将研究将参考数据和资源数据库互连的新可能性,目的是构建一个虚拟国际网络。
基金
教育、文化、体育、科学技术部(MEXT)(国家生物资源项目)。开放存取费用的资金来源:国立大学合作管理费用拨款,MEXT。
利益冲突声明。未声明。
参考文献
1,,,,.
GenBank(基因银行)
.核酸研究。
(2009
)37
:D26型
–第31天
. 2,,,,.
DDBJ处理第二代测序器产生的大量数据
.核酸研究。
(2009
)37
:第16天
–第18天
. 三。,,,,,
小鼠基因组数据库组
.小鼠基因组数据库基因型:表型
.核酸研究。
(2009
)37
:D712型
–D719号
. 4,,,,,,,,,等
2009年大鼠基因组数据库:变异、本体论和途径
.核酸研究。
(2009
)37
:D744号
–D749天
. 5,,,,,,,,,等
斑马鱼信息网络:斑马鱼模型生物数据库为基因型和表型提供了扩展支持
.核酸研究。
(2008
)36
:D768毫米
–D772号
. 6,,,,.
海鞘、肠鞘的综合数据库:功能基因组学
.动物科学。
(2005
)22
:837
–843
. 7.,,,,,,,,,等
FlyBase:增强果蝇基因本体注释
.核酸研究。
(2009
)37
:D555型
–559美元
. 8,,,,,,,,,等
WormBase2007
.核酸研究。
(2008
)36
:D612型
–D617号
. 9,,,,,,,,,等
禾本科植物:一种生长中的植物比较基因组资源
.核酸研究。
(2008
)36
:D947号
–D953型
. 10,,,,.
TriFLDB:小麦科簇状全长编码序列数据库及其在比较草基因组学中的应用
.植物生理学。
(2009
)150
:1135
–1146
. 11,,,,,,,,,等
豆科植物的基因组结构,莲花
.DNA研究。
(2008
)15
:227
–239
. 12,,,,,,,,,等
全长cDNA文库中约40000个大豆cDNA克隆的测序与分析
.DNA研究。
(2008
)15
:333
–346
. 13,,,,,,.
MiBASE:微型番茄品种Micro-Tom数据库
.植物生物技术。
(2006
)23
:195
–198
. 14,,,,,,,,,等
SGD的基因本体注释:新的数据源和注释方法
.核酸研究。
(2008
)36
:第577页
–D581型
. 15,,,,,,,,,等
GeneDB:原核生物和真核生物的资源
.核酸研究。
(2004
)32
:D339号
–D343号
. 16,,,,,,,,,,等人
dictyBase-a网柄菌生物信息学资源更新
.核酸研究。
(2009
)37
:D515型
–D519型
. 17,,.
大肠杆菌染色体数据库的分析
.方法分子生物学。
(2008
)416
:385
–389
. 18.
EcoGene:的基因组序列数据库大肠杆菌K-12公司
.核酸研究。
(2000
)28
:60
–64
. 19,,,,,,,,,等
生态周期:综合大肠杆菌生物学
.核酸研究。
(2009
)37
:D464号
–D470型
. 20,,,,,,,,,等
COG数据库:更新版本包括真核生物
.BMC生物信息学
(2003
)4
:41
. 21UniProt财团
.2009年全球蛋白质资源(UniProt)
.核酸研究。
(2009
)37
:D169号
–D174号
. 22,,,,,,.
2009年的GTOP数据库:更新内容和新功能,以扩展和深化对蛋白质结构和功能的见解
.核酸研究。
(2009
)37
:D333号
–D337号
. 23,,,,,,,,,等
KEGG将基因组与生命和环境联系起来
.核酸研究。
(2008
)36
:D480型
–D484号
. 24,,,,,,,,,等
InterPro:综合蛋白质特征数据库(2009年)
.核酸研究。
(2009
)37
:D224型
–D228号
. 25,.
水稻生物和基因组信息集成数据库——水稻糖酶
.植物生理学。
(2006
)140
:12
–17
. 26,
CGSNL(水稻遗传合作社基因符号化、命名和连锁委员会
.水稻基因命名系统
.大米
(2008
)1
:72
–84
. 27,.
长染色体缺失突变体的构建大肠杆菌和基因组最小化
.方法分子生物学。
(2008
)279
–293
. 28,,,,,,,,,.
ENU诱导的大鼠基因靶向突变档案
.自然遗传学。
(2008
)40
:514
–515
.
©作者2009。牛津大学出版社出版。