美国国旗

美国政府的官方网站

NCBI书架。美国国立卫生研究院国家医学图书馆的一项服务。

NCBI手册[互联网]。第二版。贝塞斯达(医学博士):美国国家生物技术信息中心;2013-.

  • 本出版物仅供历史参考,信息可能已过时。

本出版物仅供历史参考,信息可能已过时。

NCBI手册封面

NCBI手册[互联网]。第二版。

显示详细信息

基因与基因表达

,博士,,博士,,博士,,博士,、博士和,博士。

作者信息和隶属关系

创建:.

预计阅读时间:3分钟

范围

基因概述

美国国立生物技术信息中心主要在两种情况下维护有关基因的信息。一个上下文由公共序列信息定义,例如RefSeq的注释(请参见参考序列第章)或与国际核苷酸序列数据库联盟中的记录链接,或INSDC公司(参见基因组参考联盟章节). 序列信息与GeneID或非重复序列 集群标识符对任何分析都至关重要基因表达定义基因的第二个上下文是通过映射表型GeneID并没有被分配给所有分类群的映射基因座,但当它们被分配时,预期基因最终将与序列相连,因为表型的分子基础已经确定。

一旦一个标识符被指定给一个基因的概念,多个数据库就会将信息连接到该概念。美国国立生物技术信息中心这些数据库包括Gene,用于获取有关基因的原始数据以及有关其表达、产物、同源物和表型的信息门户;涉及其产品的途径的生物系统;GEO(参见GEO章节)和非重复序列有关表达的信息;用于出版物的书架、PubMed和PubMedCentral;数据库间隙P,PheGenI公司,MedGen公司OMIM公司表型;同源基因对于同源性变化的dbSNP、dbVar和ClinVar;和分类学,以获取有关该生物体的信息。换言之,NCBI有许多维护基因信息的资源,但本节重点关注这些:

表达式概述

几个资源位于美国国立生物技术信息中心保留有关组织、健康状态、基因表达的发育阶段或年龄,或影响基因表达的序列变异的原始数据。数据档案反映了生成这些数据的主要方法,从采样开始cDNA中非规范化库中的序列非重复序列,通过GEO中基于阵列或RNAseq的方法,获得GTex中的关联数据。这些资源还维护用于分析数据集的工具,这些数据集可能非常大。

历史

基因

将基因表示为具有稳定标识符的对象始于美国国立生物技术信息中心1995年,将GenBank第88版中的3’个未翻译区域聚类为特定基因集非重复序列. (1) . 参考序列该项目始于1998年,是人类命名委员会(现在HGNC公司),OMIM公司和RefSeq团队收集用于跟踪的基因特定信息。这发展成为LocusLink(2)2004年进化为Gene(). 在20世纪90年代末到2000年代初真核生物的由序列信息识别的基因由假定代表基因表达即cDNA。然而,现在许多基因首先是通过计算而不是直接序列证据来确定的,即通过基因预测软件来确定,该软件可以使用直接的实验结果,但也可以根据与相关物种的比较或预测蛋白质的分析来计算基因组序列的哪些区域可能是基因。

同源基因

通过对多个物种的评估,可以方便地检查基因的功能,同源基因(参见同源基因章节),于2000年作为一种独特的资源推出,旨在通过根据同源性,提供了用于比较的工具,并聚合了这些同源组的数据。

基因表达

识别区域的方法基因组这些年来,转录的内容发生了变化。大型cDNAI.M.A.G.E.等项目(4)和哺乳动物基因收集(MGC)(5)根据这些克隆的cDNA克隆和测序确定表达的序列。给定这些序列,使用基于阵列的技术来比较不同实验条件下序列的表达。现在,利用RNAseq的强大功能,无需克隆步骤即可对表达进行定性和定量分析。

影响序列变化基因表达也在评估中(6).PheGenI公司为这些数据提供了一个窗口。

数据模型

当一个基因由序列、地图位置或命名组定义时,它会被分配一个稳定的标识符GeneID用于跟踪。GeneID和核苷酸或蛋白质序列之间的连接被许多美国国立生物技术信息中心的数据库来表示基因上下文中的数据。因此,您将在NCBI的许多网站上看到Gene或带注释的GeneID的链接。同源基因通过将计算或策划为同源基因的基因分组,就是其中之一。

数据流

基因记录的建立和序列表达的评估独立进行。换句话说,GEO、核苷酸、蛋白质或非重复序列不交叉引用Gene中的记录。对于由注释的基因组美国国立生物技术信息中心(参见欧洲语的和原核生物基因组注释章节)序列和GenerID之间的连接在每个注释版本中进行评估,从而缩小一些差距。

工具书类

1
Boguski MS,Schuler GD.建立人类转录图。自然遗传学。1995年8月;10(4):369–71.[公共医学:7670480]
2
Maglott DR、Katz KS、Sicotte H、Pruitt KD。NCBI的LocausLink和RefSeq。核酸研究。2000年1月1日;28(1):126–8.[PMC免费文章:PMC102393] [公共医学: 10592200]
三。
Maglott D、Ostell J、Pruitt KD、Tatusova T.Entrez基因:NCBI以基因为中心的信息。核酸研究。2005年1月1日;33(数据库问题):D54–8。[PMC免费文章:PMC539985] [公共医学: 15608257]
4
Lennon G、Auffray C、Polymeropoulos M、Soares MB。I.M.A.G.E.联盟:基因组及其表达的综合分子分析。基因组学。1996年4月1日;33(1):151–2.[公共医学: 8617505]
5
Gerhard DS、Wagner L、Feingold EA、Shenmen CM、Grouse LH、Schuler G、Klein SL、Old S、Rasooly R、Good P、Guyer M、Peck AM、Derge JG、Lipman D、Collins FS、Jang W、Sherry S、Feolo M、Miswetta L、Lee E、Rotmistrovsky K、Greenhut SF、Schaefer CF、Buetow K、Bonner TI、Hausler D、Kent J、Kiekaus M、Furey T、Brent M、Prange C、Schreiber K、Shapiro N、,Bhat NK、Hopkins RF、Hsie F、Driscoll T、Soares MB、Casavant TL、Scheetz TE、Brown stein MJ、Usdin TB、Toshiyuki S、Carninci P、Piao Y、Dudekula DB、Ko MS、Kawakami K、Suzuki Y、Sugano S、Gruber CE、Smith MR、Simmons B、Moore T、Waterman R、Johnson SL、Ruan Y、Wei CL、Mathavan S、Gunartane PH、Wu J、Garcia AM、Hulyk SW、Fuh E、Yuan Y、Sneed A,Kowis C、Hodgson A、Muzny DM、McPherson J、Gibbs RA、Fahey J、Helton E、Ketteman M、Madan A、Rodrigues S、Sanchez A、Whiting M、Madri A、Young AC、Wetherby KD、Granite SJ、Kwong PN、Brinkley CP、Pearson RL、Bouffard GG、Blakesly RW、Green ED、Dickson MC、Rodriggez AC、Grimwood J、Schmutz J、Myers RM、Butterfield YS、Griffith M、Grifith OL、,Krzywinski MI、Liao N、Morin R、Palmquist D、Petrescu AS、Skalska U、Smailus DE、Stott JM、Schnerch A、Schein JE、Jones SJ、Holt RA、Baross A、Marra MA、Clifton S、Makowski KA、Bosak S、Malek J.、MGC项目团队。NIH全长cDNA项目:哺乳动物基因采集(MGC)的现状、质量和扩展。基因组研究。2004年10月;14(10B):2121-7。勘误表:基因组研究,2006年6月;16(6):804. Morrin,Ryan[改为Morin,Ryan][PMC免费文章:PMC528928] [公共医学: 15489334]
6
GTEx财团。基因型问题表达(GTEx)项目。自然遗传学。2013年6月;45(6):580–5.[PMC免费文章:PMC4010069] [公共医学: 23715323]

意见

最近的活动

您的浏览活动为空。

活动录制已关闭。

重新打开录制

查看更多。。。