跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https公司

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2004年6月;2(6):e162。
doi:10.1371/journal.pbio.0020162。 Epub 2004年4月20日。

全长cDNA克隆验证的21037个人类基因的整合注释

塔达什·伊曼尼什 1伊藤武史铃木裕隆克莱尔·奥多诺万福智聪(Satoshi Fukuchi)卡纳科O小柳罗伯特·巴雷罗Takuro Tamura先生山谷由美(Yumi Yamaguchi-Kabata)田野本彦凯·尤拉宫崎骏伊基奥(Kazuho Ikeo)Keiichi Homma先生阿雷克·卡斯普日克西川哲雄米卡·平川让·蒂里·米格丹妮尔·蒂埃里·米格詹妮弗·阿舍斯特李斌佳中尾三郎迈克尔·A·托马斯尼古拉·穆德尤拉·卡拉维多普鲁金丽华金圣洙(Sangsoo Kim)安田智宏鲍里斯·伦哈德埃里克·埃文诺铃木吉铃木山崎奇佐武田俊一克雷格·高夫菲利普·希尔顿藤井康树酒井裕久田中素木克拉拉·阿米德马修·贝尔加德玛丽亚·德·法蒂玛·博纳尔多希德马萨·博诺苏珊·布隆伯格安东尼·布鲁克斯埃尔斯佩斯·布鲁福德皮耶罗·卡尼奇克劳德·切拉拉克里斯汀·库伊劳特桑德罗·J·德·苏扎玛丽安·德比利Marie-Dominique Devignes公司Inna Dubchak酒店Toshinori Endo公司安妮·埃斯特雷彻爱德华多·伊拉斯Kaoru Fukami Kobayashi先生戈帕尔·戈皮纳斯埃丝特·格劳登斯尤索·哈恩迈克尔·韩泽光汉Kousuke Hanada先生花冈秀树埃里米·原田桥本胜之乌苏拉·辛兹平井莫木久木泰郎(Teruyoshi Hishiki)伊恩·霍普金森桑德琳·伊姆博德伊藤英寿亚历山大·卡纳平Yayoi Kaneko先生小川武也珍妮特·凯尔索盟军飞行员欧文瑞科·基库诺木村口一伯恩哈德·科恩弗拉基米尔·库里舍夫伊莎贝拉·马卡洛夫斯卡Takashi Makino先生舒黑·马诺雷金·马里亚格·萨姆森Jun Mashima先生松田秀夫汉斯·沃纳·梅斯Minoshima信实长井庆一长崎秀树长田直树拉杰尼·尼甘姆小泽奥萨姆奥萨穆·奥哈拉大津正美冈田北弘大池敏久木田聪莫托诺里·奥塔大田俊雄大冢治二(Tetsuji Otsuki)多米尼克·皮亚蒂尔·通诺Annemarie Poustka公司双喜人Naruya赛投酒井胜雄坂本静香(Shigetaka Sakamoto)酒石龙义英戈·舒普佛罗伦萨仆人斯蒂芬·雪莉里士巴清水信义玛丽·下山安德鲁·辛普森Bento Soares公司查尔斯·斯图尔特Makiko Suwa公司铃木真美高桥爱子田宫将军田中浩托德·泰勒约瑟夫·德·特威利格佩尔·昂内伯格Vamsi Veeramachaneni公司渡边真也劳伦斯·威尔明安田诺利Hyang-Sook Yoo先生马文·斯托多斯基沃伊西奇·马卡卢夫斯基(Wojciech Makalowski)Mitiko围棋肯塔·纳凯Toshihisa Takagi先生金久实Yoshiyuki Sakaki先生约翰·奎肯布什冈崎康树吉藏Hayashizaki温斯顿海德拉纳吉特·查克拉波蒂Ken Nishikawa先生苏加瓦拉(Hideaki Sugawara)Tateno吉雄朱晨Michio Oishi先生彼得·托内拉托罗尔夫·阿普韦勒Kousaku Okubo公司卢卡斯·瓦格纳斯特凡·维曼罗伯特·斯特劳斯伯格高雄Isogai查尔斯·奥夫雷野村信夫塔卡希·戈霍博里苏米奥·苏加诺
附属公司

全长cDNA克隆验证的21037个人类基因的整合注释

塔达什·伊曼尼什等。 公共科学图书馆生物. 2004年6月.

勘误表in

  • 《公共科学图书馆·生物》。2004年7月;2(7):e256

摘要

人类基因组序列定义了我们固有的生物潜力;实现其中编码的生物学需要了解每个基因的功能。目前,我们在这方面的知识仍然有限。一些研究已经被用来阐明人类基因组中基因的结构和功能。尽管如此,基因预测仍然是一项困难的任务,因为基因转录物的种类可能会有很大的差异。因此,我们对41118个全长cDNA进行了详尽的综合表征,这些cDNA捕获基因转录物作为完整的功能盒,提供了基因水平上结构和功能多样性的明确报告。我们的国际合作已经通过使用统一标准对高质量全长cDNA克隆进行分析,验证了21037个人类候选基因。这导致了5155个新候选基因的鉴定。它还显示了控制cDNA克隆质量的最可靠方法。我们开发了一个人类基因数据库,称为H-InvDB;http://www.h-invitational.jp/). 它提供了以下内容:人类基因的综合注释,基因结构的描述,新的选择性剪接异构体的细节,非蛋白质编码RNA,功能结构域,亚细胞定位,代谢途径,蛋白质三维结构的预测,已知单核苷酸多态性(SNPs)的定位,人类基因内多态性微卫星重复序列的鉴定,以及与小鼠全长cDNA的比较结果。H-InvDB分析表明,高达4%的人类基因组序列(国家生物技术信息中心构建34个组装)可能包含错误组装或缺失的区域。我们发现6.5%的人类候选基因(1377个位点)没有良好的蛋白编码开放阅读框,其中296个位点是非蛋白编码RNA基因的强候选基因。此外,在72027个唯一定位的SNP和人类基因内的插入/缺失中,13215个非同义SNP、315个无义SNP和452个indels出现在编码区。与编码区中存在的25个多态性微卫星重复序列一起,它们可能改变蛋白质结构,导致表型效应或导致疾病。H-InvDB平台为探索人类生物学和病理学所需的资源做出了重大贡献。

PubMed免责声明

利益冲突声明

提交人声明不存在利益冲突。

数字

图1
图1。H-Inv cDNA的定位和聚类程序
cDNA被映射到基因组并聚集到位点。其余未映射的cDNA根据显著相似的cDNA分组进行聚类。
图2
图2。映射的H-Inv FLcDNA与RefSeq mRNA的比较
根据基因组位置对基因组注释过程提供的已映射的H-Inv cDNA、RefSeq筛选的mRNA(登录前缀NM和NR)和RefSeq模型mRNA(注册前缀XM和XR)进行聚类。显示了通过聚类确定的位点数量。
图3
图3。AS变体编码的不同结构示例
外显子从5′端呈现,AS变异体共享的外显子垂直排列。AS变体的注册号为AK095301和BC007828,与SCOP域d.136.1.1和相应的PDB结构1年对齐。螺旋和β片分别为红色和黄色。绿色条表示与PDB结构对齐的区域,而开放矩形表示对齐中的间隙。AK095301与所示的整个PDB结构对齐,而BC007828缺少与结构紫色部分的对齐。
图4
图4。H-Inv蛋白的人类治愈示意图
该图说明了人类将H-Inv蛋白分类为五个相似类别的管理流程;I、II、III、IV和V类蛋白质。
图5
图5。ncRNAs人工注释流程图
将候选非蛋白编码基因与人类基因组、ESTs、cDNA 3′端特征和基因座基因组环境进行比较。然后将候选基因分为四类:hold(cDNA不正确地映射到人类基因组上);未标记的转录物(与一个感测基因重叠的转录物,或在EST支持下位于相邻基因5kb内的转录物);假定的ncRNAs(EST或3′末端特征支持的多外显子或单外显子转录物);和不可分类(可能的基因组片段)。
图6
图6。与每个分类群中的蛋白质同源的H-Inv蛋白质的功能分类
与其他物种蛋白质序列同源的代表性H-Inv cDNA的数量(E类< 10−5)进行了计算。我们无法为其分配任何功能的cDNA被丢弃。哺乳动物物种被排除在“动物”组之外。“真核生物”代表哺乳动物、动物、真菌和植物群以外的真核生物物种。另见表S7。
图7
图7。人和小鼠UTR相似性的窗口分析
上述5′UTR和以下3′UTR的结果。使用map程序(Huang 1994)中实现的半全局算法,将整个mRNA序列与以下参数对齐:匹配10、失配-3、间隙开放惩罚-50、间隙扩展惩罚-5和最长惩罚间隙10;终端间隙完全没有缺陷。窗口大小为20 bp,步长为10 bp。将分析窗口分别移动到起始密码子和终止密码子的上游和下游。给定窗口的归一化得分计算为给定窗口中所有UTR的平均得分与所有5′或3′UTR中观察到的最大得分的分数。

类似文章

  • 通过整合人类转录组数据库(H-InvDB)上的数据挖掘研究蛋白质功能。
    山崎C、小柳KO、富井Y、伊藤T、巴雷罗R、田村T、山口-Kabata Y、田野M、武田J、福池S、宫崎S、野村N、铃野伸男S、伊曼西T、戈霍博里T。 山崎C等人。 基因。2005年12月30日;364:99-107. doi:10.1016/j.gene.2005.05.036。Epub 2005年9月26日。 基因。2005 PMID:16185827
  • H邀请数据库(H-InvDB),人类基因和转录物的综合注释资源。
    基因组信息集成项目与H-Invitational 2;山崎C、村上春树K、藤井Y、佐藤Y、原田E、武田J、田宫T、坂特R、菊川S、岛田M、田野M、小柳KO、巴雷罗RA、高夫C、淳HW、哈巴拉T、阪冈H、早川Y、希尔顿PB、Kaneko Y、神野M、川原Y、川村T、松下A、长田N、西坂K、野田AO、Nurimoto S、Sachi N、Sakai H、Sanbonmatsu R、Shiba R、,铃木M、高桥K、高桥A、田村T、田中M、田中S、Todokoro F、山口K、山本N、冈岛T、Mashima J、Hashizume A、Jin L、Lee KB、Lin YC、Nozaki A、Sakai K、Tada M、Miyazaki S、Makino T、Ohyanagi H、Osato N、Tanaka N、Suzuki Y、Ikeo K、Saitou N、Sugawara H、O’Donovan C、Kulikova T、Whitfield E、Halligan B、Shimoyama M、,Twigger S、Yura K、Kimura K、Yasuda T、Nishikawa T、Akiyama Y、Motono C、Mukai Y、Nagasaki H、Suwa M、Horton P、Kikuno R、Ohara O、Lancet D、Eveno E、Graudens E、Imbeaud S、Debily MA、Hayashizaki Y、Amid C、Han M、Osanger A、Endo T、Thomas MA、Hirakawa M,Makalowski W、Nakao M、Kim NS、Yoo HS、De Souza SJ、Bonaldo Mde F、Niimura Y、Kuryshev V,舒普一世、维曼·S、贝尔加德·M、希奥纽·M、贾·L、蒂耶里·米格·D、蒂耶里·米格·J、瓦格纳·L、张·Q、Go·M… 完整作者列表见摘要 基因组信息整合项目和H邀请赛2等。 核酸研究,2008年1月;36(数据库问题):D793-9。doi:10.1093/nar/gkm999。Epub 2007年12月18日。 2008年核酸研究。 PMID:18089548 免费PMC文章。
  • 【通过新人类基因的电子克隆和实验验证,对NCBI人类基因数据库中出现的模型refseq的一些错误进行分析、识别和纠正】。
    张DL、纪L、李YD。 张德林等。 《易传血宝》。2004年5月;31(5):431-43. 《易传血宝》。2004 PMID:15478601 中国人。
  • 人类基因的转录组分析及其在蛋白质组分析中的应用。
    铃木Y,铃木S。 铃木Y等人。 电流蛋白肽科学。2006年4月;7(2):147-63. doi:10.2174/138920306776359795。 电流蛋白肽科学。2006 PMID:16611140 审查。
  • 构建KIAA基因的表达就绪cDNA克隆:手动管理330个KIAA cDNA克隆。
    Nakajima D、Okazaki N、Yamakawa H、Kikuno R、Ohara O、Nagase T。 Nakajima D等人。 DNA研究,2002年6月30日;9(3):99-106. doi:10.1093/dnares/9.3.99。 2002年DNA研究。 PMID:12168954 审查。

引用人

  • 简要回顾MIR100HG在人类疾病中的作用。
    Ghafouri-Fard S、Harsij A、Farahzadi H、Hussen BM、Taheri M、Mokhtari M。 Ghafouri-Fard S等人。 《细胞分子医学杂志》,2023年8月;27(16):2278-2289。doi:10.1111/jcmm.17875。Epub 2023年7月24日。 《细胞分子医学杂志》,2023年。 PMID:37487022 免费PMC文章。 审查。
  • LncmiRHG-MIR100HG:癌症新星。
    吴毅,王泽,于斯,刘德,孙磊。 Wu Y等人。 前Oncol。2022年9月23日;12:997532. doi:10.3389/fonc.2022.997532。eCollection 2022年。 前Oncol。2022 PMID:36212400 免费PMC文章。 审查。
  • 丁香假单胞菌AlgU下调鞭毛蛋白基因表达,帮助规避植物免疫。
    鲍Z,魏HL,马X,Swingle B。 鲍Z等。 细菌杂志。2020年1月29日;202(4):e00418-19。doi:10.1128/JB.00418-19。2020年1月29日印刷。 细菌杂志。2020 PMID:31740494 免费PMC文章。
  • MIR100HG:胃癌中可靠的预后生物标志物和致癌lncRNA。
    李杰、徐Q、王伟、孙S。 李杰等。 Biosci Rep.2019年4月5日;39(4):英国标准20190171。doi:10.1042/BSR20190171。2019年4月30日打印。 2019年生物科技报告。 PMID:30886062 免费PMC文章。
  • 从“细胞”RNA到“智能”RNA:RNA在基因组稳定性及其以外的多重作用。
    Michelini F、Jalihal AP、Francia S、Meers C、Neeb ZT、Rossiello F、Gioia U、Aguado J、Jones Weinert C、Luke B、Biamonti G、Nowacki M、Storici F、Carninci P、Walter NG、d'Adda di Fagagna F。 Michelini F等人。 化学版次2018年4月25日;118(8):4365-4403. doi:10.1021/acs.chemrev.7b00487。Epub 2018年3月30日。 《化学》2018年版。 PMID:29600857 免费PMC文章。 审查。

工具书类

    1. Adams MD、Kelley JM、Gocayne JD、Dubnick M、Polymeropoulos MH等。互补DNA测序:表达序列标签和人类基因组计划。科学。1991;252:1651–1656.-公共医学
    1. Adams MD、Celniker SE、Holt RA、Evans CA、Gocayne JD等。果蝇基因组序列。科学。2000年;287:2185–2195.-公共医学
    1. [AGI]拟南芥基因组计划。开花植物拟南芥的基因组序列分析。自然。2000年;408:796–815。-公共医学
    1. Akey JM、Zhang G、Zhang-K、Jin L、Shriver MD。查询高密度SNP图以获取自然选择特征。基因组研究2002;12:1805–1814.-项目管理咨询公司-公共医学
    1. Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。基本本地对齐搜索工具。分子生物学杂志。1990;215:403–410.-公共医学

出版物类型