跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2013年8月;8(8):1551-66.
doi:10.1038/nprot.2013.092。 Epub 2013年7月18日。

基于PANTHER分类系统的大尺度基因功能分析

附属公司

基于PANTHER分类系统的大尺度基因功能分析

怀玉蜜等。 Nat协议. 2013年8月.

摘要

PANTHER(通过进化关系进行蛋白质注释)分类系统(http://www.pantherdb.org网站/)是一个综合系统,结合了基因功能、本体论、途径和统计分析工具,使生物学家能够分析测序、蛋白质组学或基因表达实验中的大规模全基因组数据。该系统由82个完整基因组组成,分为基因家族和亚家族,它们的进化关系通过系统发育树、多序列比对和统计模型(隐马尔可夫模型或HMM)捕获。基因按照其功能以几种不同的方式进行分类:家族和亚科用本体术语(基因本体(GO)和PANTHER蛋白质类)进行注释,序列分配给PANTHER路径。PANTHER网站包括一套工具,使用户可以浏览和查询基因功能,并通过一些统计测试分析大规模实验数据。它被实验室科学家、生物信息学家、计算机科学家和系统生物学家广泛使用。在2013年发布的PANTHER(v.8.0)中,除了更新数据内容外,我们还重新设计了网站界面,以改善用户体验和系统的分析能力。该协议详细描述了如何使用PANTHER分类系统分析全基因组实验数据。

PubMed免责声明

利益冲突声明

竞争性金融利益

作者声明,他们没有相互竞争的经济利益。

数字

图1
图1。PANTHER基础设施概述。
PANTHER由三个模块组成。核心模块是PANTHER蛋白库(黄色阴影),其中包含PANTHER家族和亚家族的集合,每个家族都由一个系统发育树、一个MSA和一个HMM表示。第二个模块是包含176条专家管理的通路(绿色阴影)的通路。通路成分与用于构建蛋白质库的蛋白质序列(浅绿色阴影)相关,因此,通路也与亚家族和HMM相关。第三个模块是工具套件。在这个图中,基因列表分析工具被用作一个例子(蓝色阴影)。当用户将基因列表上传到工具时,如果列表中的ID来自PANTHER中82个生物体中的一个,工具会将ID映射到PANTHER蛋白质库中的ID(绿色箭头)。如果上传的ID不是来自82个生物体中的一个,用户可以根据PANTHER HMM库对序列进行评分,并生成PANTHER通用映射文件(参见方框2)(橙色箭头)。该工具有三个测试:功能分类测试、统计过度表达测试和统计丰富测试。必须提供数值才能使用统计充实测试。
图2
图2。PANTHER系统发育树和路径图示例
(A) 来自PANTHER(PTHR11633,血小板衍生生长因子)的样本系统发育树。该族包含三个子族(蓝色箭头)。根据果蝇和秀丽线虫序列(分别为Q9VWP6和Q9N143)中的注释,SF1被注释为“PDGF/VEGF生长因子相关蛋白1”。最近有一个重复生成PDGF a链(SF3)和PDGF B链(SF2)。本体术语被注释到表示现有家族的共同祖先的节点,在本例中为AN0(SF1)。分类将传播到所有下降节点,包括AN4(SF3)和AN33(SF2)。(B) PANTHER通路图示例(P00047,PDGF信号通路)。该图如CellDesigner流程图所示,类似于SBGN-PD格式,例如(蓝色圆圈),输入(例如ERK)到输出(例如磷酸化ERK)的转换由修饰语(例如磷酸化MEK)催化。途径成分(如红圈中的PDGF)通过专家管理与蛋白质库中的蛋白质序列(2A中的红色箭头)相关联。这种联系得到了文献证据的支持。因此,PDGF的通路成分可以推断为文库中亚科的其他同源蛋白序列(2A中的SF2和SF3)。
图3
图3
带有基因列表分析工具的PANTHER主页。
图4
图4
的用户界面统计过表达试验允许用户选择其他测试基因列表。
图5
图5
功能分类结果显示为基因列表页。结果基于补充材料中的sampleTestList_NP_500文件。
图6
图6
PANTHER饼图结果来自补充材料中的sampleTestList_NP_500文件。您可以使用选择本体下拉菜单切换到不同本体的饼图。单击饼图部分以显示子类别。单击右侧的图例以检索该类别的基因列表。
图7
图7。结果来自统计过表达试验。结果基于补充材料中的sampleTestList_NP_500文件。
(A) 结果摘要显示在表格中。您可以通过单击导出结果按钮。您还可以使用查看下拉菜单。如果您的分析是在路径中完成的,如图所示,您可以单击路径名称并显示路径图。将突出显示测试列表中包含基因的路径组件。高亮显示的组件的颜色可以在页面顶部定义(红色圆圈)。可以同时分析和查看总共4个测试列表。(B) 在PANTHER路径中查看的结果异三聚体G蛋白信号通路——Giα和Gsα介导的通路(P00026)。测试基因列表中包含基因的组件以红色突出显示。
图8。
图8。
来自统计富集试验。结果基于补充材料中的sampleTestList_NP文件。(A) 工具的输出,其中包含功能类别分布和参考分布之间每次比较的P值列表。(B) 图形视图中PDGF信号通路(红色)和参考(蓝色)分布的比较。(C) PDGF信号通路的通路图,使用交互式通路Java小程序可视化,该小程序使用从输入值导出的“热图”为通路着色。
图8。
图8。
来自统计富集试验。结果基于补充材料中的sampleTestList_NP文件。(A) 工具的输出,带有功能类别分布和参考分布之间每次比较的P值列表。(B) 图形视图中PDGF信号通路(红色)和参考(蓝色)分布的比较。(C) PDGF信号通路的通路图,使用交互式通路Java小程序可视化,该小程序使用从输入值导出的“热图”为通路着色。

类似文章

引用人

工具书类

    1. Mi H、Muruganujan A和Thomas PD PANTHER于2013年发表的论文:在系统发育树的背景下,对基因功能和其他基因属性的进化进行建模。《核酸研究》41,D377-D386(2013)。-项目管理咨询公司-公共医学
    1. Venter JC、Adams MD、Myers EW、Li PW等。人类基因组序列。《科学》2911304-1351(2001)。-公共医学
    1. Thomas PD、Campbell MJ、Kejariwal A、Mi H等。PANTHER:按功能索引的蛋白质家族和亚家族库。《基因组研究》13,2129–2141(2003)。-项目管理咨询公司-公共医学
    1. Thomas PD、Kejariwal A、Guo N、Mi H等。蛋白质序列功能进化数据的应用:mRNA/蛋白质表达分析和编码SNP评分工具。《核酸研究》34,W645–W650(2006)。-项目管理咨询公司-公共医学
    1. Mi H、Vandergriff J、Campbell M、Narechania A等。黑腹果蝇全基因组蛋白质功能分类评估。《基因组研究》13,2118–2128(2003)。-项目管理咨询公司-公共医学

出版物类型