跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
2003年7月8日;100(14):8348-53.
doi:10.1073/pnas.0832373100。 Epub 2003年6月25日。

用于组合异质数据源进行基因功能预测的贝叶斯框架(在酿酒酵母中)

附属公司

用于组合异质数据源进行基因功能预测的贝叶斯框架(在酿酒酵母中)

奥尔加·G·特罗扬斯卡娅等。 美国国家科学院程序

摘要

基因组测序不再是新鲜事,但基因功能注释仍是现代生物学中的一个关键挑战。有多种功能基因组学实验技术可用,从亲和沉淀等经典方法到基因表达微阵列等先进的高通量技术。未来,将开发更多不同的方法,进一步增加对这些研究产生的数据进行综合计算分析的需求。我们使用MAGIC(通过集群集成实现基因的多源关联)解决了这个问题,这是一个通用框架,它使用正式的贝叶斯推理来集成异构类型的高通量生物数据(例如大规模双杂交屏幕和多个微阵列分析),以实现准确的基因功能预测。该系统正式纳入了有关数据源相对准确性的专家知识,以将其结合在一个规范性框架内。MAGIC通过其输出提供了一个信念级别,允许用户改变预测的严格程度。我们将MAGIC应用于酿酒酵母的遗传和物理相互作用、微阵列和转录因子结合位点数据,并使用酿酒酵母基因组数据库产生的基因本体论注释评估基因分组的生物学相关性。我们发现,通过基于异质数据类型创建功能分组,MAGIC与单独的微阵列分析相比,提高了分组的准确性。我们描述了几个已确定的生物基因组。

PubMed免责声明

数字

图1。
图1。
通用架构魔术贝叶斯网络。一个单独的通过初始化底层,为每对基因实例化网络有证据的节点。每个连接的条件概率表为由酵母遗传学专家正式评估。网络包含离散的节点,并使用聚类算法进行信念更新参考文献中提出。这个表达式聚类方法的输出组合通过单个“Coexpression”节点,它允许所有表达式基于每个数据集组合一个数据集的分析方法输出方法的特性,例如对数据中的噪声级的鲁棒性或特定数据类型(例如时间数据)的最佳性。的输入节点基于表达的聚类方法(K-means聚类、自组织映射、,和层次聚类)将成对数据分为三部分类别:高、中、低置信度,基于Pearson相关性簇质心(请参阅支持信息)。基于非表达式的数据通过二进制输入节点合并以用于共同定位数据,实验鉴定的转录因子结合位点,以及各种两种蛋白质物理或遗传关联的实验证据。遗传和物理关系数据分为实验数据根据GRID数据库的证据类型(http://biodata.mshri.on.ca/grid/servlet/HelpHtmlPages?pageID=3;有关详细信息,请参阅支持信息)。
图2。
图2。
每种方法的TP和FP对数量之间的权衡。(A类)魔术在广泛的范围内增加TP对的比例与基于表达的聚类方法相比具有高特异性区域,魔术基于纯微阵列数据(魔术-微阵列仅)或完全基于非表达数据(魔术-仅限非表达)。(B类)最高精度区域的比较(<1000 TP对)。魔术预测的TP对比其输入方法更多每个FP数。
图3。
图3。
蛋白质生物合成组由魔术,代表使用GO术语查找器(http://genome-www4.stanford.edu/cgi-bin/SGD/GO/goTermFinder网站).每个GO术语的颜色与其关联P(P)值,代表GO术语分配给群集(请参见http://genome-www.stanford.edu/Saccharomyces/help/goTermFinder.html).仅显示了与蛋白质生物合成相关的已知基因。集群包含49个蛋白质生物合成注释基因和10个未知基因。还包括9个未直接注释为蛋白质生物合成的基因,但参与潜在相关过程:三个与核糖体有关的基因生物发生和组装(RRB1、SIK1和CBF5),两个转录相关基因(RPA49和RPC40),两个与芽殖和产孢有关的基因(BUD28和LSG1)和PRS1,一种参与组氨酸的核糖磷酸焦磷酸激酶生物合成。
图4。
图4。
泛素依赖性蛋白分解代谢簇的GO项表示查找程序(http://genome-www4.stanford.edu/cgi-bin/SGD/GO/goTermFinder网站).该簇包含12个基因。在用于在这项研究中,九种蛋白质被注释为泛素依赖性蛋白质分解代谢,其中一个(RAD23)被注释为“核苷酸切除修复”,YNL311C和YGL004C没有已知的生物过程分配。魔术预测YNL311C和YGL004C可能参与泛素依赖性蛋白质分解代谢。注释的最新版本(2003年2月)YNL311C注释到此流程。另一个未知ORF YGL004C注释为生物过程未知(未显示),但已指定酵母菌属基因组数据库保留名称RPN14。这个例子说明了魔术作为辅助基因功能的工具注释。

类似文章

引用人

工具书类

    1. Larsson,P.O.&Mosbach,K.(1979)FEBS Lett。98 333-338.-公共医学
    1. Fields,S.&Song,O.(1989)《自然》340 245-246。-公共医学
    1. Novick,P.、Osmond,B.C.和Botstein,D.(1989)《遗传学》121 659-674。-项目管理咨询公司-公共医学
    1. Bender,A.和Pringle,J.R.(1991)分子细胞。生物学11 1295-1305。-项目管理咨询公司-公共医学
    1. Schena,M.、Shalon,D.、Davis,R.W.和Brown,P.O.(1995)《科学》270 467-470。-公共医学

出版物类型

LinkOut-更多资源