跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2006年6月6日;34(10):3150-60.
doi:10.1093/nar/gkl396。 2006年印刷。

基于剪接图的全长异构体概率重建的期望最大化算法

附属公司

基于剪接图的全长异构体概率重建的期望最大化算法

宜兴等。 核酸研究. .

摘要

从序列片段(如EST)重建全长转录亚型是前mRNA选择性剪接的生物信息学分析的主要兴趣和挑战。这个问题被描述为寻找跨剪接图的遍历,剪接图是基因结构和选择性剪接的有向无环图(DAG)表示。在本文中,我们介绍了异构体重建问题的概率公式,并为其最大似然解提供了一个期望最大化(EM)算法。使用一系列模拟数据和来自真实人类基因的表达序列,我们证明了我们的EM算法能够正确处理输入数据中的各种碎片和耦合情况。我们的工作为基于剪接图的全长异构体重建建立了一个通用的概率框架。

PubMed免责声明

数字

图1
图1
三外显子交替剪接基因的剪接图。()三外显子基因的基因结构。第二个外显子是一个盒式外显子。(b条)基因结构的剪接图表示。外显子跳过事件由从节点1到节点3的有向边表示。
图2
图2
模拟基因的概率异构体重建。左侧面板:序列观察;右侧面板:概率亚型重建结果。上图表示总体对数似然;下图显示了个体亚型在收敛之前的估计概率。A类D类表示序列观测的不同情况。
图2
图2
模拟基因的概率异构体重建。左侧面板:序列观察;右侧面板:概率亚型重建结果。上图表示总体对数似然;下图显示了个体亚型在收敛之前的估计概率。A类D类表示序列观测的不同情况。
图3
图3
仿真研究以测试EM算法的鲁棒性。X轴:模拟的序列观测总数;Y轴:真实概率和估计概率之间的总变化距离(见材料和方法)。(A类)使用四种亚型的固定概率进行模拟研究。概率如表1所示。(B类)使用四种亚型的随机概率进行的模拟研究。
图4
图4
HLA-DMB的概率异构体重建。(A类)HLA-DMB的基因结构和选择性剪接。外显子4编码TM结构域。Exon 5编码LT信号。(B类)HLA-DMB的四种假定亚型。(C类)HLA-DMB的概率亚型重建。上图表示总体对数似然;下图显示了个体亚型在收敛之前的估计概率。FL形式的估计概率最高,其次是Δ-LT、Δ-TM和Δ-TM、LT(D类)混合人体组织中HLA-DMB亚型的RT-PCR分析(有关实验的详细信息,请参阅在线补充资料的附录3)。左车道:标记;右侧车道:HLA-DMB。
图5
图5
TPM1的概率异构体重建。(A类)TPM1从第4外显子到第11外显子的基因结构。(B类)EST证据表明TPM1中存在耦合的选择性剪接事件。(C类)TPM1的概率异构体重建。上图表示总体对数似然;下图显示了个体亚型在收敛之前的估计概率。图中仅显示概率大于0.05的亚型。
图6
图6
人类22号染色体上186个基因概率亚型重建的CPU时间。X轴:推定异构体的数量。Y轴:PC上的CPU时间(AMD Athlon 1500+,320MB RAM)。

类似文章

引用人

工具书类

    1. Modrek B.,Lee C.选择性剪接的基因组观点。自然遗传学。2002;30:13–19.-公共医学
    1. Johnson J.M.、Castle J.、Garrett-Engele P.、Kan Z.、Loerch P.M.、Armour C.D.、Santos R.、Schadt E.E.、Stoughton R.、Shoemaker D.D.用外显子连接微阵列对人类选择性前mRNA剪接进行全基因组调查。科学。2003;302:2141–2144.-公共医学
    1. Lareau L.F.、Green R.E.、Bhatnagar R.S.、Brenner S.E.选择性剪接的进化作用。货币。操作。结构。《生物》2004;14:273–282.-公共医学
    1. 严重的B.R.选择性剪接:蛋白质组世界的多样性增加。趋势Genet。2001;17:100–107.-公共医学
    1. Resch A.、Xing Y.、Modrek B.、Gorlick M.、Riley R.、Lee C.评估选择性剪接对人类蛋白质组中结构域相互作用的影响。2004年蛋白质组研究杂志;3:76–83.-公共医学

出版物类型