RNA干扰

RNAG:一种用于预测未对准序列RNA二级结构的新的吉布斯采样器。动机:RNA二级结构在许多RNA的功能中起着重要的作用,结构特征往往是它们与其他细胞成分相互作用的关键。因此,对RNA家族的二级结构的预测一直有相当大的兴趣。在本文中,我们提出了一种新的全局结构对齐算法RNAG,用于预测未对准序列的一致二级结构。它采用了阻塞吉布斯抽样算法,在收敛时间上具有理论优势。该算法从条件概率分布P(结构对齐)和P(对齐结构)迭代采样。毫不奇怪,在这一难题的高维空间中存在相当大的不确定性,迄今为止在这个领域中受到了有限的关注。我们展示了如何从这个算法得出的样本可以用来更充分地表征后验空间,并评估预测的不确定性。结果:我们对三个公开可用的数据集的分析表明,RNAG在现存预测方法上对RNA结构预测有实质性的改进。此外,我们对17个RNA家族的分析表明,RNAG采样结构在其集合质心周围通常是紧密的,并且至少11个家族具有至少两个分离良好的预测结构簇。一般而言,参考结构与我们预测的结构之间的距离相对于集合内的结构之间的变化是大的。可用性:RANG算法的Perl实现和重现第3.1和3.2节中描述的结果所需的数据可在HTTP:/CCMBWeb.CV.BRON.EDU/RNAG.HTML