跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

HTTP服务器

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并且被安全地传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2006年3月20日;7补充1(补充1):S7。
doi:10.1186/1471-2105-7-S1-S7。

ARACNE:哺乳动物细胞环境中基因调控网络的重建算法

附属公司

ARACNE:哺乳动物细胞环境中基因调控网络的重建算法

亚当·马戈林等。 BMC生物信息学. .

摘要

背景:阐明基因调控网络对于理解正常细胞生理学和复杂病理表型至关重要。这种网络的全基因组“逆向工程”的现有计算方法仅在具有简单基因组的低等真核生物中获得成功。在这里,我们介绍了ARACNE,这是一种使用微阵列表达谱的新算法,专门设计用于扩展到哺乳动物细胞中调节网络的复杂性,但其通用性足以解决更广泛的网络反褶积问题。该方法使用信息论方法来消除由共表达方法推断的大多数间接相互作用。

结果:我们证明,如果回路在网络拓扑中的影响可以忽略不计,ARACNE可以精确地(渐进地)重建网络,并且我们表明,该算法在实际中运行良好,即使存在大量回路和复杂拓扑。我们评估了ARACNE利用真实合成数据集和人类B细胞微阵列数据集重建转录调控网络的能力。在合成数据集上,ARACNE实现了非常低的错误率,并优于相关网络和贝叶斯网络等既定方法。应用于人类B细胞遗传网络的反褶积表明,ARACNE能够推断cMYC原癌基因的有效转录靶点。我们还研究了互信息错误估计对网络重建的影响,并表明基于互信息排序的算法对估计错误具有更强的弹性。

结论:ARACNE有望识别哺乳动物细胞网络中的直接转录相互作用,这一问题对现有的逆向工程算法提出了挑战。这种方法应该能够增强我们使用微阵列数据来阐明细胞过程的功能机制以及识别哺乳动物细胞网络中药理化合物的分子靶点的能力。

PubMed免责声明

数字

图1
图1
高斯核宽度变化时的MI和MI秩估计误差将估计二元正态密度互信息的平均绝对百分比误差与随机抽样对的相对互信息值排序的误差百分比进行比较,其中真实MI值较低的分布在较高值分布的70%至99%之间。MI估计误差(蓝色虚线)对估计器使用的高斯核宽度的选择非常敏感,并且在非最佳参数选择时迅速增长。然而,由于MI值接近的分布存在类似的偏差,MI对的排序误差(实线-红线)对该参数的选择不太敏感。这些平均值是使用1000个具有随机均匀分布相关系数的双变量正态密度样本得出的ρ∊[0.1,0.9],这样¯=12日志(1ρ2)数学类型@MTEF@5@5@+=feaafart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY=wiFfYdH8Gipec8Eeeu0xXdbba9frFj0=OqFfea0dXdd9vqai=hGuQ8kuc9pgc9s8qaq=dirpe0xb9qiLsFr0=vr0=vir0dc8meaabaciGacaGaaeqabacaqababaqabaqabeGadaakaacuWGj bqsgaqeaiabg2da9iabgkHiTmaaliaabaGaeGymaedabaGaeGOmaidaaiGbcYgaSjabc公司+gaVjabc埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及埃及@这导致MI值的分布与实际微阵列数据的分布非常相似。
图2
图2
数据处理不等式示例.(a)1,2,、和4以线性链式关系连接。尽管所有六个基因对可能都丰富了相互信息,但DPI将推断出最可能的信息流路径。例如,1将被淘汰,因为(1,2)>(1,)和(2,) >(1,).24将被淘汰,因为(2,) >(2,4)和(,4) >(2,4).14将以两种方式消除:第一,因为(1,2) >(1,4)和(2,4) >(1,4),然后因为(1,) >(1,4)和(,4) >(1,4).(b)如果底层交互形成树(MI可以无误地测量),ARACNE将通过删除所有虚假候选交互(蓝色虚线)并保留所有真实交互(黑色实线)来准确重建网络。
图3
图3
Mendes提出的100个基因调控网络的拓扑蓝色/红色边缘对应激活/抑制。对于Erdös-Rényi拓扑(a)每个基因都有可能与其他基因连接,而无标度拓扑(b)其特点是具有许多连接的大型交互中心。
图4
图4
门德斯网络生成的1000个样本的精确度与召回率.(a)Erdös-Rényi网络拓扑。(b)无标度拓扑。ARACNE的PRC始终优于其他算法,在保持高召回率的同时,精确度达到~100%。ARACNE和RN的PRC上对应的点第页0= 10-4(4950个潜在交互作用的值yieding<0.5的预期误报)用箭头表示。
图5
图5
无标度拓扑中基因间不同长度最短路径的互信息分布在这里,我们绘制了一个经验概率的对数,即给定基因间分离的MI高于水平轴上标记的某个值(以nats为单位)。较高的MI值对于更接近的基因来说更可能发生。统计显著性阈值为10-4对于背景MI分布,对应于0=0.0175 nats,标记在图表上。如图所示,该阈值保留了大量的间接候选交互,并且没有能够区分间接交互和直接交互的阈值;消除大多数前者(红色箭头)的阈值也会消除大多数后者。这会严重降低RN的性能。(插图)具有3个或更多中间体的934个基因对MI分布的扩大对数视图,以及蒙特卡罗计算的背景分布。这些曲线几乎无法区分,表明背景分布可用于获得可靠的统计显著性阈值估计值,以筛选具有较高连接性的基因。类似的结果也适用于Erdös-Rényi拓扑(参见附加文件3:MI分布,了解Erdö的-Rénii拓扑的不同最短路径长度)。
图6
图6
高斯核宽度变化时的综合网络重构误差。推断错误的总数(N个FP公司+N个FN公司)在重建门德斯网络时,相对于估计器核宽度的选择而言,它是稳定的,从而验证了以下观察结果,即相对于该参数的变化,MI的排名比MI估计更稳定(图1)。为每个样本数选择核宽度,以最小化双变量高斯密度(用菱形表示)的平均绝对MI估计误差,从而对所有样本大小的网络进行最优或接近最优的重建。统计显著性阈值为10时计算结果-4对于无标度网络拓扑。

类似文章

引用人

  • 从时间序列转录组数据推断人类调节性T细胞中FOXP3的上游调节基因。
    Magni S、Sawlekar R、Capelle CM、Tslaf V、Baron A、Zeng N、Mombaerts L、Yue Z、Yuan Y、Hefeng FQ、Gonçalves J。 Magni S等人。 NPJ系统生物应用。2024年5月29日;10(1):59. doi:10.1038/s41540-024-00387-9。 NPJ系统生物应用。2024 PMID:38811598 免费PMC文章。
  • 大代数问题离散熵估计的比较分析。
    Pinchas A、Ben-Gal I、Painsky A。 Pinchas A等人。 熵(巴塞尔)。2024年4月28日;26(5):369. doi:10.3390/e26050369。 熵(巴塞尔)。2024 PMID:38785618 免费PMC文章。
  • N-MYC损害高级浆液性卵巢癌的固有免疫信号。
    Miranda A、Pattnaik S、Hamilton PT、Fuss MA、Kalaria S、Laumont CM、Smazynski J、Mesa M、Banville A、Jiang X、Jenkins R、Cañadas I、Nelson BH。 米兰达A等人。 科学版,2024年5月17日;10(20):eadj5428。doi:10.1126/sciadv.adj5428。Epub 2024年5月15日。 科学进展2024。 PMID:38748789 免费PMC文章。
  • Wnt依赖性主调节器NKX1-2控制小鼠植入前发育。
    Nakagawa S、Carnevali D、Tan X、Alvarez MJ、Parfitt DE、Di Vicino U、Arumugam K、Shin W、Aranda S、Normanno D、Sebastian Perez R、CannatáC、Cortes P、Neguembor MV、Shen MM、Califano A、Cosma MP。 Nakagawa S等人。 干细胞报告。2024年5月14日;19(5):689-709. doi:10.1016/j.stemcr.2024.04.004。Epub 2024年5月2日。 干细胞报告。2024 PMID:38701778 免费PMC文章。
  • S100a9可能是慢性鼻-鼻窦炎伴鼻息肉患者Toll样受体4转导途径的调节剂。
    Khayer N、Jalessi M、Farhadi M、Azad Z。 Khayer N等人。 科学报告,2024年4月27日;14(1):9722. doi:10.1038/s41598-024-60205-4。 科学报告2024。 PMID:38678138 免费PMC文章。

参考文献

    1. Eisen MB、Spellman PT、Brown PO、Botstein D.全基因组表达模式的聚类分析和显示。美国国家科学院院刊1998;95:14863–14868. doi:10.1073/pnas.95.25.14863。-内政部-项目管理咨询公司-公共医学
    1. 马S-K。统计力学。新加坡:世界科学;1985
    1. van Someren EP、Wessels LF、Backer E、Reinders MJ。遗传网络建模。药物基因组学。2002;3:507–525. doi:10.1517/14622416.3.4.507。-内政部-公共医学
    1. Friedman N.使用概率图形模型推断蜂窝网络。科学。2004;303:799–805. doi:10.1126/science.1094068。-内政部-公共医学
    1. Ideker T、Thorsson V、Ranish JA、Christmas R、Buhler J、Eng JK、Bumgarner R、Goodlett DR、Aebersold R、Hood L.系统扰动代谢网络的综合基因组和蛋白质组分析。科学。2001;292:929–934. doi:10.1126/science.292.5518.929。-内政部-公共医学

出版物类型