与基于湿法的实验程序相比,由于存在大量疾病诊断、预后和治疗的替代方案,集成生物信息学和统计方法在更准确地识别潜在分子生物标记物方面发挥着至关重要的作用。乳腺癌(BC)是全球女性癌症相关死亡的主要原因之一。几项基于干实验室和湿实验室的研究已经确定了BC的不同组分子生物标记物。但无论是计算上还是实验上,他们都没有将结果进行如此多的比较。在这项研究中,试图通过综合生物信息学和统计方法,提出一套可能对BC诊断、预后和治疗更有效的分子生物标记物。首先,我们使用统计LIMMA方法在BC和对照样品之间鉴定了190个差异表达基因(DEG)。然后我们通过蛋白质相互作用(PPI)网络分析确定了13个DEG(AKR1C1、IRF9、OAS1、OAS3、SLCO2A1、NT5E、NQO1、ANGPT1、FN1、ATF6B、HPGD、BCL11A和TP53INP1)为关键基因(KG)。然后,我们通过GO术语和KEGG通路富集分析研究了DEGs突出KGs的发病过程。此外,我们通过KG与转录因子(TF)和微RNA的相互作用网络分析,揭示了KG的转录和转录后调节因子。包括多变量生存分析结果在内的监督学习和非监督学习都证实了所提出的KG的强大预测能力。最后,通过与最先进的替代品顶级独立受体蛋白的交叉验证,我们建议KGs引导的七种候选药物(NVP-BHG712、Nilotinib、GSK2126458、YM201636、TG-02、CX-5461、AP-24534)与其他已发表药物相比,在计算上更有效。因此,我们的发现可能对乳腺癌的诊断、预后和治疗起到至关重要的作用。