基于GMM的肿瘤药物生成和敏感性预测生成性推荐系统
Krzysztof Koras、Marcin Moíejko、Paulina Szymczak、Adam Izdebski、Eike Staub、Ewa Szczurek
计算生物学会议第17届机器学习会议记录,PMLR 200:61-732022年。
摘要
最近出现的高通量药物筛选分析激发了机器学习方法的深入发展,包括预测癌细胞株对抗癌药物敏感性的模型,以及生成潜在候选药物的方法。然而,生成具有特定性质的化合物并同时模拟其对癌细胞系的疗效的概念尚未得到全面探索。为了满足这一需求,我们提出了VADEERS,一种基于可变自动编码器的药物疗效评估推荐系统。化合物的生成是由一种新型的变分自动编码器执行的,它具有半监督高斯混合模型(GMM)先验知识。先前定义了潜在空间中的聚集,其中聚集与特定药物属性相关。此外,VADEERS还配备了细胞系自动编码器和敏感性预测网络。该模型结合了抗癌药物的SMILES字符串表示数据、它们对一组蛋白激酶的抑制情况、细胞系{'}的生物学特征以及细胞系对药物敏感性的测量。VADEERS的评估变体在真实和预测的药物敏感性估计之间实现了高r=0.87的Pearson相关性。我们表明,学习到的潜在表征和新生成的数据点准确地反映了给定的聚类。总之,VADEERS提供了药物{'}和细胞系{'}-特性及其之间关系的综合模型,以及新化合物的引导生成。
引用本文
相关材料