基于GMM的肿瘤药物生成和敏感性预测生成性推荐系统

Krzysztof Koras、Marcin Moíejko、Paulina Szymczak、Adam Izdebski、Eike Staub、Ewa Szczurek
计算生物学会议第17届机器学习会议记录,PMLR 200:61-732022年。

摘要

最近出现的高通量药物筛选分析激发了机器学习方法的深入发展,包括预测癌细胞株对抗癌药物敏感性的模型,以及生成潜在候选药物的方法。然而,生成具有特定性质的化合物并同时模拟其对癌细胞系的疗效的概念尚未得到全面探索。为了满足这一需求,我们提出了VADEERS,一种基于可变自动编码器的药物疗效评估推荐系统。化合物的生成是由一种新型的变分自动编码器执行的,它具有半监督高斯混合模型(GMM)先验知识。先前定义了潜在空间中的聚集,其中聚集与特定药物属性相关。此外,VADEERS还配备了细胞系自动编码器和敏感性预测网络。该模型结合了抗癌药物的SMILES字符串表示数据、它们对一组蛋白激酶的抑制情况、细胞系{'}的生物学特征以及细胞系对药物敏感性的测量。VADEERS的评估变体在真实和预测的药物敏感性估计之间实现了高r=0.87的Pearson相关性。我们表明,学习到的潜在表征和新生成的数据点准确地反映了给定的聚类。总之,VADEERS提供了药物{'}和细胞系{'}-特性及其之间关系的综合模型,以及新化合物的引导生成。

引用本文


BibTeX公司
@会议记录{pmlr-v200-koras22a,title={一个生成性推荐系统,其中GMM优先用于肿瘤药物生成和敏感性预测},author={Koras、Krzysztof和Mo\v{z} ejko公司、马钦和斯兹姆扎克、波琳娜和伊兹代布斯基、亚当和斯塔布、艾克和斯兹库雷克、埃瓦}、,booktitle={第17届计算生物学机器学习会议论文集},页数={61--73},年份={2022},editor={Knowles、David A和Mostafavi、Sara和Lee、Su-In},体积={200},series={机器学习研究论文集},月={11月21日--22日},publisher={PMLR},pdf={https://proceedings.mlr.press/v200/koras22a/koras22a.pdf},url={https://proceedings.mlr.press/v200/koras22a.html},摘要={最近出现的高通量药物筛选方法激发了机器学习方法的深入发展,包括预测癌细胞系对抗癌药物敏感性的模型,以及产生潜在候选药物的方法对其抗癌细胞系疗效的同步建模尚未得到全面探索。为了满足这一需求,我们提出了VADEERS,一种基于可变自动编码器的药物疗效评估推荐系统。化合物的生成是由一种新型的变分自动编码器执行的,它具有半监督高斯混合模型(GMM)先验知识。先前定义了潜在空间中的聚集,其中聚集与特定药物属性相关。此外,VADEERS还配备了细胞系自动编码器和敏感性预测网络。该模型结合了抗癌药物的SMILES字符串表示数据、它们对一组蛋白激酶的抑制情况、细胞系{'}的生物学特征以及细胞系对药物敏感性的测量。VADEERS的评估变体在真实和预测的药物敏感性估计值之间实现了高r=0.87皮尔逊相关性。我们表明,学习到的潜在表征和新生成的数据点准确地反映了给定的聚类。总之,VADEERS提供了药物{'}和细胞系{'}.属性和它们之间的关系的综合模型,以及新化合物的引导生成。}}
尾注
%0会议论文%基于GMM的肿瘤药物生成和敏感性预测生成性推荐系统%Krzysztof Koras先生%马金·莫日科%A Paulina Szymczak%亚当·伊兹代布斯基%艾克舞厅%A Ewa Szczurek公司%计算生物学会议第17届机器学习论文集%C机器学习研究论文集%D 2022年%E大卫·A·诺尔斯%E萨拉·穆斯塔法维%李汝仁%对于pmlr-v200-koras22a%我PMLR%第61-73页%U型https://proceedings.mlr.press/v200/koras22a.html%200伏%X最近出现的高通量药物筛选分析激发了机器学习方法的深入发展,包括预测癌细胞系对抗癌药物敏感性的模型,以及生成潜在候选药物的方法。然而,生成具有特定性质的化合物并同时模拟其对癌细胞系的疗效的概念尚未得到全面探索。为了满足这一需求,我们提出了VADEERS,一种基于可变自动编码器的药物疗效评估推荐系统。化合物的生成是由一种新型的变分自动编码器执行的,它具有半监督高斯混合模型(GMM)先验知识。先前定义了潜在空间中的聚集,其中聚集与特定药物属性相关。此外,VADEERS还配备了细胞系自动编码器和敏感性预测网络。该模型结合了抗癌药物的SMILES字符串表示数据、它们对一组蛋白激酶的抑制情况、细胞系{'}的生物学特征以及细胞系对药物敏感性的测量。VADEERS的评估变体在真实和预测的药物敏感性估计值之间实现了高r=0.87皮尔逊相关性。我们表明,学习到的潜在表征和新生成的数据点准确地反映了给定的聚类。总之,VADEERS提供了药物{'}和细胞系{'}-特性及其之间关系的综合模型,以及新化合物的引导生成。
亚太地区
Koras,K.,Moíejko,M.,Szymczak,P.,Izdebski,A.,Staub,E.&Szczurek,E.(2022年)。具有GMM的生成性推荐系统用于肿瘤药物生成和敏感性预测。计算生物学会议第17届机器学习会议记录,英寸机器学习研究进展200:61-73可从https://proceedings.mlr.press/v200/koras22a.html。

相关材料