选择产生一致的基于属性的基因组学解释的深层神经网络
Antonio Majdandzic、Chandana Rajesh、Ziqi Tang、Shushan Toneyan、Ethan L.Labelson、Rohit K.Tripathy、Peter K.Koo
计算生物学会议第17届机器学习会议记录,PMLR 200:131-1492022年。
摘要
深度神经网络(DNN)提高了我们以DNA一级序列作为输入并预测通过高通量功能基因组分析测量的无数分子活动的能力。事后归因分析被用来深入了解DNN所学习特征的重要性,通常揭示诸如序列基序之类的模式。然而,属性图通常包含虚假的重要性得分,不同模型的重要性得分不同,即使对于预测概括良好的DNN也是如此。因此,模型选择的标准方法依赖于搁置验证集的性能,不能保证高性能DNN能够提供可靠的解释。在这里,我们介绍了两种方法,用于量化属性图总体中重要特征的一致性;一致性反映了人类可解释属性图的一种定性特征。我们使用一致性度量作为多元模型选择框架的一部分,来识别具有高泛化性能和可解释归因分析的模型。我们用合成数据和染色质可及性数据定量地证明了该方法在各种DNN中的有效性。
引用本文
相关材料