Selecting deep neural networks that yield consistent attribution-based interpretations for genomics

Antonio Majdandzic; Chandana Rajesh; Ziqi Tang; Shushan Toneyan; Ethan L. Labelson; Rohit K. Tripathy; Peter K. Koo

选择产生一致的基于属性的基因组学解释的深层神经网络

Antonio Majdandzic、Chandana Rajesh、Ziqi Tang、Shushan Toneyan、Ethan L.Labelson、Rohit K.Tripathy、Peter K.Koo

计算生物学会议第17届机器学习会议记录，PMLR 200:131-1492022年。

摘要

深度神经网络（DNN）提高了我们以DNA一级序列作为输入并预测通过高通量功能基因组分析测量的无数分子活动的能力。事后归因分析被用来深入了解DNN所学习特征的重要性，通常揭示诸如序列基序之类的模式。然而，属性图通常包含虚假的重要性得分，不同模型的重要性得分不同，即使对于预测概括良好的DNN也是如此。因此，模型选择的标准方法依赖于搁置验证集的性能，不能保证高性能DNN能够提供可靠的解释。在这里，我们介绍了两种方法，用于量化属性图总体中重要特征的一致性；一致性反映了人类可解释属性图的一种定性特征。我们使用一致性度量作为多元模型选择框架的一部分，来识别具有高泛化性能和可解释归因分析的模型。我们用合成数据和染色质可及性数据定量地证明了该方法在各种DNN中的有效性。

引用本文

BibTeX公司

@会议记录{pmlr-v200-majdandzic22a，title={选择产生一致的基于属性的基因组学解释的深层神经网络}，author={Majdandzic、Antonio和Rajesh、Chandana和Tang、Ziqi和Toneyan、Shushan和Labelson、Ethan L和Tripathy、Rohit K和Koo、Peter K.}，booktitle={第17届计算生物学机器学习会议论文集}，页面＝{131-149}，年份={2022}，editor={Knowles、David A和Mostafavi、Sara和Lee、Su-In}，体积={200}，series={机器学习研究论文集}，月={11月21日--22日}，publisher={PMLR}，pdf={https://procedures.mlr.press/v200/majdandzic22a/majdandzic22a.pdf}，url={https://procedures.mlr.press/v200/majdandzic22a.html}，抽象={深度神经网络提高了我们以DNA一级序列作为输入的能力，并预测了通过高通量功能基因组分析测得的无数分子活动。事后归因分析被用来深入了解DNN所学习特征的重要性，通常揭示诸如序列基序之类的模式。然而，属性图通常包含虚假的重要性得分，不同模型的重要性得分不同，即使对于预测概括良好的DNN也是如此。因此，模型选择的标准方法依赖于搁置验证集的性能，不能保证高性能DNN能够提供可靠的解释。在这里，我们介绍了两种方法，用于量化属性图总体中重要特征的一致性；一致性反映了人类可解释属性图的一种定性特征。我们使用一致性度量作为多元模型选择框架的一部分，以识别具有高泛化性能和可解释属性分析的模型。我们用合成数据定量地和用染色质可及性数据定性地证明了这种方法在各种DNN中的有效性。}}

尾注

%0会议论文%T选择产生一致的基于属性的基因组学解释的深层神经网络%安东尼奥·马吉丹季奇%一个Chandana Rajesh%A紫气汤%A蜀山童话%伊桑·L·拉布森%A Rohit K.三病%彼得·库奥%计算生物学会议第17届机器学习论文集%C机器学习研究论文集%D 2022年%E大卫·A·诺尔斯%E萨拉·穆斯塔法维%李汝仁%F pmlr-v200-majdandzic22a型%我PMLR%第131-149页%U型https://proceedings.mlr.press/v200/majdandzic22a.html%200伏%X深度神经网络（DNN）提高了我们将DNA一级序列作为输入并预测通过高通量功能基因组分析测量的无数分子活动的能力。事后归因分析被用来深入了解DNN所学习特征的重要性，通常揭示诸如序列基序之类的模式。然而，属性图通常包含虚假的重要性得分，不同模型的重要性得分不同，即使对于预测概括良好的DNN也是如此。因此，模型选择的标准方法依赖于搁置验证集的性能，不能保证高性能DNN能够提供可靠的解释。在这里，我们介绍了两种方法，用于量化属性图总体中重要特征的一致性；一致性反映了人类可解释归因图的一种定性性质。我们使用一致性度量作为多元模型选择框架的一部分，以识别具有高泛化性能和可解释属性分析的模型。我们用合成数据和染色质可及性数据定量地证明了该方法在各种DNN中的有效性。

亚太地区

Majdandzic，A.，Rajesh，C.，Tang，Z.，Toneyan，S.，Labelson，E.L.，Tripathy，R.K.&Koo，P.K.（2022）。选择能够为基因组学产生一致的基于归因的解释的深度神经网络。计算生物学会议第17届机器学习会议记录，英寸机器学习研究进展200:131-149网址：https://proceedings.mlr.press/v200/majdandzic22a.html。

选择产生一致的基于属性的基因组学解释的深层神经网络

摘要

引用本文

相关材料