上下文图马尔可夫模型(CGMM) 总结 CGMM是一种在图形中学习上下文的生成方法。它通过使用深层架构和平稳性假设,将信息扩散和局部计算结合起来。该模型在学习之前不会将图形预处理为固定结构。相反,它可以处理任何大小和形状的图形,同时保持可伸缩性。实验表明,与广泛分析整个输入结构以提取相关特征的昂贵内核方法相比,该模型运行良好。相比之下,随着体系结构的构建(增量),CGMM提取了更多抽象的特征。 我们希望,对拟议框架的利用(该框架可以向多个方向扩展)能够有助于广泛使用生成和区分方法来自适应处理结构化数据。 本次回购 该库包含数据和脚本,用于重现描述该方法的论文中报告的树/图分类实验(请查看以前的版本). 此研究软件按原样提供。如果您碰巧使用或修改此代码,请记住引用基础论文: Bacciu Davide,Errica Federico,Micheli Alessio:通过上下文架构进行图形的概率学习。机器学习研究杂志,21(134):1−392020。 Bacciu Davide,Errica Federico,Micheli Alessio:上下文图马尔可夫模型:图形处理的深度和生成方法。第35届机器学习国际会议论文集,80:294-3032018。 2020年7月27日:JMLR接受论文! 请参阅上述参考。 2020年3月3日更新 多亏了丹尼尔·阿特泽尼我们大大提高了二元语法计算的性能。使用C=4连续的后验和矩阵运算代替了嵌套的for循环,我们已经能够在单核NCI1上获得900x(是的,900x)的加速比。太棒了,丹尼尔! 2019年11月5日更新 我们重构了整个存储库,以便于使用增量架构进行实验。新的效率改进即将到来。敬请期待! 2019年5月24日更新 我们提供了CGMM的扩展和重构版本,在Pytorch中实现。还有一些附加的实验例程可以尝试一些常见的图形分类任务。有关纸张的原始代码,请参阅“纸张版本”发布标签。 用法 本回购建立在PyDGN公司这是一个易于开发和测试新DGN的框架。看看如何构建数据集,然后在那里训练模型。 本回购假设使用了PyDGN 1.0.3。不保证与未来版本的兼容性,例如,从PyDGN 1.2.1开始,需要稍微修改自定义指标。 评估分两步进行: 生成无监督图嵌入 在顶部应用分类器 我们设计了两个单独的实验,以避免每次都重新计算嵌入。首先,使用配置_CGMM_嵌入.yml配置文件以创建嵌入,指定参数中存储它们的文件夹嵌入式文件夹。然后,使用config_CGMM_分类器.yml要启动的配置文件分类实验。 发布实验: 构建数据集和数据拆分(遵循PyDGN教程) 您可以使用我们为图形分类任务提供的数据分割,这些数据来自我们的ICLR 2020关于再现性的论文。 例如: pydgn-dataset--配置文件DATA_CONFIGS/config_PROTEINS.yml 训练模型 pydgn-train--配置文件MODEL_CONFIGS/config_CGMM_Embedding.ymlpydgn-train--配置文件MODEL_CONFIGS/config_CGMM_Classifier.yml