跳到内容

“上下文图马尔可夫模型”官方知识库(ICML 2018-JMLR 2020)

许可证

通知 您必须登录才能更改通知设置

diningphil/CGMM公司

存储库文件导航

上下文图马尔可夫模型(CGMM)

总结

CGMM是一种在图形中学习上下文的生成方法。它通过使用深层架构和平稳性假设,将信息扩散和局部计算结合起来。该模型在学习之前不会将图形预处理为固定结构。相反,它可以处理任何大小和形状的图形,同时保持可伸缩性。实验表明,与广泛分析整个输入结构以提取相关特征的昂贵内核方法相比,该模型运行良好。相比之下,随着体系结构的构建(增量),CGMM提取了更多抽象的特征。

我们希望,对拟议框架的利用(该框架可以向多个方向扩展)能够有助于广泛使用生成和区分方法来自适应处理结构化数据。

本次回购

该库包含数据和脚本,用于重现描述该方法的论文中报告的树/图分类实验(请查看以前的版本).

此研究软件按原样提供。如果您碰巧使用或修改此代码,请记住引用基础论文:

Bacciu Davide,Errica Federico,Micheli Alessio:通过上下文架构进行图形的概率学习。机器学习研究杂志,21(134):1−392020。

Bacciu Davide,Errica Federico,Micheli Alessio:上下文图马尔可夫模型:图形处理的深度和生成方法。第35届机器学习国际会议论文集,80:294-3032018。

2020年7月27日:JMLR接受论文!

请参阅上述参考。

2020年3月3日更新

多亏了丹尼尔·阿特泽尼我们大大提高了二元语法计算的性能。使用C=4连续的后验和矩阵运算代替了嵌套的for循环,我们已经能够在单核NCI1上获得900x(是的,900x)的加速比。太棒了,丹尼尔!

2019年11月5日更新

我们重构了整个存储库,以便于使用增量架构进行实验。新的效率改进即将到来。敬请期待!

2019年5月24日更新

我们提供了CGMM的扩展和重构版本,在Pytorch中实现。还有一些附加的实验例程可以尝试一些常见的图形分类任务。有关纸张的原始代码,请参阅“纸张版本”发布标签。

用法

本回购建立在PyDGN公司这是一个易于开发和测试新DGN的框架。看看如何构建数据集,然后在那里训练模型。

本回购假设使用了PyDGN 1.0.3。不保证与未来版本的兼容性,例如,从PyDGN 1.2.1开始,需要稍微修改自定义指标。

评估分两步进行:

  • 生成无监督图嵌入
  • 在顶部应用分类器

我们设计了两个单独的实验,以避免每次都重新计算嵌入。首先,使用配置_CGMM_嵌入.yml配置文件以创建嵌入,指定参数中存储它们的文件夹嵌入式文件夹。然后,使用config_CGMM_分类器.yml要启动的配置文件分类实验。

发布实验:

构建数据集和数据拆分(遵循PyDGN教程)

您可以使用我们为图形分类任务提供的数据分割,这些数据来自我们的ICLR 2020关于再现性的论文。

例如:

pydgn-dataset--配置文件DATA_CONFIGS/config_PROTEINS.yml

训练模型

pydgn-train--配置文件MODEL_CONFIGS/config_CGMM_Embedding.ymlpydgn-train--配置文件MODEL_CONFIGS/config_CGMM_Classifier.yml

关于

“上下文图马尔可夫模型”官方知识库(ICML 2018-JMLR 2020)

话题

资源

许可证

星星

观察者

叉子

包装

未发布包

语言文字