GLI旨在提供更好的服务 数据集贡献器 通过最小化贡献和维护数据集的工作量。 GLI旨在创建知识库(而不是简单的 集合)的基准 富超信息 关于数据集。 请参阅 GLI meta-info页面 了解详细信息。
API对新任务的扩展性更强。 自动化测试可以按任务分开,并变得更加模块化。 它允许为每个任务实现通用数据加载方案。
git克隆 https://github.com/Graph-Learning-Benchmarks/gli.git网站 光盘 格利 pip安装-e .
注: wget公司 需要下载数据集。
python example.py--graph cora--task节点分类
>图形加载需要0.0196秒,使用0.9788 MB。 >任务加载需要0.0016秒,使用0.1218 MB。 >图形和任务组合需要0.0037秒,使用0.0116 MB。 数据集(“CORA数据集.NodeClassification”,num_graphs=1,save_path=~/.dgl/CORA数据集.NoteClassification)**
>> > 进口 格利
>> > 数据集 = 格利 . 获取gli_dataset ( 数据集 = “科拉” , 任务 = “节点分类” , 装置 = “cpu” ) >> > 数据集
数据集 ( “CORA数据集.NodeClassification” , num_graphs数 = 1 , 存储路径(_P) = / 用户 / 吉米 / . dgl公司 / CORA公司 数据集 . 节点分类 )
>> > 进口 格利
>> > 克 = 格利 . 获取gli图形 ( 数据集 = “珊瑚” , 装置 = “cpu” , 冗长的 = False(错误) ) >> > 克
图表 ( num个节点 = 2708 , 边数(_E) = 10556 , 数据架构(_S) = { “节点功能” : 方案 ( 形状 = ( 1433 ,), 数据类型 = 火炬 . 浮动32 ), “节点标签” : 方案 ( 形状 = (), 数据类型 = 火炬 . 整数64 )} edata_方案 = {}) >> > 任务 = 格利 . 获取任务 ( 数据集 = “科拉” , 任务 = “节点分类” , 冗长的 = False(错误) ) >> > 任务
< 格利 . 任务 . 节点分类任务 对象 在 0x100eff640 >
>> > 数据集 = 格利 . 组合图形和任务 ( 克 , 任务 ) >> > 数据集
数据集 ( “CORA数据集.NodeClassification” , num_graphs数 = 1 , 存储路径(_P) = / 用户 / 吉米 / . dgl公司 / CORA公司 数据集 . 节点分类 )
>> > 类型 ( 数据集 ) < 班 'gli.数据集。 节点分类数据集' >
>> > isinstance公司 ( 数据集 , dgl公司 . 数据 . DGL数据集 ) 真的
@正在进行{ma2022图形, title={图形学习索引器:一个面向贡献者且元数据丰富的图形学习基准平台}, author={马嘉琪、张行健、范和成、金煌、李天岳、李廷伟、屠一文、朱晨淑和乔竹梅}, booktitle={首次图形学习会议}, 年份={2022}, 网址={ https://openreview.net/forum?id=ZBsxA6_gp3 } }