@文章 { 贾2021综合体 , 标题 = { 知识图上复杂时间问题的求解 } , 作者 = { Jia、Zhen和Pramanik、Soumajit和Roy、Rishiraj Saha和Weikum、Gerhard } , 杂志 = { arXiv预打印arXiv:2109.08935 } , 年 = { 2021 } }
-
Python 3.8版 -
Networkx 2.5 -
Numpy 1.19.2号 -
维基百科全书1.0.5 -
Nltk 3.5版 -
变压器4.4.2 -
火炬1.8.1 -
熊猫1.1.3 -
Tqdm 4.50.2分 -
请求2.24.0 -
PyYAML第5.4.1节
python3-m venv ENV_exaqt 源ENV_exaqt/bin/activate pip安装--升级pip pip安装-r要求.txt
“Id”:问题Id “Question”:小写的问题文本 “时间信号”:重叠、之后、之前、开始、完成、顺序、无信号 “时间问题类型”:时间类别,包括显式、隐式、顺序、临时答案 “答案”:基本事实答案,包括答案类型、Wikidata Qid、Wikidata标签和Wikipedia URL “数据源”:原始数据集 “问题创建日期”:原始数据集发布日期
数据 ├── 紧凑的 ├── 列车25_25.json ├── dev_25_25.json软件 └── test_25_25.json测试 ├── 连通性 └── seedpair问题测试连接路径记分.pkl ├── 字典 ├── 文件夹 ├── 任务1 ├── 任务2 ├── ... └── 任务16181 ├── 模型 ├── 第1阶段模型.bin ├── 阶段2_型号.bin └── wikipedia2vec培训 ├── 结果 ├── temcompactgst公司 ├── 列车25_25_温度.json ├── 列车25_25_温度等级.pkl ├── dev_25_25_温度.json ├── dev_25_25_temp_rank.pkl软件 ├── test_25_25_温度.json └── 测试25_25_温度等级.pkl ├── 时间问题 ├── 第1阶段相关因素选择训练集.csv ├── 第2阶段临时实际选择训练集.csv └── 维基数据属性目录.json
./compactgst:完成每个问题的GST子图 ./connectivity:预处理的连接数据,包括每个问题的种子对的最短连接路径 ./字典:用于答案预测的关系图、字典和预处理嵌入文件 ./files:每个问题的预处理Wikidata事实和中间数据,包括种子实体、得分事实、准问题图、基石和gst图文件 ./model:预处理微调BERT模型和wikipedia2vec模型 ./result:测试数据集上的答案预测评估结果 ./temcompactgst:使用时间事实和排名时间事实文件完成GST子图 ./phase1_relevant_fact_selection_trainset.csv:微调BERT模型的训练数据,用于查找与问题相关的KG事实 ./phase2_temporal_fact_selection_trainset.csv:微调BERT模型的训练数据,用于发现时间事实的问题相关性 ./wikidata_property_dictionary.json:具有类型、标签和别名的wikidata属性
-
书呆子 获取种子实体 以从ELQ和实体链接结果中获得种子实体。 要运行程序,请查找的用法 ELQ公司 ,并下载用于运行ELQ的预处理模型、索引和实体嵌入。 获取实体标签.py 从TagMe和实体链接结果中获取种子实体。
-
答案图表 -
应用微调BERT模型作为分类器 相关_实际_选择_模型.py 为事实打分,并按问题相关性可能性的降序排序。 发动机.py 微调BERT模型。
-
计算紧致子图 获取compact_subgraph.py 计算GST并完成。 获取GST.py 是GST算法的函数集合。
-
带时间事实的扩充子图 临时_实际_选择_模型.py 对时间事实进行评分,并按问题相关性可能性的降序排序。
-
-
答案预测 获取关系图.py 创建关系图。 获取图片.py 生成字典,包括单词、实体、关系、类别、信号、时间事实等。 获取再培训嵌入.py 生成单词、实体、关系、时间事实等的预处理嵌入。 列车_eva _rgcn.py 训练R-GCN模型并对模型进行评估。 模型.py 是答案预测中的R-GCN模型类。 时间编码器.py 是位置时间编码函数。 实用程序py 是R-GCN答案预测中的常见函数集合。 数据加载程序.py 是答案预测中的数据加载函数。 脚本列表.py 是评估函数的集合。 评估.py 在测试数据集上评估模型。
-
其他项目 全球.py 生成全局配置变量。
python get_seed_entity_elq.py(注意,在构建elq环境后,程序应该在BLINK-master目录下运行) python获取种子实体标签.py
python相关的_fact_selection_model.py-d序列 python相关的_fact_selection_model.py-d开发 python相关事实选择模型.py-d测试
python get_compact_subgraph.py-d序列 python get_compact_subgraph.py-d开发 python get_compact_subgraph.py-d测试
python temporal_fact_selection_model.py-d序列 python temporal_fact_selection_model.py-d开发 python temporal_fact_selection_model.py-d测试
python get_relational_graph.py-d序列 python get_relational_graph.py-d开发 python get_relational_graph.py-d测试 python获取图片.py python get_pretrained_embedding.py python训练_eva _rgcn.py-p exaqt