每个文件必须采用UTF-8编码。
注释文件中的每一行都包含一个JSON对象特定文章的注释:
{“src”:“MED”,“id”:“27105176”,“provider”:“europepmc”,“anns”:[{“position”:“1.2”,“prefix”:“要评估的非侵袭性标记”,“exact”:”肝纤维化“,“section”:“Title”,”postfix“:“.”,“tags”:[}“name”:“肝纤维化”,“uri”:http://linkedlifedata.com/resource/umls-concept/C0239946“}]},{”position“:”2.1“,”prefix“:”“,”exact“:“慢性肝病”,”section“:”Abstract“,”postfix“:”represents a major public health probleb“,”tags“:[{”name“:”Chronic liver disease“,”uri“:http://linkedlifedata.com/resource/umls-concept/C0341439“}]},{”position“:”3.2“,”prefix“:”and progression of“,”exact“:“肝纤维化”,”section“:”Abstract“,”postfix“:”with time and the r“,”tags“:[{”name“:”liver fibrosis“,”uri“:http://linkedlifedata.com/resource/umls-concept/C0239946“}]},{”位置“:”3.4“,”前缀“:”h时间和发展风险“,”确切“:”肝硬化“,”节“:”摘要“,”后缀“:”.“,”标记“:[{”名称“:”硬化“,”uri“:”http://linkedlifedata.com/resource/umls-concept/C0023890“}]},{”position“:”7.2“,”prefix“:”essing the presence and the degree of“,”exact“:“肝纤维化”,”section“:”Abstract“,”postfix“:”.“,”tags“:[{”name“:”liver fibrosis“,”uri“:http://linkedlifedata.com/resource/umls-concept/C0239946“}]},{”position“:”8.2“,”prefix“:”e方法在评估中有用“,”exact“:“肝纤维化”,”section“:”Abstract“,”postfix“:”.“,”tags“:[{”name“:”肝纤维化“,”uri“:http://linkedlifedata.com/resource/umls-concept/C0239946" } ] } ] }
平台中有两种类型的注释:基于句子的注释注释和命名实体注释。
每个对象应遵循的JSON模式信息各不相同根据注释类型。更多详细信息和数据提交前的验证准则在这里.
一篇文章基于句子的注释示例:
{“src”:“PMC”,#文章来源“id”:“PMC5844054”,#源字段上下文中项目的标识符“provider”:“Disgenet”,#提供者名称“anns”:[ {“确切”:“……SBP1缺失可能会导致……侵袭性疾病。”,#注释句“section”:“abstract”,#注释所在文章的section。“标记”:[{#标记的实体“name”:“……SBP1缺失可能导致……侵袭性疾病。”,#识别标记实体的名称“uri”:“http://purl.uniprot.org/uniprot/Q13228“#标记实体的特定URI }] },....#此处显示其他注释元素 ]}
一篇文章的命名实体注释示例:
{“src”:“MED”,#文章来源“id”:“27105176”,#源字段上下文中文章的标识符“provider”:“europepmc”,#提供者名称“anns”:[ {“位置”:“1.2”,#实体在文章中的位置“prefix”:“要评估的非侵入性标记”,#文章句子内实体的前缀“后缀”:“.”,#文章句子内实体的后缀“确切”:“肝纤维化”,注释中提及的实体号“section”:“Title”,找到注释的文章的#节。“标记”:[{#标记的实体“name”:“肝纤维化”,#识别标记实体的名称“uri”:“http://linkedlifedata.com/resource/umls-concept/C0239946“#标记实体的特定URI }] },....#此处显示其他注释元素] }
以下是带有相关解释的字段列表:
姓名 | 含义 | 笔记 |
---|
型钢混凝土 | 文章来源 | 必填字段。它必须是以下值之一:- 基础教学法硕士:PubMed MEDLINE摘要
- 项目管理咨询公司:PubMedCentral全文文章
- 拍打:专利
- AGR公司:阿格里科拉(USDA/NAL)
- 中国男子篮球职业联赛:中国生物文摘
- HIR公司:NHS证据(英国HIR)
- CTX公司:CiteXlore提交
- 以太币:EThOS论文(BL)
- CIT公司:CiteSeer(PSU)
|
身份证件 | src字段上下文中项目的标识符假如 | 必填字段 |
供应商 | 提供者的名称 | 必填字段。它必须与指定的识别名称匹配在订阅阶段发送给提供商 |
人工神经网络 | 注释列表 | 必填字段 |
anns.位置 | 注释的位置 | 仅命名实体注释的必填字段。我们需要物品中被开采实体的相对顺序。这个信息用于帮助定位和突出挖掘文本中的实体。例如,“1.3”表示该实体在文章第一句的第三段 |
anns.前缀 | 出现在标记实体之前的句子部分 | 仅与命名实体识别注释相关。对于每个注释在前缀和后缀之间至少有一个字段必须指定 |
anns.postfix | 出现在标记实体后面的句子部分 | 仅与命名实体识别注释相关。对于每个注释在前缀和后缀之间至少有一个字段必须指定 |
anns.exact公司 | 标记实体的文本 | 必填字段 |
anns.截面 | 标记实体所在文章部分的名称出现 | 可选字段。对于与全文文章(src=PMC)可能的值列表为:- 标题
- 摘要
- 介绍
- 方法
- 结果
- 讨论
- 致谢
- 工具书类
- 表
- 图
- 案例研究
- 补充材料
- 结论
- 缩写
- 竞争性利益
- 文章(如果注释不能映射到任何其他部分)
对于任何其他文章来源,可能的值为: |
anns.tags标签 | 此注释标记的实体列表 | 必填字段。此列表应至少包含一个标记 |
anns.tags.名称 | 标记实体的名称 | 必填字段 |
anns.tags.uri网站 | 实体链接到的ID或登录号的URI(例如:UniPort:http://purl.uniprot.org/uniprot/[Acs_number])。 | 必填字段 |