比较SKOS术语的版本

比方说,当一个新版本的同义词库发布时,用户会对“新增内容”和“发生了什么变化?”感兴趣。我现在正在绞尽脑汁想这件事。有人解决过比较SKOS文件的两个版本这一看似简单的问题吗?还有一个显然不是那么简单的问题,那就是以一种容易理解的方式格式化输出?当涉及到diff RDF文件时,中列出了一些解决方案http://www.w3.org/2001/sw/wiki/How_to_diff_RDF。我发现最简单的方法是使用rdf.sh(https://github.com/seebi/rdf.sh),它只是对rapper生成的.nt文件进行system-diffs排序。(你需要在这里过滤掉空白节点,但这对SKOS文件来说应该不是什么大问题。)使用git diff作为diff工具,这给了我一个类似“7443个插入(+),6937个删除(-)”(关于STW经济学同义词库的两个最新版本)的统计数据。显然,这种三级差异对用户没有多大帮助。一种可能的行动方式可能是:1) 为每个概念分组更改。2) 从整体上识别概念的插入和删除(可能是最重要的更改)。3) 识别某些类型的更改(例如,更改的prefLabel、添加的altLabel、更改的关系)。4) 使用首选标签(以给定语言)丰富概念URI。5) 在RDFa概述页面上很好地排列所有内容(添加/删除概念,也许是一些更重要的更改类型,统计数据,如更改/未更改概念的数量等)6) 提供每个概念的更改记录(RDFa)页面,可以从概念页面链接。7) 或者,如果术语包括元结构(如术语分类),请将有关更改最频繁的主题领域的聚合信息添加到概述页面。思想?有人做过类似的事情吗?干杯,约阿希姆--约阿希姆·纽伯特ZBW-德国国家经济图书馆莱布尼茨经济信息中心Neuer Jungfernstieg 21号20354汉堡

接收日期:2013年8月27日星期二17:34:03 UTC