回复:SKOS质量检查员

>也许了解他们最快的方法就是这份联合论文?>奥斯马·索米宁(Osma Suominen)和克里斯蒂安·马德(Christian Mader):评估和改进SKOS词汇的质量。《数据语义杂志》,2013年。>http://www.seco.tkk.fi/publications/2013/suominen-mader-skosquality.pdf这张纸真的很漂亮!我已经详细阅读了它,下面是从AAT的角度对一些验证标准的一些评论**4.2.1遗漏或无效的语言标签好的,但请确保在解析标记时没有太多限制。例如,我们使用qqq-002“非洲地区的私有语言”,表示盖蒂所称的“非洲语言”我们还在不同的位置使用私有子标记,例如。洛杉矶vsla-x-结石vsla-x-中世纪zh-Latn-拼音vszh-Latn-pinyin-x-hanyu与zh-Latn-pinyin-x-notone公司**4.2.2语言覆盖不完整这可能与Eurovoc(一种相对较小的词汇,旨在以多种语言统一/全面覆盖)有关。但它与AAT无关,AAT具有:三种核心语言(英语、西班牙语、荷兰语)1种正在开发的核心语言(中文)超过100种语言(从非洲语到祖鲁语)提供了一些方言/借词,从未打算全面覆盖。拉莫也是如此,我想任何大型图书馆或文化遗产歌词都可以。因此,最好添加一个选项“核心语言”,并只针对它们检查覆盖率。只取langtag的第一部分(sparql的langMatches()),因为在AAT中,汉语包含不同的转录:zh-Hant公司zh-Latn-wadegile公司zh-Latn-pinyin-x-hanyu公司zh-Latn-pinyin-x-notone公司**4.2.4重叠标签该标准存在两个问题:a.AAT系统地包括复数名词作为prefLabel,单数名词作为altLabel。例如,的@en标签http://getty.notext.com/resource/aat/300198841包括:prefLabel=节奏,altLabel=韵律,altLabel=韵律您的默认相似性匹配(我猜Levenstein距离为1)将标记这些b.一个概念的prefLabel和另一个概念中的altLabel是相同的,这是非常合理的。查询选择?我?x?个?y{?x skos:prefLabel?l.?y skos:altLabel?l}http://getty.ontotext.com/sparql找到866对这样的组合。例如300055155 prefLabel=敬畏(积极的情绪、情绪……相关概念方面)vs 300387898 altLabel=awe(阿瓦提语)请注意,AAT通常在括号中包含一个(限定符),以确保prefLabels是唯一的,例如:300111178英语(文化或风格)vs300388277英语(语言)**4.3.1孤立概念AAT深度为8-9层。然而,topConcepts数量惊人:37058个中有4291个,占11.5%;他们中的许多人可能没有sko:概念儿童。例如,300054031“绘图(金属加工)”是一个顶级概念,尽管它嵌套了8层:<金属成形工艺和技术>、<金属加工工艺和技术]、<金属制造和金属加工工艺与技术>、>材料的工艺和技术,<特定类型的工艺和工艺>、>工艺和技术、过程和技术、活动方面但所有这些级别都不是skos:概念。例如300388277英语(语言)http://getty.notext.com/resource/aat/300388277嵌套深度为5层:<按特定类型划分的语言和书写系统>、<语言和写作系统>、语言相关概念、相关概念、关联概念方面但它没有孩子,也没有skos:概念父母。此外,AAT有70个关联关系。但它们都没有映射到skos:related,因为有些连接非Concepts,而skos:realated只能连接概念。因此,此标准应考虑skos:Collection父级(即skos:member^)**4.3.2断开连接的概念集群同样,对于这个标准,您应该考虑更深层次的skos:Collection结构。盖蒂甚至在一些收藏上有概念(称为指南术语)。在这种情况下,链接是:skos:Collection->skos:member->skos:Concept->iso:subscribeeArray->skos:Collection,iso:ThesaurusArray(您可以在该邮件列表中的其他帖子中找到插图)因此:在构建结构时,除了skos:slighter之外,您还应该考虑iso:subserveArray和skos:member。致以最诚挚的问候!--Vladimir Alexiev,博士,PMP领导、数据和本体管理小组Ontotext公司,www.Ontotext.comSirma Group Holding,www.Sirma.com电子邮件:vladimir.alexiev@ontotext.com,skype:valexiev1手机:+359 888 568 132,短信:359888568132@sms.mtel.net电话:+359(988)106 084,传真:+359日历:https://www.google.com/calendar/embed?src=vladimir%40sirma.bg

接收日期:2014年1月20日星期一16:53:15 UTC