回复:注释:多语言标签

你好,安东尼奥,非常感谢您的评论,这让我注意到了我想在下一个(第三个)版本中改进SKOS核心指南的一个方面。以下是一些初步意见,我很想知道你的想法。。。在进行SWAD-Europe多语种叙词表的初始工作时,我们描述了两种建模模式:“多语种标记”和“语际映射”。有关这些模式的完整描述,请参阅[1](注意[1]已经过时,示例使用了SKOS Core的弃用功能,尽管该原则仍然适用)。“多语言标签”旨在支持基本场景,例如为英语和法语用户提供信息检索系统,其中英语和法语的用户共享类似的概念。为了支持这种情况,对于每个概念,每种语言的全套标签和文档都应该引导两组用户理解相同的含义(或与应用程序的目的足够相似的含义)。这是最低要求。在这种情况下,应用程序的需求可以得到满足,而不需要存储关于标签和/或文档是如何创建(或翻译)的任何信息。此外,在这种情况下,法语标签可能与英语标签的翻译不对应。例如,首选的英语标签可以是其中一个法语替代标签的翻译,首选的法语标签可以是英语替代标签之一的翻译。或者,可能只有一个英文标签,这可能是三个标签中任何一个的法语翻译。重要的是,目标社区中的用户使用的是相同的含义。为此,标签和文档应适合这些社区。我设想的多语言标注方法,专门为支持信息检索场景而设计,是这样一种方法,即翻译人员检查一个迄今为止仅用源语言标注的概念,通过检查所有标签、文档和语义关系来形成对意义的理解,然后在目标语言中为该概念创建一组适合该语言用户的标签和文档,以便两个语言社区都能理解相同(或足够相似)的含义。带有多语言标签的概念方案可能是通过逐字翻译每个标签和每个文档项创建的,但这不一定是唯一(或最佳)的方法。这些都是反对在一般情况下将标签分组为翻译组的论点,尽管没有理由不定义一个捕获此信息的自定义RDF模式,并使用一些规则将其映射到SKOS Core。我希望在不久的将来提供做这类工作的示例,因为这对于表达SKOS核心和WordNet之间的关系,以及SKOS核心与TMF(术语标记框架)模型之间的关系是必要的。有趣的是,你描述的模型与TMF方法类似,我想知道ISO TC37的人有什么要说的。关于您的第二条评论,这正是SKOS Mapping[2]想要支持的那种场景。SKOS映射是为“语际映射”场景设计的,在这种场景中,来自不同语言组的用户有着根本不同的概念。因此,为每个语言组创建不同的概念方案,只在单个语言中使用标签,并在概念方案之间表达语义映射关系。SKOS映射基于Doerr的论文“同义词表映射的语义问题”[3]中概述的方法,该论文旨在将语义映射作为信息检索结果的基础。我想在第三版W3C公共工作草案的SKOS核心指南中添加一节,简要描述“语言间映射”方法,以及它在何处有用/必要。问题是,自2004年8月SWAD-Europe完成以来,还没有进行过SKOS映射工作,SKOS映射有点混乱。原因是我们从那时起就一直关注SKOS核心,理由是我们必须找出SKOS核心才能对SKOS映射进行同样的操作。我想在ISO TC 37人员的帮助下重新访问SKOS Mapping,并期望我们最终能够对其进行广泛的修改。在此之前,《SKOS核心指南》中对SKOS映射的任何引用都必须附带健康警告,表明SKOS映射不稳定。根据当前的SKOS映射规范,注释2中的示例将表示为:<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:skos=“http://www.w3.org/2004/02/skos/core#"xmlns:map=“http://www.w3.org/2004/02/skos/map#"><skos:Concept rdf:about=“http://www.example.com/concepts/zh#1"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel><map:nrowMatch rdf:resource=“http://www.example.com/concepts/en#2"/><map:narrowMatch rdf:resource=“http://www.example.com/concepts/en#3"/><map:narrowMatch rdf:resource=“http://www.example.com/concepts/en#4"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/concepts/en#2">她<skos:prefLabel xml:lang=“en”><map:broadMatch rdf:resource=“http://www.example.com/concepts/zh#1"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/concepts/en#3"><skos:prefLabel xml:lang=“en”>他</skos:prefLabel><map:broadMatch rdf:resource=“http://www.example.com/concepts/zh#1"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/concepts/en#4"><map:broadMatch rdf:resource=“http://www.example.com/concepts/zh#1"/></skos:概念></rdf:rdf>我现在就把它留在这里,再次感谢您的评论,并告诉我您对以上内容的看法。是否应该在SKOS核心指南中添加一个部分?如果是,它应该说什么?是否应该在SKOS映射方面做更多的工作,以将其转化为适当的规范?它能满足您的应用程序的实际需求吗?如果没有,你还需要什么?谢谢,铝。[1]http://www.w3.org/2001/sw/Europe/reports/thes/8.3/[2]http://www.w3.org/2004/02/skos/mapping/[3]http://jodi.ecs.soton.ac.uk/文章/v01/i08/Doerr/-----原始邮件-----发件人:Antonio De Marinis[mailto:安东尼奥.de.marinis@eea.eu.int]发送时间:2005年10月19日10:25收件人:public-esw-thes@w3.org抄送:迈尔斯,AJ(Alistair);斯特凡·延森;瑟伦·罗格主题:评论:多语言标签你好,首先,感谢您在SKOS领域所做的出色工作。我对SKOS中使用多语言标签有一些意见和问题。评论1考虑以下“抽象示例”:<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:skos=“http://www.w3.org/2004/02/skos/core#"><skos:Concept rdf:about=“http://www.example.com/conceptions#1"><skos:prefLabel xml:lang=“en”>标签1</skos:prefLabel>标签2标签3标签4标签5标签6标签7</skos:概念></rdf:rdf>>从上述SKOS概念中,我们可以看到:*1个en、fr和it的首选标签*2个可选标签(英文)*fr中的1个替代标签*其中有1个备选标签现在我的问题是:我如何知道“标签7”是“标签2”还是“标签3”的翻译?在SKOS中,为了知道哪个标签是哪个其他标签的翻译,我们忽略了多语言标签之间的关系。也许这超出了SKOS的范围。当我们只有一个首选标签和一个备选标签以及它们的翻译时,SKOS中使用的方法很好。当我们在几种语言中有多个可供选择的标签时,事情会变得更加复杂,我们会失去翻译术语之间的语义关系。这样将译文分组不是更好吗<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:skos=http://www.w3.org/2004/02/skos/core# <http://www.w3.org/2004/02/skos/core> xmlns:dc=“http://purl.org/dc/elements/1.1/"><rdf:描述rdf:about=“http://www.example.com/concepts_labels#1">英语标签1法语标签1</rdf:说明><rdf:描述rdf:about=“http://www.example.com/concepts_labels#2">英语标签2法语标签2</rdf:说明><rdf:描述rdf:about=“http://www.example.com/concepts_labels#3">英语标签3法语标签3</rdf:说明><skos:Concept rdf:about=“http://www.example.com/conceptions#1"><skos:prefLabel rdf:resource=“http://www.example.com/concepts_labels#1"/><skos:altLabel rdf:resource=“http://www.example.com/concepts_labels#2"/><skos:altLabel rdf:resource=“http://www.example.com/concepts_labels#3"/></skos:概念></rdf:rdf>以上只是关于不同语言的标签如何组合在一起的示例。当然,它可以用其他方式编码。重要的是能够找到翻译标签之间的关系。评论2另一个问题是当几个语言中没有相同的概念时:当一个概念在一种语言中有一个标签,但在另一种语言中将其划分为几个具有多个标签的子概念时。例如,在汉语中,有一个概念将“他/她/它”作为一个标签(和符号),用拼音(语音)写成“ta”。在英语中,这个概念没有“一个标签”,“第三人或事物”的概念在英语中存在,但在英语中没有一个常用的标签。根据上下文,它用“他”、“她”和“它”三个标签表示。现在,如果我试图用一个概念在SKOS中编码这些知识,我会遇到困难:<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns网站#"xmlns:skos=“http://www.w3.org/2004/02/skos/core#"><skos:Concept rdf:about=“http://www.example.com/conceptions#1"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel>她?他?还是它</skos:prefLabel></skos:概念></rdf:rdf>在这种情况下,我应该怎么做?我应该用英语标签“她”、“他”和“它”创建三个更狭义的概念,如下所示:<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:skos=“http://www.w3.org/2004/02/skos/core#"><skos:Concept rdf:about=“http://www.example.com/conceptions#1"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel><skos:窄rdf:resource=“http://www.example.com/conceptions#2"/><skos:窄rdf:resource=“http://www.example.com/conceptions#3"/><skos:窄rdf:resource=“http://www.example.com/conceptions 4号"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/conceptions#2"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel>她<skos:prefLabel xml:lang=“en”><skos:broader rdf:resource=“http://www.example.com/conceptions#1"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/conceptions#3"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel><skos:prefLabel xml:lang=“en”>他</skos:prefLabel><skos:broader rdf:resource=“http://www.example.com/conceptions#1"/></skos:概念><skos:Concept rdf:about=“http://www.example.com/conceptions 4号"><skos:prefLabel xml:lang=“zh”>ta</skos:prefLabel><skos:prefLabel xml:lang=“en”>它</skos:prefLabel><skos:broader rdf:resource=“http://www.example.com/conceptions#1"/></skos:概念></rdf:rdf>这似乎是正确的方式,但我们在几个概念中都有相同的首选标签“ta”,根据RDF工作草案,不建议这样做:“建议在任何给定语言中,同一概念方案中的两个概念都不要被赋予相同的首选词汇标签。”这种情况下我该怎么办?有什么建议吗?顺颂商祺安东尼奥·德马林斯__________________________安东尼奥·德·马里尼斯Web开发多媒体通信欧洲环境署康根斯·尼托夫6DK-1050哥本哈根K办公桌:+45 3336 7236手机:+46 739 69 99 39Skype(聊天/IP电话):demarant网址:http://www.eea.eu.int<网址:http://www.eea.eu.int/> __________________________

接收日期:2005年10月19日星期三12:22:23 UTC