多语言语义维基

标题多语言语义维基
出版物类型可交付成果
作者富克斯,东北,肯塔基州卡尔朱兰德,T·库恩
加入号码112
出版年份2013
编号D 11.2
发布日期01/2013
出版物语言英语
摘要

本报告描述了我们扩展现有语义wiki引擎AceWiki的工作,该引擎基于在受控自然语言(CNL)ACE上-具有多语言功能。在我们的方法中底层的多语言CNL语法是在语法框架(GF)中实现的。语法促进语法定义的不同自然语言之间的精确自动翻译,使wiki内容多语言。底层语法本身集成到wiki中,可以进行协作编辑。我们讨论了系统的当前实现及其用例。

关键词王牌,Ace维基,尝试控制英语,受控自然语言,GF公司,多语言语法,语义维基,第11页
笔记

可交付成果中描述的AceWiki-GF版本由此Git提交ID标识:https://github.com/AceWiki/AceWiki/commit/ebee4156f6b098d389399717e893b4。。。

附件大小
d11_2.pdf格式347.72 KB
d11_2_v1_1.pdf410.98 KB

评论

芬兰语

我检查了带有多语言ACE(AceWiki子集,小测试词汇表)的wiki的芬兰语翻译。

这个动词的寻址方式是什么应该是吗?如果我们有一个person对象,把它作为间接对象是有意义的。“约翰问玛丽(关于某事)”,所以在芬兰语中,玛丽的论点应该是“约翰·凯西·玛丽亚(约塔金)”。

我还注意到“约翰在胡卢·玛丽·托多上”是“约翰为玛丽疯狂”的翻译。在芬兰语中,结构是“John on hulluna Maryyn”,“Mary In illative case”和“mad In essive”。

在语法中,我看到了以下几行:

--同位语中的变量总是单数主格--托多:芬兰语正确吗?操作mkApposStr:M.Noun->Str=\v->v.s!NCase Sg Nom;

所以这是为了像“(有一个)女人X(谁是这样的……)”这样的事情,对吗?在这些中,您是正确的,变量X没有发生变化。所以“奈恩X劳拉”,但“奈塞拉X对科拉”。(虽然如果我们使用“总统尼尼斯特”这样的短语,那么它是“总统尼尼斯特奥隆科伊拉”,而不是“总统尼诺科伊拉“。但我想如果你添加这样的行为,它无论如何不会使用与变量X和Y相同的操作。)

@伊纳里

谢谢!我已更新了wiki,请参阅:http://attempto.ifi.uzh.ch/acewiki-gf/tmp/gfse.272882728/AceWikiTest_201。。。

关于“ask”,它在ACE中是一个及物动词(或者实际上在AceWiki子集中),所以我们不能真正有间接宾语。我知道这个句子在英语中听起来也不太对。

我对疯狂对决问题进行了初步修复,请参阅:https://github.com/Attempto/ACE-in-GF/commit/c6a2d3cf11777305188231dad4。。。

关于同位语中的变量和专有名词,它们在芬兰语和爱沙尼亚语中的表现似乎是一样的。ACE没有同位的专有名称(尽管它以前用于记录时间),所以我们不需要担心它。

我们目前的重点是地理领域词汇和英语/德语/西班牙语。这样可以避免一些潜在的问题(例如带有“ask”的奇怪句子)。

卡雷尔

现在是正确的!:)

现在是正确的!:)

数字中的一些错误

一个快速错误报告:在Numerals中,左侧的语言栏显示Quechua,但实际上是巴斯克语;尼日尔-科尔多凡语实际上是一些斯拉夫语。

此外,一些语言代码多次出现。

@伊纳里

谢谢!这是一个已知的错误。我们试图根据语法模块的名称猜测语言的名称,除非在语法中使用language标志指定了语言环境。在这种情况下,它失败了,因为数字语法模块不遵循GF命名约定“GrammarLan”。

卡雷尔