语言类型学:Glottolog功能

乔治·莫罗兹

2024-03-13

此软件包基于Glottolog数据库,所以语言类型学具有多个访问数据的功能那个数据库。

1.命令名的语法

中的大多数功能语言类型学有同样的语法:你需要什么。你有什么。大多数都是基于语言名称.

其中一些有助于定义语言向量。

此外,还有一些将声门代码转换为ISO的功能639-3代码,反之亦然:

最重要的功能语言类型学基于功能和集合创建交互式地图的能力语言(见第三节):

Glottolog数据库(v.4.1)提供语言类型学语言名称、ISO代码、,语音代码、隶属关系、宏区域、坐标和许多信息。这组函数没有涵盖所有可能的功能功能组合。查看以下附加信息保存在中使用的Glottolog数据库版本中语言类型学:

姓名(声门记录)
##[1]“glottocode”“language”“iso”##[4]“水平”“面积”“纬度”##[7]“经度”“国家”“隶属关系”##[10]“子分类”

使用R函数进行数据操作,您可以创建自己的数据库。

2.使用基本函数

上一节介绍的所有功能都是常规的函数,因此可以将以下对象作为输入:

iso.lang系列(“西切尔克斯”)
##西切尔卡西安##“阿迪”
语言.iso(“阿迪”)
##阿迪##“西切尔克斯”
语言关闭(“阿布哈兹-戴奇”)
##[1]“Ubykh”“阿布哈兹”“Abazh”“Abaza”“West Circassian”##[5]“卡巴丹”

我想指出的是,您可以使用单引号或双引号。由于在字符串中插入单引号使用单引号创建会导致R中出现错误,我在中使用双引号我的教程。您可以使用单引号,但要小心并记住“Ma'ya”是R中不正确的字符串。

区域.lang(c(c)(“卡巴丹语”,“警告”))
##Kabardian Aduge公司##“欧亚大陆”“非洲”
<- c(c)(“卡巴丹语”,“俄语”)
aff.lang公司(兰)
##卡巴迪语##“阿布哈兹-阿戴奇,切尔克斯”##俄语##“印欧、古典印欧、巴尔托-斯拉夫、斯拉夫和东斯拉夫”
iso.lang系列(语言关闭(“阿布哈兹-戴奇”))
##乌比赫-阿布哈兹-阿巴扎-西切尔卡西亚-卡巴迪亚##“uby”“abk”“abq”“ady”“kbd”

如果您是R的新手,重要的是要提到您可以创建一个带有语言、功能和其他参数的表格以及任何电子表格软件。然后您可以将创建的文件导入到R使用标准工具。

拼写检查器:仔细查看警告!

所有接受语言向量的函数都用一个有点像拼写检查器。如果查询中的语言在数据库,函数返回包含一组与语言距离最小的候选人查询。

aff.lang公司(“卡巴丹语”)
##卡巴迪语##“阿布哈兹-阿戴奇,切尔克斯”

4子语言()功能

这个副语言()函数返回语言Newick树格式的子类化。

子.lang(“莱奇蒂克”)
##Lechitic公司##“((Kashubian_Proper:1,斯洛文尼亚语:1)kash1274:1,波拉比语:1,((Great_Poland:1,Little_Poland:1,Old_Poland:1)poli1260:1,Silesian:1)poli262:1)lech1241:1;”

这种格式很难单独解释,但有一些工具在R中,可以可视化这些子类:

图书馆(猿)
情节(read.tree(读取树)(文本= 子.lang(“莱奇蒂克”)))

如果需要,可以指定提示的颜色强调一些节点:

情节(read.tree(读取树)(文本= 子.lang(“莱奇蒂克”)),
     提示颜色= c(c)(“红色”,“黑色”,“黑色”,“黑色”))

如您所见,节点是从下至上计数的。

对于更复杂的树可视化,您可以查看ggtree(ggtree)包裹。有几个语言包提供了一些创建声门日志树的功能: