交叉依赖的稀缺性:特定约束的直接结果?

卡洛斯·戈梅斯·罗德里格斯(Carlos Gómez-Rodríguez)和拉蒙·费雷尔(Ramon Ferrer-i-Cancho)
物理学。版本E96,062304–2017年12月4日出版

摘要

句子的结构可以表示为一个网络,其中顶点是单词,边表示句法依赖。有趣的是,交叉句法依赖在人类语言中并不常见。这就引出了一个问题,即语言过境点的稀缺是否源于对过境点的独立和具体限制。我们提供的统计证据表明,情况并非如此,因为可以通过一个简单的预测器,根据两个依赖项在给定长度的情况下交叉的局部概率的零假设,准确估计来自多种语言的句子的依赖项交叉比例。该预测器的相对误差从未超过5%平均而言,而假设句子中单词的随机顺序的基线预测值的误差至少要大六倍。我们的结果表明,自然语言中交叉频率低既不是由语言的隐藏知识引起的,也不是由交叉的不受欢迎引起的就其本身而言但这仅仅是依赖长度最小化原则的副作用。

  • 图
  • 图
  • 图
  • 图
  • 图
  • 2017年4月5日收到

内政部:https://doi.org/10.103/PhysRevE.96.062304(物理版)

©2017美国物理学会

物理学科标题(PhySH)

网络

作者和附属机构

卡洛斯·戈梅斯·罗德里格斯1,*Ramon Ferrer-i-Cancho公司2,†

  • 1科鲁尼亚大学,FASTPARSE实验室,LyS研究小组,计算系,科鲁尼亚学院,Elviña校区,西班牙科鲁尼亚15071
  • 2加泰罗尼亚政治大学计算机系LARCA研究小组复杂性和定量语言学实验室

文章文本(需要订阅)

单击以展开

参考(需要订阅)

单击以展开
问题

第96卷,第。2017年12月6日

重用权限(&P)
Access选项
翻译和文案辅助广告的作者出版服务

需要授权


×
×

图像

×

注册以接收来自的定期电子邮件警报物理审查E

登录

取消
×

搜索


文章查找

粘贴引文或DOI

输入引文
×