×

语义空间。 (英语) Zbl 1409.68302号

摘要:任何自然语言都可以被视为生成大型数据库的工具(由文本、书面或话语组成)。此工具的描述反过来需要其他大型数据库(字典、语法等)。如今,数据库的概念与计算机处理和计算机内存有关。然而,一种自然语言也存在于人类大脑中,并在人际交往和代际交往中发挥作用。我们在这篇调查/研究论文中讨论了数学,尤其是几何,构造,它们有助于将这两个世界联系起来。特别是,在本文中,我们考虑了自然语言处理中使用的基于频率矩阵的语义向量空间模型。我们研究了用格拉斯曼、射影空间和旗变种表示的基本几何。根据Grassmannian和射影空间中子簇的可投射性,我们建立了基于半轴的向量空间模型和语义空间之间的关系。我们将潜在语义解释为格拉斯曼的几何流。我们还讨论了如何在我们的几何环境中形成Gärdefors的“思想汇合”概念。

MSC公司:

68T50型 自然语言处理
2015年14月 格拉斯曼流形、舒伯特流形、旗流形
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alt,H.,Godau,M.:计算两条多边形曲线之间的Fréchet距离。国际期刊计算。几何。申请。5, 75-91 (1995) ·Zbl 0941.68809号 ·doi:10.1142/S0218195995000064
[2] Ammar,G.,Martin,C.:矩阵特征值方法的几何。《应用学报》。数学。5(3), 239-278 (1986) ·Zbl 0639.34046号 ·doi:10.1007/BF00047344
[3] Arrondo,E.:各品系的格拉斯曼投影和藜芦变种的特征。J.算法几何。1, 165-192 (2001)
[4] Arrondo,E.,Paoletti,R.:通过格拉斯曼投影对维罗内塞品种进行表征。收录于:Ciliberto,C.,Geramita,A.V.,Harbourne,B.,Miró-Reig,R.M.,Ranestad,K.(编辑)《具有意外性质的投影品种:纪念朱塞佩·维罗内塞的卷》,Walter de Gruyter(2005)·Zbl 1101.14065号
[5] Bickerton,D.,Szathmary,E.:生物学基础和句法起源。麻省理工学院出版社,纽约(2009)·doi:10.7551/mitpress/9780262013567.001.0001
[6] Budanitsky,A.,Hirst,G.:评估基于WordNet的语义距离度量。计算。语言学家。32(1), 13-47 (2006) ·Zbl 1234.68399号 ·doi:10.1162/coli.2006.32.1.13
[7] Carlsson,G.:拓扑和数据。牛市。AMS 46(2),255-308(2009)·Zbl 1172.62002号 ·doi:10.1090/S0273-0979-09-01249-X
[8] Chiarello,C.,Burgess,C.,Richards,L.,Pollock,A.:大脑半球的语义和联想启动:一些单词有,一些单词没有……有时,有些地方。Brain Lang.38,7-104(1990年)·文件编号:10.1016/0093-934X(90)90103-N
[9] Curto,C.,Itskov,V.:细胞群揭示了刺激空间的结构。公共科学图书馆计算。生物学4(10),13(2008)·doi:10.1371/journal.pcbi.1000205
[10] Curto,C.,Itskov,V.,Veliz-Cuba,A.,Youngs,N.:神经环:分析神经代码内在结构的代数工具。牛市。数学。生物学75(9),1571-1611(2013)·Zbl 1311.92043号 ·doi:10.1007/s11538-013-9860-3
[11] Demailly,J.P.:正向量束张量幂的消失定理。在:流形上的几何和分析(Katata/Kyoto,1987),第86-105页,数学课堂讲稿。,第1339卷,施普林格,纽约(1988)·Zbl 0651.32019号
[12] Dhillon,P.、Foster,D.P.、Ungar,L.H.:特征词:谱词嵌入。J.马赫。学习。第16号决议,3035-3078(2015)·Zbl 1351.68207号
[13] Dugger,D.,Isaksen,D.C.:拓扑中的超覆盖。预打印http://www.math.uiuc.edu/K-theory/0528/ ·Zbl 1055.55016号
[14] Eliasmith,C.:神经语义学和范畴。摘自:《认知科学分类手册》,第1035-1054页,爱思唯尔出版社,阿姆斯特丹(2005)
[15] Gärdefors,P.:概念空间:思维的几何学。麻省理工学院出版社,剑桥(2000)
[16] Gärdefors,P.:意义的几何:基于概念空间的语义。麻省理工学院出版社,剑桥,第343+xii页(2014)·Zbl 1303.00038号
[17] Griffiths,P.:关于Cartan的李群和移动框架方法,用于微分几何中的唯一性和存在性问题。杜克大学数学。J.41,775-814(1974)·Zbl 0294.53034号 ·doi:10.1215/S0012-7094-74-04180-5
[18] Guiraud,P.:意义的半矩阵。社会科学。Inf.7(2),131-139(1968)·doi:10.1177/053901846800700206
[19] Hatcher,A.:代数拓扑。剑桥大学,CUP(2002)·Zbl 1044.55001号
[20] Hackl,M.:语法语义界面。Lingua语言130,66-87(2013)·doi:10.1016/j.lingua.2013.01.010
[21] Indefrey,P.,Levet,W.J.M.:单词产生成分的空间和时间特征。认知92,101-144(2004)·doi:10.1016/j.认知.2002.06.001
[22] Lescheniak,J.D.,Levet,W.J.M.:言语产生中的词频效应:句法信息和语音形式的检索。实验心理学:学习。内存。科尼特。20, 824-843 (1994) ·doi:10.1037/0278-7393.20.4.824
[23] Lica,L.:WHICH和THAT的区别。带图表。网址:http://home.earthlink.net/利卡/wichthat.htm·Zbl 1185.68765号
[24] Lowe,W.:走向语义空间理论。摘自:《认知科学学会第23届会议记录》,第576-581页(2001年)
[25] Martin,C.,Ammar,G.:矩阵Riccati方程的几何和相关的特征值方法。摘自:《Riccati方程》,第113-126页,《通信控制工程期刊》。施普林格,纽约(1991)
[26] Manin,Y.I.:Zipf定律和L.Levin概率分布。功能。分析。申请。48(2) (2014). doi:10.107/s10688-014-0052-1。预印arXiv:1301.0427·Zbl 1347.03080号
[27] Manin,Y.I.:神经代码和同伦类型:位置场识别的数学模型。莫斯科数学。J.15,1-8(2015)。arXiv:1501.00897号·Zbl 1366.94060号
[28] Manin,D.Y.:左边的正确单词:衡量诗歌和散文中的词汇前景化。网址:www.researchgate.net·Zbl 0199.26404号
[29] Manning,C.D.,Schuetze,H.:统计自然语言处理基础。麻省理工学院出版社,纽约(1999)·Zbl 0951.68158号
[30] 梅尔切克,I.:语言:从意义到文本。收件人:Beck,D.(编辑),Moscow&Boston(2016)
[31] Poeppel,D.:语言:指定与模态无关的意义的位置。货币。生物学16(21),R930-R932(2006)·doi:10.1016/j.cub.006.09.047
[32] Port,A.,Gheorghita,I.,Guth,D.,Clark,J.M,Liang,C.,Dasu,S.,Marcolli,M.:语法的持久拓扑。arXiv公司:1507.05134·兹比尔1417.91428
[33] Postnikov,A.:完全积极,格拉斯曼主义和网络。预打印arXiv:math/0609764[math.CO]
[34] Schütze,H.,Pedersen,J.:组合和聚合相关性的向量模型。摘自:《理解单词》,第104-113页,牛津大学(1993)·Zbl 0294.53034号
[35] Segal,G.:分类空间和谱序列。Inst.Hautes练习曲科学。出版物。数学。34, 105-112 (1968) ·Zbl 0199.26404号 ·doi:10.1007/BF02684591
[36] Turny,P.D.,Pantel,P.:从频率到意义:语义的向量空间模型。J.阿蒂夫。智力。第37号决议、第141-188号决议(2010年)·Zbl 1185.68765号
[37] van Valin Jr.,R.D.:探索句法-语义界面。剑桥大学出版社,剑桥(2005)·Zbl 1107.68113号 ·doi:10.1017/CBO9780511610578
[38] Warglien,M.,Gärdenfors,P.:语义学,概念空间和思想的汇合。综合190(12),2165-2193(2013)·doi:10.1007/s11229-011-9963-z
[39] Wittek,P.,Darányi,S.:语义空间的谱构成。摘自:Song,D.,Melucci,M.,Frommholz,I.,Zhang,P.,Wang,L.,Arafat,S.(eds.)量子相互作用,计算机科学讲义,第7052卷,第60-70页。斯普林格,海德堡(2011)
[40] Youngs,N.E.:《神经环:使用代数几何分析神经环》,第108页。arXiv:1409.2544[q-bio.NC]
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。