×

用于关系学习的probit张量因式分解模型。 (英语) Zbl 07633213号

摘要:随着知识图的大量涌现,具有复杂多关系结构的数据建模在统计关系学习领域得到了越来越多的关注。统计关系学习最重要的目标之一是链接预测,即预测知识图中是否存在某些关系。已经提出了大量模型和算法来进行链路预测,其中张量因子分解方法已被证明在计算效率和预测精度方面达到了最先进的性能。然而,现有张量因式分解模型的一个共同缺点是,丢失的关系和不存在的关系被以相同的方式处理,从而导致信息丢失。为了解决这个问题,我们提出了一个带有probit链接的二元张量因子分解模型,它不仅继承了经典张量因子化模型的计算效率,而且还解释了关系数据的二进制性质。我们提出的probit张量因子分解(PTF)模型在预测精度和可解释性方面都显示出优势。本文的补充文件可在线获取。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾迪尼,A。;Tsagkatakis,G。;Tsakalides,P.,“1位张量完成,电子成像,261(2018)·doi:10.2352/ISSN.2470-1173.2018.13.IPAS-261
[2] 哈桑(Al Hasan);Zaki,M。;J.,M.,《社交网络数据分析,社交网络中链接预测的调查》,243-275(2011),Springer:Springer,马萨诸塞州波士顿
[3] 阿拉曼索里,W。;高,S。;T.N.加拉达。;Elsheikh,A.M。;Murshed,A.N。;吉达,J。;阿哈吉,R。;Rokne,J.,“社会网络中的链接预测和分类及其在医疗保健和系统生物学中的应用,健康信息学和生物信息学中的网络建模分析,1,27-36(2012)·doi:10.1007/s13721-012-0005-7
[4] 奥尔,S。;C.比彻。;Kobilarov,G。;莱曼,J。;Cyganiak,R。;Ives,Z.,语义网,“Dbpedia:开放数据网的核心”,722-735(2007),施普林格:施普林格,柏林,海德堡
[5] Bader,B.W。;Harshman,R.A。;Kolda,T.G.,33-42(2007)
[6] Bordes,A。;格洛洛特,X。;韦斯顿,J。;Bengio,Y.,“用于多相关数据学习的语义匹配能量函数,机器学习,94233-259(2014)·兹比尔1319.68169 ·doi:10.1007/s10994-013-5363-6
[7] Bordes,A。;Usunier,N。;Garcia-Duran,A。;韦斯顿,J。;Yakhnenko,O.,《为多相关数据建模翻译嵌入》,《神经信息处理系统的进展》,2787-2795(2013)
[8] A.卡尔森。;Betteridge,J。;基西尔,B。;沉降,B。;小E.R.Hruschka。;Mitchell,T.M.,“走向永无止境的语言学习架构,第二十四届AAAI人工智能会议,5,3(2010)
[9] Chang,K.-W。;S.W.-t,Yih;杨,B。;Meek,C.(2014)
[10] Cong,F。;林庆华。;Kuang,L.-D。;龚,X.-F。;Astikainen,P。;Ristaniemi,T.,“EEG信号的张量分解:简要回顾”,《神经科学方法杂志》,24859-69(2015)·doi:10.1016/j.neumeth.2015年3月18日
[11] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,“通过EM算法从不完整数据中获得最大似然”,《皇家统计学会杂志》,B辑,39,1-38(1977)·Zbl 0364.62022号
[12] 德纳姆,W.W。;麦克丹尼尔,C。;Atkins,J.R.,“Aranda和Alyawara亲属关系:双螺旋模型的定量论证”,美国民族学家,6,1-24(1979)·doi:10.1525/ae.1979.6.1.02a00010
[13] Drumond,L.、Diaz-Aviles,E.和Schmidt-Thieme,L.(2016),“ADMM的多相关学习”,arXiv预印本arXiv:1604.00647。
[14] 杜兰特博士。;Dunson,D.B.,“关系数据的非参数Bayes动态建模,生物特征,101883-898(2014)·Zbl 1306.62075号 ·doi:10.1093/biomet/asu040
[15] 范,M。;周,Q。;Chang,E。;Zheng,T.F.,“基于转换的知识图嵌入与关系映射属性”(2014)
[16] 冯,J。;黄,M。;王,M。;周,M。;Hao,Y。;朱旭,“通过灵活翻译嵌入知识图”,KR,557-560(2016)
[17] Foulds,J。;杜博伊斯,C。;亚松森,A。;对接,C。;Smyth,P.,287-295(2011年)
[18] Franz,T。;A.舒尔茨。;Sizov,S。;Staab,S.,“Triplerank:通过张量分解对语义Web数据进行排名”,《语义Web-ISWC》,2009年,213-228(2009)
[19] Garcia-Duran,A。;Bordes,A。;Usunier,N。;Grandvalet,Y.,“将两种和三种嵌入模型结合起来用于知识库中的链接预测,人工智能研究杂志,55,715-742(2016)·Zbl 1352.68237号 ·数字对象标识代码:10.1613/jair.5013
[20] 北卡罗来纳州加德马齐。;平面图,Y。;Yilmaz,O.,“从部分二进制测量中学习张量,IEEE信号处理汇刊,67,29-40(2018)·Zbl 1414.15029号 ·doi:10.1109/TSP.2018.2879031
[21] 格罗弗,A。;Leskovec,J.,node2vec:网络的可扩展特征学习,855(2016)
[22] 哈什曼,R.A。;Lundy,M.E.,“Parafac:平行因子分析,计算统计与数据分析,18,39-72(1994)·Zbl 0825.62518号
[23] Hitchcock,F.L.,“张量或多元数作为乘积之和的表达式,数学与物理杂志,6,64-189(1927)·doi:10.1002/sapm192761164
[24] Hoff,P.D.,“多路数据的分层多线性模型,计算统计与数据分析,55,530-543(2011)·Zbl 1247.62158号
[25] Hoff,P.D.,“纵向关系数据的多线性张量回归,应用统计学年鉴,91169(2015)·Zbl 1454.62481号
[26] Hoff,P.D.,“等变和无标度塔克分解模型,贝叶斯分析,11627-648(2016)·Zbl 1359.62221号
[27] 胡,C。;Rai,P。;Carin,L.,《从大型知识图学习的基于主题的嵌入》,人工智能与统计,1133-1141(2016)
[28] Jenatton,R。;Roux,N.L。;Bordes,A。;Obozinski,G.R.,高度多相关数据的潜在因素模型,神经信息处理系统进展,3167-3175(2012)
[29] 吉,G。;刘凯。;He,S。;Zhao,J.,《利用自适应稀疏传输矩阵完成知识图》,AAAI,985-991(2016)
[30] 卡拉米,A。;亚兹迪,M。;Mercier,G.,“使用Discerete小波变换和Tucker分解压缩高光谱图像,IEEE应用地球观测和遥感选定主题期刊,5,444-450(2012)·doi:10.1109/JSTARS.2012.2189200
[31] 坎普,C。;Tenenbaum,J.B。;Griffiths,T.L。;山田,T。;Ueda,N.,“具有无限关系模型的概念学习系统”,载于AAAI,3,5(2006)
[32] 科克,S。;Domingos,P.,《统计谓词发明》,第24届国际会议(2007年)·doi:10.1145/1273496.1273551
[33] Krivitsky,P.N。;Handcock,M.S.,“利用潜在网络拟合社交网络的位置潜在集群模型”,《统计软件杂志》,2008年第24、5期·doi:10.18637/jss.v024.i05
[34] Krompaß,D.,Nickel,M.,Jiang,X.,and Tresp,V.(2013),“带Rescal的非负张量因式分解”,收录于《机器学习张量方法》(Tensor Methods for Machine Learning),ECML Workshop。
[35] Liben-Nowell,D。;Kleinberg,J.,“社交网络的链接预测问题”,《美国信息科学与技术学会杂志》,581019-1031(2007)·doi:10.1002/asi.20591
[36] Lin,Y。;刘,Z。;孙,M。;刘,Y。;Zhu,X.,《知识图完成的学习实体和关系嵌入》,AAAI,2181-2187(2015)
[37] London,B.、Rekatsinas,T.、Huang,B.和Getoor,L.(2013),“使用带模损失的加权张量分解进行多关系学习”,arXiv预印本arXiv:1303.1733。
[38] Mazumder,R。;哈斯蒂,T。;Tibshirani,R.,“学习大型不完全矩阵的谱正则化算法”,《机器学习研究杂志》,11,2287-2322(2010)·Zbl 1242.68237号
[39] 麦克雷,A.T。;Burgun,A。;Bodenreider,O.,“聚合UMLS语义类型以降低概念复杂性”,《卫生技术和信息学研究》,84,216(2001)
[40] 南卡罗来纳州米哈斯。;霍夫,P.D。;Ward,M.D.,“分析国际关系中共同进化纵向网络的新方法”,《和平研究杂志》,53,491-505(2016)·doi:10.1177/002234331630783
[41] Nguyen,D.Q.、Nguyen-T.D.、Ngueen,D.Q和Phung,D.(2017),“基于卷积神经网络的知识库完成的新型嵌入模型”,arXiv预印本arXiv:1712.02121。
[42] Nguyen,D.Q.、Sirts,K.、Qu,L.和Johnson,M.(2016),“Stranse:知识库中实体和关系的新嵌入模型”,arXiv预印本arXiv:1606.08140。
[43] Nickel,M.和Tresp,V.(2013),“多相关数据的Logistic张量因子分解”,arXiv预印本arXiv:1306.2084。
[44] 镍,M。;Tresp,V.公司。;Kriegel,H.-P.,809-816(2011)
[45] 彭杰。;卢,G。;Shang,X.,“生物网络链接预测的网络表征学习方法调查”,《当前药物设计》,第26期,第3076-3084页(2020年)·doi:10.2174/1381612826666200116145057
[46] Perozzi,B。;Al-Rfou,R。;Skiena,S.(2014)
[47] Rai,P。;Wang,Y。;郭,S。;陈,G。;邓森,D。;Carin,L.,1800-1808(2014)
[48] 伦德尔,S。;Schmidt-Thieme,L.,个性化标签推荐的成对相互作用张量因子分解,第三届ACM国际会议(2010)·数字对象标识代码:10.1145/1718487.1718498
[49] Rummel,R.J.,《国家的维度项目:国家的属性和国家双重人格的行为》,1950-1965年,第5409期。大学间政治研究联合会(1976年)
[50] Sarkar,P。;Moore,A.,“使用潜在空间模型的动态社会网络分析,神经信息处理系统的进展,18,1145-1152(2005)
[51] Sarkar,P。;西迪奇,S.M。;Gordon,G.J.,《动态嵌入共现数据的潜在空间方法》,人工智能与统计,420-427(2007)
[52] Schein,A。;佩斯利,J。;布莱,D.M。;Wallach,H.,Bayesian Poisson Tensor因子分解,用于从稀疏并元事件计数推断多边关系(2015)·doi:10.1145/2783258.2783414
[53] Schwarz,G.,“估算模型的维度”,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[54] 休厄尔,D.K。;Chen,Y.,“动态网络的潜在空间模型,美国统计协会杂志,110,1646-1657(2015)·Zbl 1373.62580号 ·数字标识代码:10.1080/01621459.2014.988214
[55] Shi,C。;卢·W。;Song,R.,“确定统计多关系学习中潜在因素的数量”,《机器学习研究杂志》,20,809-846(2019)·Zbl 1483.68320号
[56] Singhal,A.(2012),“引入知识图:事物,而非字符串”,谷歌官方博客。
[57] Suchanek,F.M。;Kasneci,G。;Weikum,G.,第16届国际会议(2007年)
[58] 苏莱曼尼,S。;Khansari,M。;Masoudi-Nejad,A.,“生物网络的链接预测潜力,国际数据挖掘和生物信息学杂志,2018161-184(2018)·doi:10.1504/IJDMB.2018.093684
[59] Sun,W.W。;卢,J。;刘,H。;Cheng,G.,“可证明稀疏张量分解”,《皇家统计学会杂志》,B辑,79,899-916(2017)·Zbl 1411.62158号 ·doi:10.1111/rssb.12190
[60] Trivedi,R.、Dai,H.、Wang,Y.和Song,L.(2017),“知识进化:动态知识图的深层时间推理”,arXiv预印本arXiv:1705.05742。
[61] 塔克,L.R.,“关于三模式因子分析的一些数学注释,《心理测量学》,31279-311(1966)·doi:10.1007/BF02289464
[62] 韦夫利特,N。;辩论,O。;De Lathauwer,L.,“利用大尺度张量分解中的有效表示”,SIAM科学计算杂志,41,A789-A815(2019)·Zbl 07045251号 ·doi:10.1137/17M1152371
[63] 王,D。;崔,P。;朱伟,《结构深层网络嵌入》(2016)
[64] 王,Z。;张,J。;冯,J。;Chen,Z.,《通过超平面翻译嵌入知识图》,AAAI,1112-1119(2014)
[65] 韦斯特维尔德,A.H。;Hoff,P.D.,“纵向关系和网络数据的混合效应模型,及其在国际贸易和冲突中的应用,应用统计年鉴,5843-872(2011)·Zbl 1454.62509号 ·doi:10.1214/10-AOAS403
[66] Xiao,H.、Huang,M.、Hao,Y.和Zhu,X.(2015),“事务:知识图嵌入的自适应方法”,arXiv预印本arXiv:1509.05490。
[67] Xu,K.S。;Hero,A.O.,“时间演进社交网络的动态随机块模型,IEEE信号处理选定主题期刊,8552-562(2014)·doi:10.1010/JSTSP.2014.2310294
[68] 徐,Z。;Yan,F。;Qi,Y.,“多路数据分析的贝叶斯非参数模型,模式分析和机器智能的IEEE事务,37,475-487(2013)·doi:10.1109/TPAMI.2013.201
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。