×

HNS:网络表征学习的分层负抽样。 (英语) Zbl 1475.68235号

网络表示学习(NRL)的目的是通过将顶点和边编码到低维空间来建模网络图。这些学习到的表示可以用于后续应用,例如顶点分类和链接预测。负采样(Negative Sampling,NS)是提高NRL性能最常用的方法。然而,现有的大多数工作只是基于顶点频率随机抽取负样本,即频率较高的顶点更容易被抽取,这忽略了采样的顶点可能不是真正的负样本的情况,因此,会导致不希望的嵌入。本文提出了一种新的负采样方法,称为层次负采样(HNS),该方法能够对顶点的潜在结构进行建模并学习它们之间的关系。在采样过程中,HNS可以提取更合适的负样本,从而获得更好的网络嵌入性能。首先,我们从理论上证明了HNS相对于NS的优势。然后,我们使用实验结果表明,在实际网络中,在不同训练尺度下,我们提出的方法在顶点分类任务上的性能优于最新的模型。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
第62天05 抽样理论,抽样调查
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Armandpour,M。;丁·P。;黄,J。;Hu,X.,网络嵌入的鲁棒负采样,AAAI人工智能会议论文集。,33, 3191-3198 (2019)
[2] 布莱,D.M。;Ng,A.Y。;Jordan,M.I.,《潜在的dirichlet分配》,《机器学习研究杂志》,1993年1月3日至2022年(2003年)·兹比尔1112.68379
[3] L.Cai,W.Y.Wang,Kbgan:知识图嵌入的对抗学习,2017年。arXiv预打印arXiv:1711.04071。
[4] 卡瓦拉里,S。;郑维伟。;蔡,H。;Chang,K.C.-C。;Cambria,E.,学习社区嵌入与社区检测和图上节点嵌入,(2017年ACM信息与知识管理会议论文集(2017)),377-386
[5] 陈,J。;龚,Z。;Liu,W.,具有单词嵌入的在线主题发现的非参数模型,信息科学,504,32-47(2019)
[6] 陈,J。;龚,Z。;Liu,W.,基于dirichlet进程比特的短文本流聚类混合模型,应用智能,1-11(2020)
[7] Chen,L。;袁,F。;Jose,J.M。;Zhang,W.,利用自嵌入特征改进单词表征的负抽样,(第十一届ACM网络搜索和数据挖掘国际会议论文集(2018)),99-107
[8] 崔,P。;王,X。;裴,J。;朱伟,网络嵌入调查,IEEE知识与数据工程汇刊,31,5,833-852(2018)
[9] L.Du,Y.Wang,G.Song,Z.Lu,J.Wang,动态网络嵌入:基于跳图的网络嵌入的扩展方法,载:IJCAI,2018。第2086-2092页。
[10] Dunlavy,D.M。;科尔达·T·G。;Acar,E.,《使用矩阵和张量分解进行时间链接预测》,《ACM从数据中发现知识的交易》(TKDD),5,2,1-27(2011)
[11] 风机,R.-E。;Chang,K.-W。;谢长杰。;王,X.-R。;Lin,C.-J.,《Liblinear:大型线性分类库》,《机器学习研究杂志》,1871-1874年8月9日(2008)·Zbl 1225.68175号
[12] Fischer,A。;Botero,J.F。;贝克,M.T。;De Meer,H。;Hesselbach,X.,《虚拟网络嵌入:一项调查》,IEEE通信调查与教程,第15、4、1888-1906页(2013年)
[13] 高,H。;Huang,H.,自同步网络嵌入,(第24届ACM SIGKDD知识发现与数据挖掘国际会议论文集(2018)),1406-1415
[14] Griffiths,T.L。;Steyvers,M.,《寻找科学主题》,《美国国家科学院学报》,101,增刊1,5228-5235(2004)
[15] 格罗弗,A。;Leskovec,J.,node2vec:网络的可扩展特征学习(第22届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2016)),855-864
[16] 郭杰。;龚,Z.,地理时空中事件发现的非参数模型,(第25届ACM国际信息与知识管理会议论文集(2016)),499-508
[17] Gutmann,M.U。;Hyvärinen,A.,《非正规统计模型的噪声控制估计及其在自然图像统计中的应用》,《机器学习研究杂志》,2012年2月13日,第307-361页·Zbl 1283.62064号
[18] 刘,Y。;刘,Z。;Chua,T.-S。;Sun,M.,主题词嵌入,(第二十九届AAAI人工智能会议(2015))
[19] 刘,Z。;Zhang,Y。;Chang,E.Y。;Sun,M.,Plda+带数据放置和管道处理的并行潜在dirichlet分配,ACM智能系统与技术交易(TIST),2,3,1-18(2011)
[20] McCallum,A.K。;Nigam,K。;Rennie,J。;Seymore,K.,《利用机器学习自动构建互联网门户》,信息检索,3,2,127-163(2000)
[21] Mikolov,T.、Chen,K.、Corrado,G.、Dean,J.,2013年。向量空间中单词表示的有效估计。arXiv预打印arXiv:1301.3781。
[22] T.Mikolov,I.Sutskever,K.Chen,G.S.Corrado,J.Dean,单词和短语的分布式表示及其组合,收录于:神经信息处理系统的进展,2013年,第3111-3119页。
[23] A.Mnih,Y.W.Teh,用于训练神经概率语言模型的快速简单算法,2012。arXiv预打印arXiv:1206.6426。
[24] 莫林,F。;Bengio,Y.,层次概率神经网络语言模型,Aistats,5,246-252(2005),Citeser
[25] Perozzi,B。;Al-Rfou,R。;Skiena,S.,《Deepwalk:社交表征的在线学习》,(第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2014)),701-710
[26] 里贝罗,L.F。;Saverese,P.H。;Figueiredo,D.R.,struc2vec:从结构身份中学习节点表示,(第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2017)),385-394
[27] Shi,B。;Lam,W。;Jameel,S。;肖克尔特,S。;Lai,K.P.,联合学习单词嵌入和潜在主题,(第40届国际ACM SIGIR信息检索研究与开发会议论文集(2017)),375-384
[28] Sun,A。;Lim,E.-P.,《分层文本分类和评估》,(2001年IEEE数据挖掘国际会议论文集,IEEE(2001)),521-528
[29] Tang,J。;曲,M。;王,M。;张,M。;严,J。;Mei,Q.,Line:《大规模信息网络嵌入》,第24届万维网国际会议论文集(2015),1067-1077
[30] Tang,J。;张,J。;姚,L。;李,J。;张,L。;Su,Z.,Arnetminer:学术社交网络的提取和挖掘,(第14届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2008)),990-998
[31] Y.W.Teh,Dirichlet过程,机器学习百科全书,2011年。
[32] Y.W.Teh、M.I.Jordan、M.J.Beal、D.M.Blei,《相关群体间共享集群:层次dirichlet过程》,载《神经信息处理系统进展》,2005年,第1385-1392页。
[33] A.齐次林。;莫廷,D。;Karras,P。;Müller,E.,Verse:相似性度量的多功能图嵌入,(2018年万维网会议论文集(2018)),539-548
[34] C.Tu,H.Liu,Z.Liu,M.Sun,Cane:关系建模的上下文软件网络嵌入,收录于:计算语言学协会第55届年会会议记录(第1卷:长论文),2017年。第1722-1731页。
[35] 屠呦呦,C。;曾,X。;Wang,H。;张,Z。;刘,Z。;孙,M。;张,B。;Lin,L.,社区检测和网络表示学习的统一框架,IEEE知识与数据工程汇刊,31,6,1051-1065(2018)
[36] Tu,K。;崔,P。;王,X。;余,P.S。;朱伟,带正则等价的深度递归网络嵌入,(第24届ACM SIGKDD国际知识发现与数据挖掘会议论文集(2018)),2357-2366
[37] 王,P。;李,S。;Pan,R.,将消极抽样纳入知识表征学习,(第三十二届AAAI人工智能会议(2018))
[38] 王,Q。;毛,Z。;王,B。;Guo,L.,《知识图嵌入:方法和应用调查》,IEEE知识与数据工程汇刊,29,12,2724-2743(2017)
[39] Wang,W。;陈,J。;王,J。;陈,J。;龚,Z.,智能城市个性化兴趣点推荐的地理感知归纳矩阵完成,IEEE物联网杂志。(2019)
[40] Wang,W。;陈,J。;王,J。;陈,J。;刘杰。;龚,Z.,用于个性化兴趣点推荐的信任增强协同过滤,IEEE工业信息学汇刊(2019)
[41] 王,X。;崔,P。;王,J。;裴,J。;朱伟。;Yang,S.,社区保护网络嵌入,(第三十一届AAAI人工智能大会(2017))
[42] Wang,Y。;白,H。;斯坦顿,M。;Chen,W.-Y。;Chang,E.Y.,Plda:大规模应用的并行潜在dirichlet分配,(管理算法应用国际会议(2009),Springer),301-314
[43] Williams,R.J.,连接强化学习的简单统计梯度允许算法,机器学习,8,3-4,229-256(1992)·Zbl 0772.68076号
[44] 杨,C。;刘,Z。;赵,D。;孙,M。;Chang,E.,《利用丰富文本信息进行网络表征学习》,(第二十四届国际人工智能联合会议(2015))
[45] 杨,J。;Leskovec,J.,规模上的重叠社区检测:一种非负矩阵分解方法,(第六届ACM网络搜索和数据挖掘国际会议论文集(2013)),587-596
[46] 杨,J。;麦考利,J。;Leskovec,J.,《具有节点属性的网络中的社区检测》,(2013年IEEE第13届国际数据挖掘会议(2013年),IEEE),1151-1156
[47] 尹,J。;Wang,J.,基于模型的文本聚类方法与离群值检测,(2016年IEEE第32届国际数据工程会议(ICDE)(2016年),IEEE),625-636
[48] 张,C。;斯瓦米,A。;Chawla,N.V.,Shne:语义相关异构网络的表示学习,(第十二届ACM网络搜索和数据挖掘国际会议论文集(2019)),690-698
[49] Zhang,Y。;姚,Q。;Shao,Y。;Chen,L.,Nscaching:简单有效的知识图嵌入负抽样,(2019 IEEE第35届国际数据工程会议(ICDE)(2019),IEEE),614-625
[50] 张,Z。;崔,P。;王,X。;裴,J。;姚,X。;Zhu,W.,任意阶近似保持网络嵌入,(第24届ACM SIGKDD国际知识发现与数据挖掘会议论文集(2018)),2778-2786
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。