计算机科学››2022,第49卷››问题(9): 64-69.数字对象标识:1896年10月10日/jsjkx.220500196

数据库&大数据&数据科学* 上一篇   下一篇

基于无监督集群级的科技论文异质图节点表示学习方法

宋杰, 梁美玉, 薛哲, 杜军平, 寇菲菲  

  1. 北京邮电大学计算机学院(国家示范性软件学院)智能通信软件与多媒体北京市重点实验室 北京 100876
  • 收稿日期:2022-05-20 修回日期:2022-07-05 出版日期:2022-09-15 发布日期:2022-09-09
  • 通讯作者:梁美玉(meiyu1210@bupt.edu.cn)
  • 作者简介:(songs@bupt.edu.cn)
  • 基金资助:
    国家重点研发计划(2018YFB1402600);国家自然科学基金(61877006,61802028,62002027)

基于无监督聚类层次的科技论文异构图节点表示学习方法

宋杰、梁美佑、薛哲、杜俊平、孔飞飞  

  1. 北京邮电大学计算机科学学院(国家试点软件工程学院)智能通信软件与多媒体北京重点实验室,北京100876
  • 收到:2022-05-20 修订过的:2022-07-05 在线:2022-09-15 出版:2022-09-09
  • 关于作者:宋杰,1997年出生,硕士。他的主要研究兴趣包括数据挖掘、信息检索和机器学习。
    梁美佑,1985年生,副教授,博士,主要研究方向为人工智能、数据挖掘、多媒体信息处理和计算机视觉。
  • 支持单位:
    国家重点研发计划(2018YFB1402600)和国家自然科学基金(61877006618020262002027)。

摘要:科技论文数据的知识表征是一个有待解决的问题,而如何学习科技论文异质网络中论文节点的表示是解决这一问题的核心。文中提出了一种基于无监督集群级的科技论文异质图节点表示学习方法(无监督集群级科学论文异构图节点表示学习方法,UCHL),以获取科技论文异质图中节点(作者、机构与论文等)的表示。基于科技论文异质图表示对整个异质图进行链接预测,获取节点之间边的关系,即论文与论文之间的关联关系。实验结果表明,在真实的科技论文数据集上,所提方法在多项评测指标上都取得了更优的性能。

关键词: 科技论文, 异质图网络, 图表示学习, 链接预测, 无监督学习

摘要:科技论文数据的知识表示是一个亟待解决的问题,如何学习科技论文异构网络中论文节点的表示是解决这一问题的核心。提出了一种无监督聚类层次的科技论文异质图节点表示学习方法(UCHL),旨在获取科技论文异质图形中节点(作者、机构、论文等)的表示。基于异构图表示,对整个异构图进行链接预测,得到节点边缘之间的关系,即纸张与纸张之间的关系。实验结果表明,该方法在真实科学论文数据集上的多个评价指标上取得了优异的性能。

关键词: 科学论文, 异构图形网络, 图形表示学习, 链接预测, 无监督学习

中图分类号: 

  • TP391型
[1] PEROZZI B,AL-RFOU R,SKIENA S.Deepwalk:在线学习社会表征[C]//第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集.2014:701-710。
[2] GROVER A,LESKOVEC J.node2vec:网络的可扩展特征学习[C]//第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。2016:855-864。
[3] NARAYANAN A,CHANDRAMOHAN M,VENKATESANR,et al.graph2vec:学习图的分布式表示[J].arXiv:1707.050052017。
[4] 王德,崔萍,朱伟.结构深层网络嵌入[C]//第22届ACM SIGKDD国际知识发现与数据挖掘会议论文集.2016:225-1234。
[5] 唐杰,QU M,WANG M,等.行:大规模信息网络嵌入[C]//第24届万维网国际会议论文集.2015:1067-1077。
[6] 陈浩,佩罗兹·B,胡毅,等.哈普:网络层次表征学习[J].arXiv:1706.078452017。
[7] 孟德英,贾永明,杜建平,等.基于迭代学习的相对论度系统数据驱动控制[J]。IEEE神经网络汇刊,2011,22(12):2213-2225。
[8] KIPF T N,WELLING M.图卷积网络半监督分类[J].arXiv:1609.029072016。
[9] 维利·科维奇·P,CUCURULL G,CASANOVA A,等.图形注意网络[J].arXiv:1710.109032017。
[10] HAMILTON W L,YING R,LESKOVEC J.大图的归纳表示学习[C]//第31届神经信息处理系统国际会议论文集。2017:1025-1035。
[11] 王华,莱斯科维奇J.统一图卷积神经网络与标记传播[J].arXiv:2002.067552020。
[12] 张峰,BU T M.CN-运动感知图神经网络[J]。IEEE接入,2021,9:151285-151293。
[13] 方永科,邓文华,杜建平,等.人脸照片合成与识别中的身份识别Cy-cleGAN[J]。模式识别,2020102:1-36。
[14] LUAN S,HUA C,LU Q等。异质性是图神经网络进行节点分类的真正噩梦吗?[J] .arXiv:2109.056412021。
[15] DONG Y,CHAWLA N V,SWAMI A.metatah2vec:异构网络的可扩展表示学习[C]//第23届ACM SIGKDD国际知识发现和数据挖掘会议论文集。2017:135-144。
[16] SHANG J,QU M,LIU J,等.大规模异构信息网络相似搜索的Meta-path引导嵌入[J].arXiv:1610.097692016。
[17] 薛Z,杜建平,杜德伟,等.用于多视图聚类的深低秩子空间系综[J]。信息科学,2019482:210-227。
[18] 王霞,JI H,SHI C,等。异质图形注意网络[C]//万维网会议。2019:2022-2032。
[19] 付旭,张杰,孟姿,等.Magnn:异构图嵌入的元路径聚合图神经网络[C]//网络会议论文集.2020:2331-2341。
[20] 张C,宋德,黄C,等.异构图神经网络[C]//第25届ACM SIGKDD国际知识发现与数据挖掘会议论文集.2019:793-803。
[21]胡文明,高洁,李斌,等.基于局部核密度估计和基于上下文的回归的异常检测[J]。IEEE知识与数据工程汇刊,2018年,32(2):218-233。
[22]HONG H,GUO H,LIN Y,et al.一种用于异构结构学习的基于注意的图神经网络[C]//美国人工智能学会人工智能会议论文集.2020,34(4):4132-4139。
[23]VASWANI A,SHAZEER N,PARMAR N,et al.请注意[J].arXiv:1706.037622017。
[24]胡忠,董毅,王凯,等.异构图变换器[C]//网络会议论文集.2020:2704-2710。
[25]VELICKOVIC P,FEDUS W,HAMILTON W L,et al.深度图形信息最大值[J]。ICLR(海报),2019,2(3):4。
[26]HJELM R D,FEDOROV A,LAVOIE-MARCHILDON S,et al.通过互信息估计和最大化学习深度表示[J]。arXiv:1808.066702018。
[27]李伟林,贾永明,杜建平.非线性耦合复杂网络的方差约束状态估计[J]。IEEE控制论汇刊,2017,48(2):818-824。
[28]任毅,刘斌,黄灿,等.异质深度图infomax[J].arXiv:1911.085382019。
[29]MAVROMATIS C,KARYPIS G.Graph InfoClust:利用集群级节点信息进行无监督图表示学习[J].arXiv:2009.069462020。
[1] 黄丽, 朱焱, 李春平.
基于异构网络表征学习的作者学术行为预测
基于异构网络表征学习的作者学术行为预测
计算机科学, 2022, 49(9): 76-82.https://doi.org/10.11896/jsjkx.210900078
[2] 侯宏旭, 孙硕, 乌尼尔.
蒙汉神经机器翻译研究综述
蒙古语-汉语神经机器翻译综述
计算机科学, 2022, 49(1): 31-40.https://doi.org/10.11896/jsjkx.210900006
[3] 胡昕彤, 沙朝锋, 刘艳君.
基于随机投影和主成分分析的网络嵌入后处理算法
基于随机投影和主成分分析的后处理网络嵌入算法
计算机科学, 2021, 48(5): 124-129.https://doi.org/10.11896/jsjkx.200500058
[4] 陈恒, 王维美, 李冠宇, 史一民.
四元数关系旋转的知识图谱补全模型
以四元数为关系旋转的知识图完成模型
计算机科学, 2021, 48(5): 225-231.https://doi.org/10.11896/jsjkx.200300093
[5] 王文博, 罗恒利.
基于图卷积神经网络的完全图人脸聚类
基于图卷积网络的完全图人脸聚类
计算机科学, 2021年,48(11A):275-277。https://doi.org/10.11896/jsjkx.201200102
[6] 付颖, 王红玲, 王中卿.
基于单词-章节关联的科技论文摘要
利用分词关联进行科技论文综述
计算机科学, 2021, 48(10): 59-66.https://doi.org/10.11896/jsjkx.200900180
[7] 李金霞, 赵志刚, 李强, 吕慧显, 李明生.
改进的局部和相似性保持特征选择算法
改进的保持局部性和相似性的特征选择算法
计算机科学, 2020年,47(6A):480-484。https://doi.org/10.11896/JsJkx.20190800095
[8] 张志扬, 张凤荔, 陈学勤, 王瑞锦.
基于分层注意力的信息级联预测模型
基于层次注意的信息级联预测模型
计算机科学, 2020, 47(6): 201-209.https://doi.org/10.11896/jsjkx.200200117
[9] 王成章, 白晓明, 杜金栗.
图像的扩散界面无监督聚类算法
基于漫反射界面的无监督图像聚类算法
计算机科学, 2020, 47(5): 149-153.https://doi.org/10.11896/jsjkx.190300125
[10] 刘苗苗,扈庆翠,郭景峰,陈晶.
符号网络链接预测算法研究综述
签名网络中的链路预测算法综述
计算机科学, 2020, 47(2): 21-30.https://doi.org/10.11896/jsjkx.190600104
[11] 罗月,童卞,景帅,张蒙,饶永明,闫峰.
基于卷积去噪自编码器的芯片表面弱缺陷检测方法
基于卷积去噪自动编码器的芯片表面弱缺陷检测方法
计算机科学, 2020, 47(2): 118-125.https://doi.org/10.11896/jsjkx.190100141
[12] 李忠文, 丁烨, 花忠云, 李君一, 廖清.
结合三元组重要性的知识图谱补全模型
基于三重重要性集成的知识图完成模型
计算机科学, 2020, 47(11): 231-236.https://doi.org/10.11896/jsjkx.200800195
[13] 任雪婷, 赵涓涓, 强彦, 萨阿德·阿卜杜勒·劳夫。
联合成对学习和图像聚类的无监督肺癌亚型识别
无监督学习结合配对学习和图像聚类的肺癌亚型识别
计算机科学, 2020, 47(10): 200-206.https://doi.org/10.11896/jsjkx.190900073
[14] 陈晓军, 向阳.
S变速箱:一种改进的基于翻译模型的知识表示模型
STransH:一种改进的基于翻译的知识表示模型
计算机科学, 2019, 46(9): 184-189.https://doi.org/10.11896/j.issn.1002-137X.2019.09.026
[15] 陈深进, 薛洋.
基于改进卷积神经网络的短时公交客流预测
基于改进卷积神经网络的短期公交客流预测
计算机科学, 2019, 46(5): 175-184.https://doi.org/10.11896/j.issn.1002-137X.2019.05.027
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!