研究论文

学者2vec：学者终身合作者预测的向量表示

作者：
王伟（音译）

大连理工大学和中国澳门大学

大连理工大学和中国澳门大学
查看个人资料

,
冯霞

澳大利亚联邦大学和大连理工大学

澳大利亚联邦大学和大连理工大学

0000-0002-8324-1859
查看个人资料

,
吴健

欧道明大学

欧道明大学
查看个人资料

,
致国功

中国澳门澳门大学

中国澳门澳门大学
查看个人资料

,
航空通

伊利诺伊大学香槟分校

伊利诺伊大学香槟分校
查看个人资料

,
布莱恩·戴维森

宾夕法尼亚州伯利恒利海大学

宾夕法尼亚州伯利恒利海大学

0000-0002-9326-3648
查看个人资料

作者信息和声明

ACM数据知识发现事务第15卷第3版条款编号：40第1-19页https://doi.org/10.1145/3442199

出版：2021年4月21日出版历史

ACM数据知识发现事务

摘要

虽然科学合作对学者来说至关重要，但一些合作者可能比其他人更重要，例如终身合作者。研究表明，终身合作者对学者的学术表现影响更大。然而，对于学术网络中预测这种特殊关系的研究却很少。为此，我们提出了Scholar2vec，一种用于表示学者简介的新型神经网络嵌入。首先，我们的方法从文本信息创建学者的研究兴趣向量，如人口统计、研究和影响。在将研究兴趣与协作网络联系起来之后，可以通过图学习获得学者的向量表示。同时，由于学者被各种属性占据，我们建议合并四种类型的学者属性来学习学者向量。最后，利用基于Scholar2vec的早期相似序列，利用机器学习方法预测终身合作者。对两个真实数据集的大量实验表明，Scholar2vec在寿命合作者预测方面优于最先进的方法。我们的工作提出了一种通过向量表示来衡量两位学者之间相似性的新方法，该方法处理了网络嵌入和学术关系挖掘之间的知识。

工具书类

伊布、达科塔·S·穆雷、丁英、黄勇和赵一鸣。2018年，衡量科学合作的稳定性。《科学计量学》114，2（2018），463–479。谷歌学者数字图书馆
陈洪勋（Hung-Hsuan Chen）、梁构（Liang Gou）、张小龙（Xiaolong Zhang）和克莱德·李·贾尔斯（Clyde Lee Giles）。2011年，Collabseer：用于协作发现的搜索引擎。第11届国际ACM/IEEE数字图书馆联合会议论文集。ACM，231–240。谷歌学者数字图书馆
陈田琪（Tianqi Chen）和卡洛斯·盖斯特林（Carlos Guestrin），2016年。Xgboost：一个可扩展的树增强系统。第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会，785–794。谷歌学者数字图书馆
马里奥·科奇亚和莉莉·旺克。2016年，国际科学合作模式的演变和趋同。《美国国家科学院院刊》113，18（2016），E2547。谷歌学者交叉引用
雅各布·德夫林（Jacob Devlin）、张明伟（Ming Wei Chang）、肯顿·李（Kenton Lee）和克里斯蒂娜·图塔诺娃（Kristina Toutanova）。2018.BERT：深度双向变形金刚语言理解预培训。计算语言学协会北美分会2019年会议记录：人类语言技术，第1卷（长篇和短篇论文）。计算语言学协会，4171–4186。谷歌学者
董玉霄（Yuxiao Dong）、尼特斯·查拉（Nitesh V.Chawla）和阿南特拉姆·斯瓦米（Ananthram Swami）。2017年，metapath2vec：异构网络的可扩展表示学习。第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM，135–144。谷歌学者数字图书馆
Soumyajit Ganguly和Vikram Pudi。2017.论文2vec：结合图形和文本信息进行科学论文表示。《欧洲信息检索会议记录》。施普林格，383–395。谷歌学者交叉引用
尤夫·戈德堡和奥马尔·利维。2014年，word2vec解释道：衍生Mikolov等人s负采样字嵌入方法。arXiv:1402.3722。检索自https://arxiv.org/abs/1402.3722。谷歌学者
帕拉什·戈亚尔和埃米利奥·费拉拉。2018年。图形嵌入技术、应用和性能：调查。基于知识的系统151（2018），78–94。谷歌学者交叉引用
Aditya Grover和Jure Leskovec。2016.node2vec：网络可扩展特性学习。第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会，855–864。谷歌学者数字图书馆
威尔·汉密尔顿（Will Hamilton）、应志涛（Zhitao Ying）和朱尔·莱斯科维奇（Jure Leskovec）。2017.大图形的归纳表示学习。在第31届神经信息处理系统会议记录中。1024–1034.谷歌学者
小黄，李俊东，夏虎，2017。加速属性化网络嵌入。2017年SIAM数据挖掘国际会议论文集。暹罗，633–641。谷歌学者交叉引用
孔祥杰、蒋慧珍、王伟、Teshome Megersa Bekele、徐珍珍和王萌。2017年。探索科学合作者推荐的动态研究兴趣和学术影响。科学计量学113，1（2017），369–385。谷歌学者数字图书馆
孔祥杰、毛梦怡、王伟、刘嘉英和徐波。2018年，VOPRec：带文本信息和结构标识的论文向量表示学习，以供推荐。IEEE计算新兴主题汇刊（2018），1-13。内政部：https://doi.org/10.109/TETC.2018.2830698谷歌学者
Quoc Le和Tomas Mikolov。2014.句子和文件的分布式表示。第31届机器学习国际会议论文集。1188–1196.谷歌学者
李俊东（Jundong Li）、哈什·达尼（Harsh Dani）、夏虎（Xia Hu）、汤继良（Jiliang Tang）、伊昌（Yi Chang）和刘欢（Huan Liu）。2017.在动态环境中学习的归因网络嵌入。2017年ACM信息和知识管理会议记录。美国医学会，387-396。谷歌学者数字图书馆
廖明辉、石宝光、白翔、王兴刚、刘文宇。2017.文本框：带有单个深度神经网络的快速文本检测器。第31届AAAI人工智能会议论文集。AAAI，4161–4167。谷歌学者
刘嘉英、任静、郑文清、池莲花、李伊凡和冯霞。2020年。学者网络：学者知识图表。第43届国际ACM SIGIR信息检索研究与开发会议论文集。谷歌学者数字图书馆
林元吕和陶周。2011.复杂网络中的链接预测：一项调查。《物理学A：统计力学及其应用》390，6（2011），1150–1170。谷歌学者交叉引用
维科特·马丁内斯（Víctor Martínez）、费尔南多·贝扎尔（Fernando Berzal）和胡安·卡洛斯·库贝罗（Juan-Carlos Cubero）。2017年，复杂网络链接预测调查。ACM计算调查49，4（2017），69。谷歌学者数字图书馆
托马斯·米科洛夫（Tomas Mikolov）、陈凯（Kai Chen）、格雷格·科拉多（Greg Corrado）和杰弗里·迪恩（Jeffrey Dean）。2013.向量空间中单词表示的有效估计。在第一届学习代表国际会议记录中。谷歌学者
亨利·纳瓦罗（Henry Navarro）、乔瓦娜·米里特罗（Giovanna Miritello）、阿图罗·卡纳莱斯（Arturo Canales）和埃斯特班·莫罗（Esteban Moro）。2017年。持久联系强度背后的时间模式。EPJ数据科学6，1（2017），31。谷歌学者交叉引用
马克·E·J·纽曼。2001.科学合作网络的结构。《美国国家科学院院刊》98，2（2001），404-409。谷歌学者交叉引用
马克·E·J·纽曼。2004年，合作网络和科学合作模式。《美国国家科学院院刊》101，增刊1（2004），5200-5205。谷歌学者交叉引用
Joshua O'Madadhain、Jon Hutchins和Padhraic Smyth。2005.基于事件的网络数据的预测和排名算法。ACM SIGKDD探索通讯7，2（2005），23-30。谷歌学者数字图书馆
潘石蕊、贾武、朱星泉、张成琦和杨旺。2016年，三党深度网络代表。网络11，9（2016），12。谷歌学者
费比安·佩德雷戈萨（Fabian Pedregosa）、加尔·瓦洛奎（Gaöl Varoqueux）、亚历山大·格兰福特（Alexandre Gramfort）、文森特·米歇尔（Vincent Michel）、伯特兰·蒂里昂（Bertrand Thirion）、奥利维尔·格里塞尔（Olivier Grisel）、马蒂厄·布隆德尔（Mathieu Blondel）、彼得·普雷滕霍弗（Peter Prettenhofer）、罗恩·维斯（Ron Weiss）、文。2011.Scikit-learn：Python中的机器学习。《机器学习研究杂志》12，1（2011），2825-2830。谷歌学者数字图书馆
杰弗里·彭宁顿（Jeffrey Pennington）、理查德·索彻（Richard Socher）和克里斯托弗·曼宁（Christopher Manning）。2014.GlobVe：单词表示的全球向量。《2014年自然语言处理实证方法会议论文集》。1532–1543.谷歌学者交叉引用
布莱恩·佩罗齐（Bryan Perozzi）、拉米·阿尔罗福（Rami Al-Rfou）和史蒂文·斯基纳（Steven Skiena）。2014.Deepwalk：社交表征的在线学习。第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM，701-710。谷歌学者数字图书馆
马修·彼得斯、马克·诺依曼、莫希特·伊耶、马特·加德纳、克里斯托弗·克拉克、肯顿·李和卢克·泽特莫耶。2018.深层语境化的词语表达。计算语言学协会北美分会2018年会议记录：人类语言技术。第1卷（长篇论文）。计算语言学协会，2227-2237。谷歌学者交叉引用
亚历山大·迈克尔·彼得森。2015年，量化弱联系、强联系和超级联系对科学职业的影响。《美国国家科学院院刊》112，34（2015），E4671–E4680。谷歌学者交叉引用
贾里·萨兰梅基（Jari Saramäki）、米科·基维尔（Mikko Kivelä）、朱卡·佩卡·昂内拉（Jukka-Pekka Onnela）、金莫·卡斯基（Kimmo Kaski）和贾诺斯·科特斯（Janos Kertesz）。2007.将聚类系数推广到加权复杂网络。《物理评论》E 75，2（2007），027105。谷歌学者交叉引用
拉梅什·R·萨鲁凯。2000.使用马尔可夫链进行链路预测和路径分析。计算机网络33，1-6（2000），377-386。谷歌学者数字图书馆
罗伯塔·西纳特拉（Roberta Sinatra）、王大顺（Dashun Wang）、皮埃尔·德维尔（Pierre Deville）、宋朝明（Chaoming Song）和阿尔伯特·拉什洛·巴拉巴西（Albert LászlóBarabási）。2016.量化个人科学影响的演变。《科学》3546312（2016），aaf5239。谷歌学者
戴安·桑纳瓦尔德（Diane H.Sonnenwald）。2007年，科学合作。《信息科学与技术年度评论》41，1（2007），643–681。谷歌学者交叉引用
唐健、曲萌、王明哲、张明、闫军和梅巧珠。2015年。线路：大规模信息网络嵌入。第24届万维网国际会议论文集。国际万维网会议指导委员会，1067–1077。谷歌学者数字图书馆
唐杰（Jie Tang）、吴森（Sen Wu）、孙继萌（Jimeng Sun）和苏杭（Hang Su），2012年。跨域协作建议。第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会，1285-1293年。谷歌学者数字图书馆
韩天和韩奎卓。2017.论文2vec：基于引文的文献分布式表示，用于学者推荐。arXiv:1703.06587。检索自https://arxiv.org/abs/1703.06587。谷歌学者
蔡春华（Chun Hua Tsai）和林玉茹（Yu Ru Lin），2016年。追踪和预测初级学者的合作。在万维网上第25届国际会议指南的会议记录中。国际万维网会议指导委员会，375–380。谷歌学者数字图书馆
王伟（Wei Wang）、任静（Jing Ren）、穆巴拉克（Mubarak Alrashoud）、冯霞（Feng Xia）、毛梦一（Mengyi Mao）和阿穆尔·托尔巴（Amr Tolba）。2020年。可持续科学合作中的早期互惠。《信息计量学杂志》14，3（2020），101041。谷歌学者交叉引用
王伟、万良田、孔祥杰、龚志国、冯霞。2019.并非每对夫妇都是一对：一种有监督的终身合作者鉴定方法。2019年亚太信息系统会议记录。1–8.谷歌学者
王伟、徐波、刘嘉英、崔子欣、俞朔、孔祥杰和冯霞。2019.CSTeller：基于极端梯度推进预测科学合作的可持续性。万维网22，6（2019），2749–2770。内政部：https://doi.org/10.1007/s11280-019-00703-y谷歌学者交叉引用
王伟（Wei Wang）、俞朔（Shuo Yu）、梅格萨·贝克勒（Teshome Megersa Bekele）、孔祥杰（Xiangjie Kong）和冯霞（Feng Xia）。2017年，科学合作模式因学者的学术年龄而异。《科学计量学》112，1（2017），329–343。谷歌学者数字图书馆
冯霞、陈震、王伟、李静和杨劳伦斯。2014.MVCWalker：基于随机行走的最有价值合作者推荐，利用学术因素。IEEE计算机新兴主题汇刊2，3（2014），364–375。谷歌学者交叉引用
冯霞、刘嘉英、聂汉松、傅永浩、万良田、孔祥杰。2020年。随机行走：算法和应用综述。IEEE计算智能新兴主题汇刊4，2（2020），95-107。谷歌学者交叉引用
冯霞、刘嘉英、任静、王伟和孔祥杰。2020年，图灵数字：你离A.M.图灵奖还有多远？ACM SIGWEB新闻稿（2020年11月），第5条。内政部：https://doi.org/10.1145/3427478.3427483谷歌学者
Feng Xia、Wei Wang、Teshome Megersa Bekele和Huan Liu。2017年，学术大数据：一项调查。IEEE大数据汇刊PP，99（2017），1-19。谷歌学者
程阳、刘志远、赵德利、孙茂松和爱德华·Y·张。2015年。利用丰富的文本信息进行网络表征学习。第24届国际人工智能联合会议记录。2111–2117.谷歌学者
杨德建、王森章、李朝卓、张晓明和李周军，2017年。从属性到链接：不完全图上的深层网络嵌入。2017年ACM信息和知识管理会议记录。美国医学会，367–376。谷歌学者数字图书馆
杨再翰（Zaihan Yang）、尹大伟（Dawei Yin）和布莱恩·戴维森（Brian D.Davison）。2014年，学术界建议：联合多关系模式。《IEEE/ACM社会网络分析和挖掘进展国际会议论文集》。566–571.谷歌学者
张晨伟、易步、丁莹和徐健。2018年。理解科学合作：同质性、及物性和优先依恋。《信息科学与技术协会杂志》69，1（2018），72-86。谷歌学者数字图书馆
张道坤、尹洁、朱星泉和张成琦。2019.通过子空间发现的属性网络嵌入。数据挖掘和知识发现33，6（2019），1953-1980。谷歌学者数字图书馆
邢洲、丁立新、李兆奎和万润泽。2017.使用随机漫步的异构书目网络中的合作者推荐。信息检索期刊20，4（2017），317–337。谷歌学者数字图书馆

索引术语

学者2vec：学者终身合作者预测的向量表示
1. 计算方法
  1. 人工智能
2. 信息系统
  1. 信息检索
    1. 检索模型和排名
      1. 学习排名

建议

用于学术关系挖掘的属性协作网络嵌入

为科学数字图书馆中的学者找到高效和有效的定量表示一直是研究的重点。空前数量的学术数据集，加上当代机器学习和大数据。。。
阅读更多信息
场馆主题模型——学术大数据引文推荐的增强联合图建模
低资源自然语言处理深度学习专刊，第一部分和常规论文

自然语言处理技术，如主题模型，已被证明对于具有处理内容信息能力的学术推荐任务是有效的。最近，场馆推荐变得越来越重要。。。
阅读更多信息
科学合作模式因学者的学术年龄而异

科学家在整个职业生涯中可能会遇到许多不同学术年龄的合作者。因此，他们需要做出必要的决定来开始或结束创造性合作关系。这一过程可能受到战略动机的影响。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

发布于

ACM数据知识发现事务第15卷第3期
2021年6月
533页
国际标准编号：1556-4681年
EISSN公司：1556-472倍
内政部：10.1145/3454120
期刊目录

版权所有©2021计算机协会。
允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用，但不收取任何费用，前提是复制品的制作或分发不是为了盈利或商业利益，并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表，需要事先获得特定许可和/或收取费用。从请求权限[电子邮件保护].
发起人
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2021年4月21日
- 修订过的：2020年12月1日
- 认可的：2020年12月1日
- 收到：2019年9月1日
发布于tkdd公司第15卷第3期

权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
网络嵌入
学术信息检索
科学合作
图形学习
限定符
- 研究论文
- 推荐
会议
资金来源
其他指标
查看文章指标

文章指标
- 2
  引文总数
  查看引文
- 344
  总下载次数
- 下载次数（过去12个月）81
- 下载次数（最近6周）三
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

HTML格式

以HTML格式查看本文。

查看HTML格式

学者2vec：学者终身合作者预测的向量表示

ACM数据知识发现事务

摘要

工具书类

引用人

索引术语

建议

用于学术关系挖掘的属性协作网络嵌入

场馆主题模型——学术大数据引文推荐的增强联合图建模

科学合作模式因学者的学术年龄而异

评论

登录选项

完全访问权限

发布于

发起人

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

HTML格式

解说词

学者2vec：学者终身合作者预测的向量表示

ACM数据知识发现事务

摘要

工具书类

引用人

索引术语

建议

用于学术关系挖掘的属性协作网络嵌入

场馆主题模型——学术大数据引文推荐的增强联合图建模

科学合作模式因学者的学术年龄而异

评论

登录选项

完全访问权限

发布于

发起人

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

HTML格式

共享此出版物链接

在社交媒体上分享