×

基于网络链接数据的高维高斯图形模型。 (英语) Zbl 1498.68249号

摘要:图形模型通常用于表示变量之间的条件依赖关系。有多种方法可用于从高维数据中探索它们,但几乎所有方法都依赖于这样的假设,即观测值是独立的,且分布相同。与此同时,通过网络连接的观测越来越普遍,并且往往违反这些假设。在这里,我们为观测值建立了一个高斯图形模型,该模型由一个具有潜在不同平均向量的网络连接而成,在网络上平滑变化。我们提出了一种有效的估计算法,并证明了其在模拟数据和实际数据上的有效性,在统计合著网络上获得了有意义和可解释的结果。我们还证明了我们的方法在网络“内聚”的假设下正确估计了协方差逆矩阵和相应的图结构,这是指经验性观察到的网络邻居共享相似特征的现象。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H22个 概率图形模型
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] Arash A Amini、Aiyou Chen、Peter J Bickel和Elizaveta Levina。大型稀疏网络中社区检测的伪似然方法。《统计年鉴》,41(4):2097-2122,2013年·Zbl 1277.62166号
[2] Onureena Banerjee、Laurent El Ghaoui和Alexandre d'Aspremont。通过多元高斯或二进制数据的稀疏最大似然估计进行模型选择。机器学习研究杂志,9(三月):485-5162008·Zbl 1225.68149号
[3] 米哈伊尔·贝尔金和帕塔·尼约吉。用于降维和数据表示的拉普拉斯特征映射。神经计算,15(6):1373-13962003·Zbl 1085.68119号
[4] N.Binkiewicz、J.T.Vogelstein和K.Rohe。协变量辅助谱聚类。生物特征,104(2):361-3772017。doi:10.1093/biomet/asx008。URL地址+http://dx.doi。org/10.1093/biomet/asx008·Zbl 1506.62319号
[5] 安德里斯·布劳沃(Andries E Brouwer)和威廉·海默斯(Willem H Haemers)。图的谱。施普林格科学与商业媒体,2011年。
[6] 尼尔·A·巴特勒。计算机实验的最佳正交拉丁超立方体设计。《生物特征》,第847-857页,2001年·Zbl 0985.62058号
[7] T Tony Cai、李洪哲、刘伟东和谢纪春。协变调整精度矩阵估计及其在遗传基因组学中的应用。生物特征,100(1):139-1562013·Zbl 1284.62648号
[8] Eric C Chi和Kenneth Lange。凸聚类的分裂方法。计算与图形统计杂志,24(4):994-10132015。
[9] 尼古拉斯·克里斯塔基斯(Nicholas A Christakis)和詹姆斯·福勒(James H Fowler)。肥胖在一个大型社交网络中的传播超过32年。新英格兰医学杂志,357(4):370-3792007。
[10] Michael B Cohen、Rasmus Kyng、Gary L Miller、Jakub W Pachocki、Richard Peng、Anup B Rao和Shen Chen Xu。在近m log 1/2 n时间内求解sdd线性系统。第46届ACM计算机理论年会论文集,343-352页。ACM,2014年·Zbl 1315.65026号
[11] Patrick Danaher、Pei Wang和Daniela M Witten。用于多类协方差逆估计的联合图形套索。英国皇家统计学会杂志:B辑(统计方法),76(2):373-3972014·Zbl 07555455号
[12] 亚历山大·达斯普雷蒙特(Alexandre d'Aspremont)、奥努雷娜·巴纳吉(Onureena Banerjee)和劳伦特·加维(Laurent El Ghaoui)。稀疏协方差选择的一阶方法。SIAM矩阵分析与应用杂志,30(1):56-662008·Zbl 1156.90423号
[13] 托马斯·爱德华兹。矩形网格的离散拉普拉斯算子,2013年。
[14] 米罗斯拉夫·菲德勒。图的代数连通性。捷克斯洛伐克数学杂志,23(2):298-3051973·Zbl 0265.05119号
[15] Jerome Friedman、Trevor Hastie和Robert Tibshirani。用图形套索进行稀疏逆协方差估计。生物统计学,9(3):432-4412008.doi:10.1093/Biostatistics/kxm045。统一资源定位地址http://biostatistics.oxfordjournals.org/content/9/3/432.摘要·兹比尔1143.62076
[16] Kayo Fujimoto和Thomas W Valente。社交网络对青少年物质使用的影响:从衔接中分离出结构对等。社会科学与医学,74(12):1952-1960,2012。
[17] Gene H Golub、Michael Heath和Grace Wahba。广义交叉验证是一种选择良好脊线参数的方法。技术计量学,21(2):215-2231979·Zbl 0461.62059号
[18] Jian Guo、Elizaveta Levina、George Michailidis和Ji Zhu。多个图形模型的联合估计。《生物特征》,第asq0602011页·Zbl 1214.62058号
[19] David Hallac、Jure Leskovec和Stephen Boyd。网络套索:大型图形中的聚类和优化。第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集,第387-396页。ACM,2015年。
[20] Dana L Haynie。重访犯罪同龄人:网络结构重要吗?《美国社会学杂志》,106(4):1013-10572001。
[21] 托比·迪伦·霍金(Toby Dylan Hocking)、阿曼德·朱林(Armand Joulin)、弗朗西斯·巴赫(Francis Bach)和珍妮·菲利佩(Jean-Philippe Vert)。聚类路径——一种使用凸融合惩罚的聚类算法。2011
[22] Cho-Jui Hsieh、M’aty as A Sustik、Inderjit S Dhillon、Pradeep K Ravikumar和Russell Poldrack。Big&quic:一百万个变量的稀疏逆协方差估计。神经信息处理系统进展,第3165-3173页,2013a。
[23] Cho Jui Hsieh、Mtys Sustik、Inderjit S.Dhillon、Pradeep Ravikumar和Russell A.Poldrack。Big&quic:一百万个变量的稀疏逆协方差估计。神经信息处理系统(NIPS),2013年12月b。
[24] Cho-Jui Hsieh、M’aty as A Sustik、Inderjit S Dhillon和Pradeep Ravikumar。Quic:稀疏逆协方差估计的二次近似。机器学习研究杂志,15(1):2911-29472014·Zbl 1319.65048号
[25] 季鹏生和金嘉顺。统计学家合著和引用网络。应用统计年鉴,10(4):1779-18122016·Zbl 1454.62541号
[26] Alexander Jung、Nguyen Tran和Alexandru Mara。网络套索什么时候准确?应用数学和统计前沿,2018年3月28日。
[27] Ioannis Koutis、Gary L Miller和Richard Peng。求解sdd线性系统的逼近最优性。计算机科学基础(FOCS),2010年第51届IEEE年会,第235-244页。IEEE,2010年。
[28] Steffen L Lauritzen。图形模型,第17卷。克拉伦登出版社,1996年·Zbl 0907.62001
[29] 李隆飞。识别和估计具有群体互动、背景因素和固定效应的计量经济模型。《计量经济学杂志》,140(2):333-3742007年·Zbl 1247.91140号
[30] 李宇龙和刘玉凤。基于惩罚高斯最大似然的同时多响应回归和逆协方差矩阵估计。多元分析杂志,111:241-2552012·Zbl 1259.62043号
[31] 朱尔·莱斯科维奇(Jure Leskovec)、阿南德·拉贾拉曼(Anand Rajaraman)和杰弗里·大卫·乌尔曼(Jeffrey David Ullman)。海量数据集的挖掘。剑桥大学出版社,2014年。
[32] 李彩燕,李洪哲。基因组数据分析的网络约束正则化和变量选择。生物信息学,24(9):1175-11822008。
[33] 李彩艳和李洪哲。图形结构协变量的变量选择和回归分析及其在基因组学中的应用。应用统计年鉴,4(3):14982010·Zbl 1202.62157号
[34] Ker-Chau Li。cl的渐近最优性和岭回归中的广义交叉验证及其在样条平滑中的应用。《统计年鉴》,第1101-1112页,1986年·Zbl 0629.62043号
[35] Tianxi Li、Sharmodeep Bhattacharyya、Purnamrita Sarkar、Peter J Bickel和Elizaveta Levina。通过递归双分区进行分层社区检测。arXiv预打印arXiv:1810.015092018。
[36] Tianxi Li、Elizaveta Levina和Ji Zhu。网络链接数据的预测模型。应用统计年鉴,13(1):132-1642019·Zbl 1417.62354号
[37] Jiahe Lin、Sumanta Basu、Moulinath Banerjee和George Michailidis。多层高斯图形模型的惩罚最大似然估计。J.马赫。学习。决议,17(1):5097-51472016年1月。ISSN 1532-4435·Zbl 1392.62155号
[38] Fredrik Lindsten、Henrik Ohlsson和Lennart Ljung。放松点,来聚一聚吧!:k-means聚类的凸化。Link–oping大学电子出版社,2011年。
[39] 刘建宇、关羽和刘玉凤。基于图的稀疏线性鉴别分析用于高维分类。《多元分析杂志》,171:250-2692019年·Zbl 1417.62173号
[40] 查尔斯·曼斯基(Charles F Manski)。内生社会效应的识别:反思问题。《经济研究评论》,60(3):531-5421993年·Zbl 0800.90377号
[41] 坎蒂五世(Kanti V Mardia)。经典多维尺度的一些性质。统计学中的传播——理论与方法,7(13):1233-12411978·Zbl 0403.62033号
[42] 尼古拉·梅恩豪森和彼得·博尔曼。高维图和用套索选择变量。《统计年鉴》,第1436-1462页,2006年·Zbl 1113.62082号
[43] 林恩·米歇尔和帕特里克·韦斯特。同龄人施压吸烟:含义取决于方法。健康教育研究,11(1):39-491996。
[44] 理查德·奥尔申和巴拉·拉贾拉特南。矩形阵列的连续归一化。统计年鉴,38(3):16382010·兹比尔1189.62109
[45] 潘玮、谢本怀和沈晓桐。将预测网络纳入惩罚回归,并应用于微阵列数据。生物统计学,66(2):474-4842010·Zbl 1192.62235号
[46] 迈克尔·皮尔逊和帕特里克·韦斯特。飘浮的烟圈。连接,25(2):59-762003。
[47] 博格丹·拉杜卡努和法迪·多尔奈卡。一种用于流形学习的有监督非线性降维方法。模式识别,45(6):2432-24442012·Zbl 1234.68345号
[48] Pradeep Ravikumar、Martin J Wainwright、Garvesh Raskutti和Bin Yu。通过最小化“1-惩罚对数决定元散度”的高维协方差估计。《电子统计杂志》,5:935-9802011年·Zbl 1274.62190号
[49] 赵仁,孙廷妮,张存辉,周哈里森,等。大高斯图形模型估计中的渐近正态性和最优性。《统计年鉴》,43(3):991-10262015·Zbl 1328.62342号
[50] Adam J Rothman、Peter J Bickel、Elizaveta Levina和Ji Zhu。稀疏置换不变协方差估计。《电子统计杂志》,2:494-5152008·Zbl 1320.62135号
[51] Adam J Rothman、Elizaveta Levina和Ji Zhu。具有协方差估计的稀疏多元回归。计算与图形统计杂志,19(4):947-9622010。
[52] Veeranjaneyulu Sadhanala、Yu Xiang Wang和Ryan J Tibshirani。拉普拉斯平滑的图稀疏化方法。《第19届国际人工智能与统计会议论文集》,第1250-1259页,2016年。
[53] 沈晓彤、黄信诚和潘伟伟。图上的同时监督聚类和特征选择。《生物统计学》,99(4):899-9142012年·Zbl 1452.62467号
[54] Ali Shojaie和George Michailidis。用于子网络分析的图的惩罚主成分回归。神经信息处理系统进展,第2155-2163页,2010年。
[55] Martin Slawski、Wolfgang zu Castell、Gerhard Tutz等。结构信息引导的特征选择。应用统计年鉴,4(2):1056-10802010·Zbl 1194.62092号
[56] 亚历山大·斯莫拉(Alexander J Smola)和里西·康多(Risi Kondor)。图的核和正则化。在学习理论和内核机器中,第144-158页。斯普林格,2003年。
[57] 丹尼尔·斯皮尔曼。拉普拉斯矩阵中的算法、图论和线性方程。《国际数学家大会议事录》,第4卷,第2698-2722页,2010年·兹比尔1241.65033
[58] 孙和坤,林伟,冯锐,李洪哲。用于基因组数据分析的网络化高维cox回归。中国统计局,24(3):14332014·Zbl 06431838号
[59] Kean Ming Tan和Daniela Witten。凸聚类的统计特性。电子统计杂志,9(2):23242015·兹比尔1336.62193
[60] Minh Tang、Daniel L Sussman和Carey E Priebe。潜在位置图的普遍一致的顶点分类。《统计年鉴》,41(3):1406-14302013·Zbl 1273.62147号
[61] 罗伯特·提比拉尼(Robert Tibshirani)。通过套索回归收缩和选择。英国皇家统计学会杂志。B系列(方法学),第267-288页,1996年·Zbl 0850.62538号
[62] Robert Tibshirani、Guenther Walther和Trevor Hastie。通过间隙统计估计数据集中的簇数。英国皇家统计学会杂志:B辑(统计方法),63(2):411-4232001·Zbl 0979.62046号
[63] Robert Tibshirani、Michael Saunders、Saharon Rosset、Ji Zhu和Keith Knight。通过融合套索实现轻盈流畅。英国皇家统计学会杂志:B辑(统计方法),67(1):91-1082005·Zbl 1060.62049号
[64] 阮Tran、Henrik Ambos和Alexander Jung。复杂网络上压缩感知的网络兼容性条件。2018年IEEE统计信号处理研讨会(SSP),第50-54页。IEEE,2018年。
[65] Elif Vural和Christine Guillemot。用于分类的监督流形学习的样本外推广。IEEE图像处理汇刊,25(3):1410-14242016·Zbl 1408.94664号
[66] 马丁·温赖特。使用l1约束二次规划实现高维和噪声稀疏恢复的锐化阈值。IEEE信息理论汇刊,2009年。
[67] 王玉祥、詹姆斯·夏普纳克、亚历克斯·斯莫拉和瑞安·提比西拉尼。图形趋势过滤。arXiv预打印arXiv:1410.76902014。
[68] Daniela M Witten、Jerome H Friedman和Noah Simon。图形套索的新见解和更快的计算。计算与图形统计杂志,20(4):892-9002011。
[69] Daniela M Witten、Ali Shojaie和Fan Zhang。用于未知变量分组的高维回归的簇弹性网。技术计量学,56(1):112-1222014。
[70] Jaewon Yang、Julian McAuley和Jure Leskovec。具有节点属性的网络中的社区检测。2013年IEEE第13届数据挖掘国际会议,第1151-1156页。IEEE,2013年。
[71] 杨万口、孙长银和张磊。一种用于图像特征提取的多流形判别分析方法。模式识别,44(8):1649-16572011·Zbl 1218.68158号
[72] 尹建新和李洪哲。遗传基因组数据分析的稀疏条件高斯图形模型。应用统计年鉴,5(4):2630,2011·Zbl 1234.62151号
[73] 殷建新,李洪哲。通过'1-幂级数对稀疏精度矩阵估计中的高维协变量进行调整。《多元分析杂志》,116:365-3812013年·Zbl 1277.62146号
[74] 袁明,林毅。分组变量回归中的模型选择和估计。英国皇家统计学会杂志:B辑(统计方法),68(1):49-672006·Zbl 1141.62030号
[75] Ming Yuan和Yi Lin。高斯图形模型中的模型选择和估计。《生物特征》,94(1):19-352007·Zbl 1142.62408号
[76] 赵森和阿里·肖杰。图形约束估计的显著性检验。生物统计学,72(2):484-4932016·Zbl 1419.62493号
[77] 赵拓、刘韩、凯瑟琳·罗德、约翰·拉弗蒂和拉里·瓦瑟曼。高维无向图估计的庞大软件包,收录于《机器学习研究杂志》,13(4月):1059-10622012·Zbl 1283.68311号
[78] 周登勇(Dengyong Zhou)、黄嘉源(Jiayuan Huang)和Bernhard Sch¨olkopf。从有向图上标记和未标记的数据中学习。《第22届机器学习国际会议论文集》,第1036-1043页。ACM,2005年。
[79] 周书恒、约翰·拉弗蒂和拉里·瓦瑟曼。时变无向图。机器学习,80(2-3):295-3192010·Zbl 1475.62174号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。