×

通过子图采样估计图中连接组件的数量。 (英语) Zbl 1440.62043号

为了估计图的性质,对某一组顶点进行采样,其中考虑了不同的采样模型,例如均匀采样模型和贝努利采样模型。然后检查诱导子图,可以获得有关所考虑的图的信息。这里,这种统计方法用于估计图的连通分量的数量,例如用于估计网络的连通性。Minimax风险估计量特别适用于弦图和森林、团。基于图的参数,工作的主要结果涉及最小样本量,以达到所获得估计的给定精度。

MSC公司:

62D05型 抽样理论、抽样调查
05C90年 图论的应用
62C20个 统计决策理论中的Minimax过程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aliakbarpour,M.、Shankha Biswas,A.、Gouleakis,T.、Peebles,J.、Rubinfeld,R.和Yodpinyanee,A.(2018年)。通过边缘采样计算星型子图的子线性时间算法。算法80 668-697·Zbl 1391.68120号
[2] Bandiera,O.和Rasul,I.(2006年)。莫桑比克北部的社交网络和技术采用。经济。期刊116 869-902。
[3] Ben-Hamou,A.、Oliveira,R.I.和Peres,Y.(2018年)。通过重新启动的随机行走估计图形参数。第二十届ACM-SIAM离散算法研讨会论文集1702-1714。宾夕法尼亚州费城:SIAM·Zbl 1403.05139号
[4] Berenbrink,P.、Krayenhoff,B.和Mallmann-Trenn,F.(2014)。估计次线性时间内连接组件的数量。通知。过程。莱特。114 639-642. ·Zbl 1371.68104号
[5] Abramowitz,M.和Stegun,I.A.(编辑)(1992年)。数学函数手册,包括公式、图形和数学表。纽约:多佛·Zbl 0171.38503号
[6] Borgs,C.、Chayes,J.T.、Lovász,L.、SóS,V.T.和Vestergombi,K.(2008)。稠密图的收敛序列。I.子图频率、度量属性和测试。高级数学。219 1801-1851. ·Zbl 1213.05161号
[7] Capobianco,M.(1972年)。估计图的连通性。《图论与应用》(密歇根州卡拉马祖市西密歇根大学Proc.Conf.,1972;纪念J.W.T.Youngs)数学课堂讲稿。303 65-74. ·Zbl 0248.05133号
[8] Chandrasekhar,A.和Lewis,R.(2011)。抽样网络的计量经济学。未出版的手稿。
[9] Chazelle,B.、Rubinfeld,R.和Trevisan,L.(2005)。在次线性时间内近似最小生成树权重。SIAM J.计算。34 1370-1379. ·Zbl 1081.68120号
[10] Chen,B.、Shrivastava,A.和Steorts,R.C.(2018年)。独特的实体评估,适用于叙利亚冲突。附录申请。统计数字12 1039-1067·Zbl 1405.62238号
[11] Conley,T.G.和Udry,C.R.(2010年)。了解一项新技术:加纳的菠萝。美国经济。修订版100 35-69。
[12] Apicella,C.L.、Marlowe,F.W.、Fowler,J.H.和Christakis,N.A.(2012年)。狩猎采集者的社交网络和合作。自然481 497-501。
[13] Cormode,G.和Duffield,N.(2014年)。大数据采样:教程。1975-1975年第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集。ACM公司。
[14] Dohmen,K.(2013)。通过弦图的并集概率的下限。电子。Commun公司。普罗巴伯。18编号70,4·Zbl 1349.60007号
[15] Eden,T.、Levi,A.、Ron,D.和Seshadhri,C.(2015)。近似计算次线性时间内的三角形数。2015年IEEE第56届计算机科学基础年度研讨会-FOCS 2015 614-633。加利福尼亚州洛斯阿拉米托斯:IEEE计算机协会·Zbl 1380.68445号
[16] Erdõs,P.、Lovász,L.和Spencer,J.(1979年)。图形复制功能的强大独立性。在图论和相关主题(Proc.Conf.,Univ.Waterloo,Waterlou,Ont.,1977)165-172。纽约:学术出版社·Zbl 0462.05057号
[17] Erdős,P.和Rényi,A.(1960)。关于随机图的演化。马吉。周二。阿卡德。马特·库特。国际。科兹尔。5 17-61. ·Zbl 0103.16301号
[18] Fafchamps,M.和Lund,S.(2003年)。菲律宾农村风险分担网络。J.发展经济学。71 261-287.
[19] Leskovec,J.和Faloutsos,C.(2006年)。从大图形中采样。第十二届ACM SIGKDD知识发现和数据挖掘国际会议论文集631-636。纽约:ACM。
[20] Feigenberg,B.、Field,E.M.和Pande,R.(2010年)。国家经济研究局《通过小额信贷建设社会资本技术报告》。
[21] Frank,O.(1977年)。图形总数的估计。扫描。《美国联邦法律大全》第4卷第81-89页·Zbl 0358.62008号
[22] Frank,O.(1978年)。使用采样子图估计图中连接组件的数量。扫描。《美国联邦法律大全》第5卷第177-188页·Zbl 0391.05049号
[23] Gao,C.、Lu,Y.和Zhou,H.H.(2015)。速率最优图形估计。安。统计师。43 2624-2652. ·Zbl 1332.60050号
[24] Goldreich,O.(2017)。性能测试简介。剑桥:剑桥大学出版社·Zbl 06797790号
[25] Goldreich,O.、Goldwasser,S.和Ron,D.(1998)。属性测试及其与学习和近似的联系。美国医学会期刊45 653-750·Zbl 1065.68575号
[26] Goldreich,O.和Ron,D.(2008)。图的平均参数的近似。随机结构算法32 473-493·Zbl 1155.05057号
[27] Goldreich,O.和Ron,D.(2011年)。关于有界度图的测试展开。复杂性和密码学研究。计算机科学课堂讲稿6650 68-75。海德堡:施普林格·Zbl 1343.68302号
[28] Goodman,L.A.(1949年)。关于人口中阶级数量的估计。安。数学。《美国联邦法律大全》第20卷第572-579页·Zbl 0035.09102号
[29] Goodman,L.A.(1961年)。雪球采样。安。数学。《法律总汇》第32卷第148-170页·Zbl 0099.14203号
[30] Govindan,R.和Tangmunarunkit,H.(2000)。互联网地图发现的启发式。在INFOCOM 2000中。IEEE计算机和通信协会第十九届年度联合会议。诉讼程序。IEEE 3 1371-1380。电气与电子工程师协会。
[31] Handcock,M.S.和Gile,K.J.(2010年)。根据采样数据对社交网络进行建模。附录申请。统计数据4 5-25·Zbl 1189.62187号
[32] Holland,P.W.、Laskey,K.B.和Leinhardt,S.(1983年)。随机块模型:第一步。Soc.网络。5 109-137.
[33] Holland,P.W.和Leinhardt,S.(1981)。有向图的概率分布的指数族。J.Amer。统计师。协会76 33-65·Zbl 0457.62090号
[34] 霍维茨,D.G.和汤普森,D.J.(1952)。从有限宇宙中不替换抽样的推广。J.Amer。统计师。协会47 663-685·Zbl 0047.38301号
[35] 图表:网络分析和可视化,2019年。https://cran.r-project.org/web/packages/igraph。
[36] Janson,S.(2004)。部分相依随机变量和的大偏差。随机结构算法24 234-248·Zbl 1044.60021号
[37] Klusowski,J.M.和Wu,Y.(2018年)。用图形采样计算图案。在第31届学习理论大会论文集(S.Bubeck,V.Perchet和P.Rigollet编辑)。机器学习研究论文集75 1966-2011。PMLR,2018年6月9日。
[38] Klusowski,J.M.和Wu,Y.(2020年)。补充“通过子图采样估计图中连接组件的数量”https://doi.org/10.3150/19-BEJ1147SUPP。 ·Zbl 1440.62043号
[39] Kocay,W.L.(1982)。重建理论中的一些新方法。组合数学,IX(布里斯班,1981)。数学课堂笔记。952 89-114. 柏林:斯普林格·兹比尔0502.05043
[40] Kolaczyk,E.D.(2009年)。网络数据的统计分析:方法和模型。统计学中的斯普林格系列。纽约:斯普林格·Zbl 1277.62021号
[41] Kolaczyk,E.D.(2017年)。统计学和网络分析前沿课题。SemStat元素。剑桥:剑桥大学出版社。(再次)参观基金会·Zbl 1398.62005号
[42] Leskovec,J.和Krevl,A.(2014)。SNAP数据集:斯坦福大学大型网络数据集收集。http://snap.stanford.edu/data/ca-CondMat.html。
[43] Lovász,L.(2012)。大型网络和图形限制。美国数学学会学术讨论会出版物60。罗得岛普罗维登斯:美国。数学。Soc公司·Zbl 1292.05001号
[44] Luce,R.D.和Perry,A.D.(1949年)。一种对群体结构进行矩阵分析的方法。《心理测量学》14 95-116。
[45] McKay,B.D.和Radziszowski,S.P.(1997年)。子图计数恒等式和拉姆齐数。J.组合理论系列。B 69 193-209年·Zbl 0869.05043号
[46] McMahon,E.W.,Shimkus,B.A.和Wolfson,J.A.(2003年)。弦图和特征多项式。离散数学。262 211-219. ·Zbl 1017.05059号
[47] Natanzon,A.、Shamir,R.和Sharan,R.(2000)。最小填充问题的多项式近似算法。SIAM J.计算。30 1067-1079. ·Zbl 0969.68194号
[48] O'Donnell,R.(2014)。布尔函数分析。纽约:剑桥大学出版社·兹比尔1336.94096
[49] Orlitsky,A.、Suresh,A.T.和Wu,Y.(2016)。未知物种数量的最佳预测。程序。国家。阿卡德。科学。美国113 13283-13288·Zbl 1407.62409号
[50] Polyanskiy,Y.、Theertha Suresh,A.和Wu,Y.(2017年)。种群恢复的样本复杂性。学习理论会议论文集(COLT)。荷兰阿姆斯特丹。可从arXiv:1702.05574获取。
[51] Reingen,P.H.和Kernan,J.B.(1986年)。营销中的推荐网络分析:方法和说明。《马克研究杂志》第370-378页。
[52] Rose,D.J.、Tarjan,R.E.和Lueker,G.S.(1976年)。图上顶点消除的算法方面。SIAM J.计算。5 266-283. ·兹比尔0353.65019
[53] Rual,J.-F.,Venkatesan,K.,Hao,T.,Hirozane-Kishikawa,T.、C.、。,Lamesch,P.、Sikorski,R.S.、Vandenhaute,J.、Zoghbi,H.Y.、Smolyar,A.、Bosak,S.、Sequerra,R.、Doucette-Stamm,L.、Cusick,M.E.、Hill,D.E.、Roth,F.P.和Vidal,M.(2005)。人类蛋白质相互作用网络的蛋白质尺度图。《自然》437 1173-1178。
[54] M.J.Salganik和D.D.Heckathorn(2004年)。使用响应驱动抽样在隐藏人群中进行抽样和估计。社会学。方法。34 193-240.
[55] Stumpf,M.P.H.、Thorne,T.、de Silva,E.、Stewart,R.、Jun An,H.、Lappe,M.和Wiuf,C.(2008年)。估计人类相互作用体的大小。程序。国家。阿卡德。科学。美国105 6959-6964。
[56] Tarjan,R.E.和Yannakakis,M.(1984年)。简单的线性时间算法用于测试图的chordality,测试超图的无圈性,并有选择地减少无圈超图。SIAM J.计算。13 566-579. ·Zbl 0545.68062号
[57] Tsybakov,A.B.(2009年)。非参数估计简介。统计学中的斯普林格系列。纽约:斯普林格。对2004年法文原版进行修订和扩充,弗拉基米尔·扎亚茨翻译·Zbl 1176.62032号
[58] West,D.B.(1996)。图论导论。新泽西州上鞍河:普伦蒂斯·霍尔公司·Zbl 0845.05001号
[59] Whitney,H.(1932年)。图的着色。数学年鉴。(2) 33 688-718. ·JFM 58.0606.01标准
[60] Wu,Y.和Yang,P.(2016)。离散元素问题的样本复杂性。预印。可从arXiv:1612.03375获取。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。