×

稀疏排列数据的线性回归。 (英语) Zbl 1416.62398号

本文考虑回归分析中稀疏排列数据的情况,其中预测因子的标识符(或响应的等价标识符)受到未知排列的影响,使得一小部分数据受到响应和预测因子不匹配的影响。它将排列数据视为异常值,这促使使用稳健的回归公式来估计回归参数。所得估计值随后用于恢复排列。给出了两个数值实验的结果。

MSC公司:

62J05型 线性回归;混合模型
62层35 鲁棒性和自适应程序(参数推断)
90立方厘米 整数编程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] [1] ,IBM ILOG CPLEX Optimization Studio。http://www.ibm.com/us-en-marketplace/ibm-ilog-cplex。
[2] [2] ,UCI机器学习库。https://archive.ics.uci.edu/ml/datasets.html。
[3] A.Abid、A.Poon和J.Zou,《标签混乱的线性回归》。arXiv:1705.013422017年。
[4] R.Adler和J.Taylor,《随机场和几何》,Springer出版社,2007年·Zbl 1149.60003号
[5] 白志浩,邢德华,断裂样本问题,概率论及其相关领域,131(2005),第528-552页·Zbl 1062.62041号 ·doi:10.1007/s00440-004-0384-5
[6] R.Baraniuk、M.Davenport、R.DeVore和M.Wakin,随机矩阵限制等距性的简单证明,构造逼近,28(2006),第253-263页·Zbl 1177.15015号 ·文件编号:10.1007/s00365-007-9003-x
[7] A.Belloni、V.Chernozhukov和L.Wang,《平方根套索:通过圆锥编程实现稀疏信号的枢轴恢复》,《生物统计学》,98(2011),第791-806页·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[8] D.Bertsimas、A.King和R.Mazumder,通过现代优化透镜选择最佳子集,《统计年鉴》,44(2016),第813-852页·Zbl 1335.62115号 ·doi:10.1214/15-AOS1388
[9] D.Bertsimas和R.Mazumder,通过现代优化实现最小分位数回归,《统计年鉴》,42(2014),第2494-2525页·Zbl 1302.62154号 ·doi:10.1214/14-AOS1223
[10] P.Bickel、Y.Ritov和A.Tsybakov,《Lasso和Dantzig选择器的同步分析》,《统计年鉴》,37(2009),第1705-1732页·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[11] M.Bohensky,《数据链接的方法学发展》,John Wiley&Sons,Ltd,2015,ch.数据链接研究中的偏见。
[12] S.Boucheron、G.Lugosi和P.Massart,《集中不等式:独立性的非渐近理论》,牛津大学出版社,2013年·Zbl 1279.60005号
[13] R.Burkard、M.Dell’Amico和S.Martello,《分配问题:修订重印》,SIAM,2009年·Zbl 1196.90002号
[14] T.Cai、T.Liang和A.Rakhlin,一般高维线性反问题的几何推断,《统计学年鉴》,44(2016),第1536-1563页·Zbl 1357.62235号 ·doi:10.1214/15-AOS1426
[15] E.Candes和T.Tao,线性规划解码,IEEE信息理论汇刊,51(2005),第4203-4215页·Zbl 1264.94121号 ·doi:10.1109/TIT.2005.858979
[16] H.-P.Chan和W.-L.Loh,DeGroot和Goel的文件链接问题,《中国统计》,11(2001),第1031-1045页·Zbl 0984.62039号
[17] V.Chandrasekaran、B.Recht、P.Parrilo和A.Willsky,线性反问题的凸几何,计算数学基础,12(2012),第805-849页·Zbl 1280.52008年 ·doi:10.1007/s10208-012-9135-7
[18] O.Collier和A.Dalalyan,《特征匹配置换估计中的最小最大速率》,《机器学习研究杂志》,17(2016),第1-31页·Zbl 1360.62262号
[19] S.DasGupta,Johnson和Lindenstrauss定理的初等证明,随机结构和算法,22(2003),第60-65页·Zbl 1018.51010号 ·doi:10.1002/rs.10073
[20] P.David、D.Dementhon、R.Duraiswami和H.Samet,《Softposit:同时姿势和对应确定》,国际计算机杂志。《愿景》,59(2004),第259-284页·Zbl 1039.68613号
[21] M.DeGroot、P.Feder和P.Goel,《配对》,《数理统计年鉴》,42(1971),第578-593页·Zbl 0217.51802号
[22] M.DeGroot和P.Goel,多元正态数据的匹配问题,Sankhya,B系列,38(1976),第14-29页·Zbl 0414.62044号
[23] M.DeGroot和P.Goel,从破碎随机样本估计相关系数,《统计年鉴》,8(1980),第264-278页·Zbl 0446.62049号 ·doi:10.1214/aos/1176344952
[24] E.Enamorado、B.Eifield和K.Imai,《缺失数据的快速概率记录链接》。R包,版本0.2.0。
[25] I.P.Fellegi和A.B.Sunter,记录关联理论,《美国统计协会杂志》,64(1969),第1183-1210页·Zbl 0186.53903号
[26] N.Flamarion、C.Mao和P.Rigollet,《统计序列的最佳比率》。arXiv:1607.024352016年·Zbl 1442.62084号 ·doi:10.3150/17-BEJ1000
[27] R.Foygel和L.Mackey,《腐败感知:分离结构化信号的新保证》,IEEE信息理论汇刊,60(2014),第1223-1247页·Zbl 1364.94124号 ·doi:10.1109/TIT.2013.2293654
[28] Y.Gordon,《关于Milman不等式和通过\(\mathbbR^n\)中的网格逃逸的随机子空间》,施普林格-柏林-海德堡,柏林,海德堡,1988年,第84-106页·Zbl 0651.46021号
[29] M.Grant和S.Boyd,CVX:规范凸编程的Matlab软件,2.1版。http://cvxr.com/cvx2014年3月·Zbl 1371.65075号
[30] R.Gutman、C.Afendulis和A.Zaslavsky,《文件链接的贝叶斯程序以分析临终医疗费用》,《美国统计协会杂志》,108(2013),第34-47页·Zbl 1379.62069号 ·doi:10.1080/01621459.2012.726889
[31] M.H.P.Hof和A.H.Zwinderman,《基于部分识别变量的概率链接策略数据分析方法》,《医学统计学》,31(2012),第4231-4242页。
[32] D.Hsu、S.Kakade和T.Zhang,亚高斯随机向量二次型的尾部不等式,概率电子通信,52(2012),第1-6页·Zbl 1309.60017号
[33] 徐德华,石克强,孙晓霞,无对应线性回归。arXiv:1705.070482017年。
[34] P.Huber,位置参数的稳健估计,《数理统计年鉴》,53(1964),第73-101页·兹伯利0136.39805 ·doi:10.1214/aoms/1177703732
[35] G.Kim和R.Chambers,概率多联系下的回归分析,《Neerlandica统计》,66(2012),第64-79页。
[36] P.Lahiri和M.D.Larsen,关联数据回归分析,《美国统计协会杂志》,100(2005),第222-230页·Zbl 1117.62376号 ·doi:10.1198/0162145000001277
[37] J.N.Laska、M.A.Davenport和R.G.Baraniuk,《通过追求正义从稀疏损坏的测量中精确恢复信号》,载于2009年Asilomar信号、系统和计算机会议,第1556-1560页。
[38] R.Maronna、R.Martin和V.Yohai,《稳健统计:理论和方法》,威利出版社,2006年·邮编1094.62040
[39] J.Neter、S.Maynes和R.Ramanathan,《不匹配对响应误差测量的影响》,《美国统计协会杂志》,60(1965),第1005-1027页。
[40] N.Nguyen和T.Tran,《观测值缺失和严重损坏的稳健套索》,IEEE信息理论汇刊,59(2013),第2036-2058页·Zbl 1364.94146号 ·doi:10.1109/TIT.2012.2232347
[41] A.Pananjady、M.Wainwright和T.Cortade,用Permuted数据去噪线性模型。arXiv:1704.074612017年。
[42] A.Pananjady、M.Wainwright和T.Cortade,《混排数据的线性回归:置换恢复的统计和计算极限》,IEEE Transitions on Information Theory,3826-3300(2018)·Zbl 1395.62204号 ·doi:10.1109/TIT.2017.2776217
[43] Y.Plan和R.Vershynin,鲁棒1位压缩感知和稀疏逻辑回归:凸规划方法,IEEE信息理论汇刊,59(2013),第482-494页·Zbl 1364.94153号 ·doi:10.1109/TIT.2012.2207945
[44] Y.Plan和R.Vershynin,《具有非线性观测的广义拉索》,IEEE信息理论汇刊,62(2016),第1528-1537页·Zbl 1359.94153号 ·doi:10.1109/TIT.2016.2517008
[45] A.B.Poore和S.Gadaleta,多目标跟踪引起的一些分配问题,数学。计算。型号。,43(2006),第1074-1091页·Zbl 1171.90450号 ·doi:10.1016/j.mcm.2005.05.026
[46] B.Ripley、B.Venables、D.Bates、K.Hornik、A.Gebhard和D.Firth,MASS:Venables和Ripley MASS.R包版本7.3.-47的支持函数和数据集。
[47] M.Rudelson和R.Vershynin,纠错码和信号重建的几何方法,《国际数学研究通告》,64(2005),第4019-4041页·Zbl 1103.94014号 ·doi:10.1155/IMRN.2005.4019
[48] F.Scheuren和W.Winkler,计算机匹配数据文件的回归分析I,调查方法,19(1993),第39-58页。
[49] F.Scheuren和W.Winkler,计算机匹配数据文件的回归分析II,调查方法,23(1997),第157-165页。
[50] Y.She和A.Owen,《使用非凸惩罚回归进行离群值检测》,《美国统计协会杂志》,106(2012),第626-639页·Zbl 1232.62068号
[51] T.Sun和C.-H.Zhang,标度稀疏线性回归,Biometrika,99(2012),第879-898页·Zbl 1452.62515号
[52] A.Tancredi和B.Liseo,关联数据的回归分析:问题和可能的解决方案,Statistica,75(2015),第19-35页·Zbl 1454.62037号
[53] J.Unnikrishnan、S.Haghhiatshoar和M.Vetterli,随机线性测量的无标签传感,IEEE信息理论汇刊,64(2018),第3237-3253页·Zbl 1395.94168号 ·doi:10.1109/TIT.2018.2809002
[54] R.Vershynin,In:Compressed Sensing:Theory and Applications,剑桥大学出版社,2012,ch.“随机矩阵的非渐近分析简介”。
[55] W.E.Winkler,匹配与记录链接,《威利跨学科评论:计算统计》,6(2014),第313-325页。
[56] Wu Y.N.,关于破碎样本问题的说明,密歇根大学统计系技术代表,1998年。
[57] 周S.Zhou,次高斯随机矩阵的限制特征值条件。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。