×

用于调查的主动矩阵分解。 (英语) Zbl 1470.62183号

摘要:在历史上回答率较低的情况下,调查研究人员寻求减少回答者负担的方法,同时精确测量所需的概念。我们建议通过概率矩阵分解来减少回答者的问题,并估算遗漏的回答。缩小差异的主动学习标准选择每个回答者信息最丰富的问题。在我们对真实世界调查的矩阵抽样过程以及脸书调查实验进行的模拟中,我们发现主动问题选择比基线更有效。插补错误的减少在各个问题上是不一致的,取决于它们捕捉到的潜在概念。用有序logit似然对回答进行建模可以改进插补,并产生自适应的问题顺序。我们发现,对于Facebook的调查,订单效应的潜在偏见可能很小。通过我们的方法,调查研究人员可以获得要保留的问题的原则性建议,如果需要,可以自动设计较短的仪器。

MSC公司:

62第25页 统计学在社会科学中的应用
62D10号 缺少数据
62K05美元 最佳统计设计
68T05型 人工智能中的学习和自适应系统
15A23型 矩阵的因式分解
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abadie,A.、Diamond,A.和Hainmueller,J.(2010年)。比较案例研究的综合控制方法:评估加州烟草控制计划的效果。J.Amer。统计师。协会105 493-505。
[2] Adams,R.P.、Dahl,G.E.和Murray,I.(2010年)。在高斯过程概率矩阵分解中引入边信息。预印本。可从arXiv:1003.4944获得。
[3] Ansolachere,S.和Jones,P.E.(2010年)。选民对国会投票的反应。阿默尔。政治科学杂志。54 583-597.
[4] Ansolachere,S.和Schaffner,B.(2010年)。CCES共同内容,2012年。V3[版本]。可在http://hdl.handle.net/1902.1/17705(2014年6月2日访问)。
[5] Athey,S.、Bayati,M.、Doudchenko,N.、Imbens,G.和Khosravi,K.(2018)。因果面板数据模型的矩阵完成方法技术报告,马萨诸塞州剑桥市国家经济研究局。
[6] Attenberg,J.和Provost,F.(2011年)。被动学习?:在实践中运用主动学习的困难。ACM SIGKDD探索。新闻。12 36-41.
[7] Ben-Michael,E.、Feller,A.和Rothstein,J.(2018)。增强综合控制方法。预印本。可从arXiv:1811.04170获得。
[8] Broockman,D.E.、Kalla,J.L.和Sekhon,J.S.(2017年)。实地实验设计与调查结果:选择更有效、稳健和道德设计的框架。政治分析。25 435-464.
[9] Candès,E.J.和Recht,B.(2009年)。通过凸优化实现精确矩阵补全。已找到。计算。数学。9 717-772. ·Zbl 1219.90124号 ·doi:10.1007/s10208-009-9045-5
[10] 曹毅和谢毅(2015)。完成分类矩阵。2015年IEEE第六届多传感器自适应处理(CAMSAP)计算进展国际研讨会369-372。IEEE,新泽西州皮斯卡塔韦。
[11] Chakraborty,S.、Zhou,J.、Balasubramanian,V.、Panchanathan,S.,Davidson,I.和Ye,J.(2013)。主动矩阵完成。2013年IEEE第13届国际数据挖掘会议81-90。IEEE,新泽西州皮斯卡塔韦。
[12] Chaloner,K.和Verdinelli,I.(1995年)。贝叶斯实验设计:综述。统计师。科学。10 273-304. ·Zbl 0955.62617号 ·doi:10.1214秒/117709939
[13] Chen,H.、Felt,M.-H.和Huynh,K.P.(2017年)。零售支付创新和现金使用:通过使用茶点样品核算损耗。J.罗伊。统计师。Soc.序列号。甲180 503-530。
[14] Chiang,K.-Y.,Hsieh,C.-J.和Dhillon,I.S.(2015)。带有噪声侧信息的矩阵补全。神经信息处理系统进展3447-3455。
[15] 生产力委员会(2018)。养老金:评估效率和竞争力。生产力委员会报告草稿概述。4月出版。
[16] Davenport,M.A.,Plan,Y.,van den Berg,E.和Wootters,M.(2014)。1位矩阵完成。Inf.推断3 189-223·Zbl 1309.62124号 ·doi:10.1093/imaiai/iau006
[17] Dillman,D.A.、Sinclair,M.D.和Clark,J.R.(1993)。问卷长度、响应友好型设计和难题对居住者地址普查邮件调查响应率的影响。公共运营。问题57 289-304。
[18] Early,K.、Mankoff,J.和Fienberg,S.E.(2017年)。在线调查中的动态问题排序。J.Off.Stat.33 625-657。
[19] Edwards,P.、Roberts,I.、Clarke,M.、DiGuiseppi,C.、Pratap,S.、Wentz,R.和Kwan,I.(2002)。提高邮寄调查问卷的答复率:系统综述。BMJ 324艺术ID 1183。
[20] Elahi,M.、Ricci,F.和Rubens,N.(2016年)。协作过滤推荐系统中的主动学习研究综述。计算。科学。修订版20 29-50·Zbl 1371.68232号 ·doi:10.1016/j.cosrev.2016.05.002
[21] Fan,W.和Yan,Z.(2010年)。影响网络调查答复率的因素:系统综述。计算。嗯。行为。26 132-139.
[22] Fithian,W.和Mazumder,R.(2013)。带有副信息的灵活低阶统计建模。预印本。可在arXiv:1308.4211获得·Zbl 1397.62180号 ·doi:10.1214/18-STS642
[23] Fullerton,A.S.和Xu,J.(2012年)。序数响应变量的部分比例约束模型的比例优势。社会科学。第41号决议182-198。
[24] Gabry,J.和Goodrich,B.(2016年)。rstanam:贝叶斯通过Stan应用回归建模。R包版本2。
[25] Garnett,R.,Krishnamurthy,Y.,X.熊,J.,Schneider,J.和Mann,R.(2012)。贝叶斯最优主动搜索和调查。预印本。可在arXiv:1206.6406购买。
[26] Golbandi,N.、Koren,Y.和Lempel,R.(2010年)。关于引导推荐系统。1805-1808年第19届ACM信息和知识管理国际会议记录。纽约ACM。
[27] Gonzalez,J.M.和Eltinge,J.L.(2008年)。消费者支出季度访谈调查的自适应矩阵抽样。在2081-2088年调查研究方法部分的会议记录中。弗吉尼亚州亚历山大美国统计协会。
[28] Groves,R.M.(2011)。三个时代的调查研究。公共运营。问题75 861-871。
[29] Hastie,T.、Mazumder,R.、Lee,J.D.和Zadeh,R.(2015)。通过快速交替最小二乘法实现矩阵补全和低秩奇异值分解。J.马赫。学习。第16号决议3367-3402·Zbl 1352.65117号
[30] Heberlein,T.A.和Baumgartner,R.(1978年)。影响邮寄问卷回复率的因素:对已发表文献的定量分析。美国社会学。版本447-462。
[31] Herzog,A.R.和Bachman,J.G.(1981年)。问卷长度对回答质量的影响。公共运营。问题45 549-559。
[32] Josse,J.、Husson,F.等人(2016年)。missMDA:用于处理多元数据分析中缺失值的包。J.统计软件。70 1-31.
[33] Karimi,R.、Freudenthaler,C.、Nanopoulos,A.和Schmidt-Thieme,L.(2011年b)。推荐系统中矩阵分解的最优主动学习。2011年IEEE第23届人工智能工具国际会议1069-1076。IEEE,新泽西州皮斯卡塔韦。
[34] Karimi,R.、Freudenthaler,C.、Nanopoulos,A.和Schmidt-Thieme,L.(2011年A)。基于矩阵分解的推荐系统非负向主动学习。2011年IEEE信息重用与集成国际会议299-303。IEEE,新泽西州皮斯卡塔韦。
[35] Klopp,O.,Lafond,J.,Moulines,E。和Salmon,J.(2015)。自适应多项式矩阵补全。电子。《美国联邦法律大全》第9卷第2950-2975页·Zbl 1329.62304号 ·doi:10.1214/15-EJS1093
[36] Kreuter,F.(2013)。面对无回应的挑战。安美国学院。政治社会科学。645 23-35.
[37] Krosnick,J.A.(1991年)。应对调查中态度测量认知需求的应对策略。申请。认知。精神病。5 213-236.
[38] Künzel,S.R.、Sekhon,J.S.、Bickel,P.J.和Yu,B.(2019年)。使用机器学习评估异质治疗效果的元学习者。程序。国家。阿卡德。科学。116 4156-4165.
[39] Lawrence,N.D.和Urtasun,R.(2009)。高斯过程的非线性矩阵分解。第26届国际机器学习年会论文集601-608。纽约ACM。
[40] Lim,Y.J.和Teh,Y.W.(2007)。电影分级预测的变分贝叶斯方法。KDD Cup和7号研讨会会议记录15-21。
[41] Lowell,D.、Lipton,Z.C.和Wallace,B.C.(2019年)。部署主动学习的实际障碍。2019年自然语言处理实证方法会议和第九届国际自然语言处理联合会议(EMNLP-IJCNLP)会议记录21-30。
[42] Marcus,B.、Bosnjak,M.、Lindner,S.、Pilischenko,S.和Schütz,A.(2007年)。弥补低主题兴趣和长时间调查:一项关于网络调查中无回应的实地实验。社会科学。计算。版次:25 372-383。
[43] Marlin,B.M.和Zemel,R.S.(2009年)。使用非随机缺失数据进行协作预测和排名。在第三届ACM推荐系统会议论文集5-12。纽约ACM。
[44] Mazumder,R.、Hastie,T.和Tibshirani,R.(2010)。用于学习大型不完备矩阵的谱正则化算法。J.马赫。学习。第11号决议2287-2322·Zbl 1242.68237号
[45] Montgomery,J.M.和Cutler,J.(2013)。用于民意调查的计算机自适应测试。政治分析。21 172-192.
[46] Mulder,J.和van der Linden,W.J.(2009)。具有最佳设计标准的多维自适应测试用于项目选择。《心理测量学》74 273-296·Zbl 1243.62144号 ·doi:10.1007/s11336-008-9097-5
[47] Munger,G.F.和Loyd,B.H.(1988年)。使用多重矩阵抽样进行调查研究。J.Exp.教育。56 187-191.
[48] Negahban,S.和Wainwright,M.J.(2012年)。限制强凸性和加权矩阵完备:带噪声的最优界。J.马赫。学习。第13号决议1665-1697·Zbl 1436.62204号
[49] Porteous,I.、Asuncion,A.和Welling,M.(2010年)。带有边信息和Dirichlet过程混合的贝叶斯矩阵分解。在第二十四届AAAI人工智能会议上。
[50] Recht,B.(2011年)。矩阵补全的简单方法。J.马赫。学习。第12号决议3413-3430·Zbl 1280.68141号
[51] Reiter,J.P.和Raghunathan,T.E.(2007年)。多重插补的多重适应。J.Amer。统计师。协会102 1462-1471·Zbl 1332.62044号 ·doi:10.1198/0162145000000932
[52] Rennie,J.D.和Srebro,N.(2005年)。用于协同预测的快速最大边际矩阵分解。第22届机器学习国际会议论文集713-719。纽约ACM。
[53] Roberts,C.、Gilbert,E.、Allum,N.和Eisner,L.(2019)。研究综述:调查中的满意度:对文献的系统回顾。公共运营。问题83 598-626。
[54] Rubens,N.和Sugiyama,M.(2007年)。基于影响力的协作式主动学习。2007年ACM推荐系统会议记录145-148。纽约ACM。
[55] Rubin,D.B.(2004年)。调查中无应答的多重插补。威利经典图书馆。Wiley Interscience,新泽西州霍博肯·2007年6月10日
[56] Rubinsteyn,A.和Feldman,S.(2016)。fancyimpute:用Python实现的多变量插补和矩阵补全算法。
[57] Salakhutdinov,R.和Mnih,A.(2008)。基于马尔可夫链蒙特卡罗的贝叶斯概率矩阵分解。第25届机器学习国际会议论文集880-887。纽约ACM。
[58] Schnabel,T.、Swaminathan,A.、Singh,A.、Chandak,N.和Joachims,T.(2016)。治疗建议:减少学习和评估。预印本。可从arXiv:1602.05352获得。
[59] Seeger,M.和Bouchard,G.(2012年)。非共轭矩阵分解模型的快速变分贝叶斯推理。人工智能与统计学1012-1018。
[60] Segall,D.O.(2009)。多维适应性测试原理。在适应性测试的要素57-75中。柏林施普林格。
[61] Sengupta,N.、Srebro,N.和Evans,J.(2018年)。简单调查:受推荐系统启发的响应检索。预印本。可在arXiv购买:1901.09659。
[62] Settles,B.(2009年)。威斯康星大学麦迪逊分校计算机科学系主动学习文献调查技术报告。
[63] Sheehan,K.B.(2001)。电子邮件调查回复率:综述。J.计算-调解。Commun公司。6 JCMC621。
[64] Silva,J.和Carin,L.(2012年)。在线贝叶斯矩阵分解的主动学习。第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集325-333。纽约ACM。
[65] Srebro,N.、Rennie,J.和Jaakkola,T.S.(2005)。最大边际矩阵分解。神经信息处理系统进展1329-1336。
[66] Srebro,N.和Salakhuttinov,R.(2010)。非统一世界中的协作过滤:使用加权跟踪范数进行学习。神经信息处理系统进展2056-2064。
[67] Sutherland,D.J.、Póczos,B.和Schneider,J.(2013)。主动学习和搜索低秩矩阵。第19届ACM SIGKDD知识发现和数据挖掘国际会议论文集212-220。ACM,纽约。
[68] Thomas,N.、Raghunathan,T.E.、Schenker,N.,Katzoff,M.J.和Johnson,C.L.(2006年)。使用国家健康和营养检查调查数据对矩阵抽样方法进行评估。Surv公司。卫理公会。32 217-231.
[69] Tourangeau,R.、Kreuter,F.和Eckman,S.(2015)。动机性误报:制定答案以减轻调查负担。测量中的测量。技术、数据质量和错误来源24-41。法兰克福弗拉格校区。
[70] Tran,D.、Kucukelbir,A.、Dieng,A.B.、Rudolph,M.、Liang,D.和Blei,D.M.(2016)。爱德华:一个用于概率建模、推理和批评的库。预印。可从arXiv:1610.09787获取。
[71] Udell,M.和Townsend,A.(2019年)。为什么大数据矩阵近似低秩?SIAM J.数学。数据科学。1 144-160. ·Zbl 1513.68057号 ·doi:10.1137/18M1183480
[72] Wagner,J.(2010)。作为监测调查数据质量的工具,缺失信息的比例。公共运营。问题74 223-243。
[73] Xu,M.,Jin,R.和Zhou,Z.-H.(2013)。带副信息的加速矩阵补全:应用于多标签学习。神经信息处理系统进展2301-2309。
[74] Yammarino,F.J.、Skinner,S.J.和Childers,T.L.(1991)。了解邮件调查响应行为的元分析。公共运营。问题55 613-639。
[75] Zhang,C.、Taylor,S.J.、Cobb,C.和Sekhon,J.(2020年)。补充“调查的主动矩阵分解”https://doi.org/10.1214/20-AOAS1322SUPA网站, https://doi.org/10.1214/20-AOAS1322SUPB网站
[76] 周,T。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。