×

学习高维的真值向量。 (英语) Zbl 1435.68257号

总结:真相发现是数据分析相关领域中出现的一个重要学习问题。它关注的是从从多个不可靠来源获取的数据集中找到最可靠的信息。这个问题已经被广泛研究,并提出了一些技术。然而,它们都是启发式的,没有任何质量保证。在本文中,我们将该问题表述为一个高维几何优化问题,称为基于熵的几何方差依靠一些新颖的几何技术,我们进一步发现了对这个问题的新见解。我们首次表明,真理发现问题可以在保证解质量的情况下得到解决。特别是,在一些合理的假设下,可以在近似线性的时间内实现((1+epsilon)-近似。我们希望我们的算法将对其他数据相关应用程序有用。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68周25 近似算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 丁·H。;高杰。;Xu,J.,发现真理发现的全局最优:基于熵的几何方差,(第32届计算几何国际研讨会,第32届国际计算几何研讨会,2016年6月14日至18日,美国马萨诸塞州波士顿(2016)),34:1-34:16·Zbl 1387.68255号
[2] 李,Y。;高杰。;孟,C。;李强。;苏·L。;赵,B。;风扇,W。;Han,J.,《真相发现调查》,ACM SIGKDD Explor。新闻。,17, 2, 1-16 (2016)
[3] 李,H。;赵,B。;Fuxman,A.,《少数群体的智慧:发现并瞄准合适的群体进行众包》(《第23届万维网国际会议论文集》(2014),ACM),165-176
[4] 李强。;李,Y。;高杰。;赵,B。;风扇,W。;Han,J.,《通过真相发现和源可靠性估计解决异构数据中的冲突》,(2014年ACM SIGMOD国际数据管理会议论文集(2014),ACM),1187-1198
[5] 李强。;李,Y。;高杰。;苏·L。;赵,B。;Demirbas,M。;风扇,W。;Han,J.,《长尾数据真相发现的信任感知方法》,Proc。荷兰VLDB。,8, 4, 425-436 (2014)
[6] 帕斯特纳克,J。;Roth,D.,《知道该相信什么(当你已经知道某事时)》,(第23届国际计算语言学会议论文集(2010年),计算语言学协会),877-885
[7] Xiao,H。;高杰。;王,Z。;王,S。;苏·L。;刘浩,《有理论保障的真理发现方法》(KDD(2016)),1925-1934
[8] 尹,X。;韩,J。;Philip,S.Y.,《网上多个冲突信息提供者的真相发现》,IEEE Trans。知识。数据工程,20,6,796-808(2008)
[9] 穆克吉,S。;威库姆,G。;Danescu-Niculescu-Mizil,C.,《药物上的人:健康社区中用户声明的可信度》,(第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2014),ACM),65-74
[10] 苏·L。;李强。;胡,S。;王,S。;高杰。;刘,H。;Abdelzaher,T.F。;韩,J。;刘,X。;Gao,Y.,分布式传感系统中的广义决策聚合,(实时系统研讨会(RTSS)(2014),IEEE),1-10
[11] Wang博士。;卡普兰,L。;Abdelzaher,T.F.,《社会感知中冲突观测值的最大似然分析》,ACM Trans。传感器净值。,10, 2, 30 (2014)
[12] 董,X.L。;Berti-Equille,L。;Srivastava,D.,《整合冲突数据:来源依赖的作用》,Proc。荷兰VLDB。,2, 1, 550-561 (2009)
[13] 亚马逊机械土耳其(2017)
[14] Smyth,P。;法耶兹,U.M。;伯尔,M.C。;佩罗纳,P。;Baldi,P.,从金星图像的主观标记推断地面真相,(神经信息处理系统进展(1995)),1085-1092
[15] Zhang,Y。;陈,X。;周,D。;Jordan,M.I.,Spectral methods methods meet em:一种可证明的众包优化算法,J.Mach。学习。研究,17,1,3537-3580(2016)·兹比尔1367.68241
[16] 韦林德,P。;布兰森,S。;佩罗纳,P。;Belongie,S.J.,人群的多维智慧,(神经信息处理系统进展(2010)),2424-2432
[17] 周,D。;巴苏,S。;毛泽东,Y。;Platt,J.C.,通过极大极小熵从人群智慧中学习,(神经信息处理系统进展(2012)),2195-2203
[18] Wang,L。;周振华,众包学习的成本节约效应,(IJCAI(2016)),2111-2117
[19] 怀特希尔,J。;Wu,T.-f。;J.Bergsma。;Movellan,J.R。;Ruvolo,P.L.,《谁的选票更重要:未知专业标签的最佳整合》,(神经信息处理系统进展(2009)),2035-2043年
[20] Shannon,C.E.,《传播数学理论》,Mob。计算。Commun公司。第5、1、3-55版(2001年)
[21] Jain,P。;Netrapalli,P。;Sanghavi,S.,使用交替极小化完成低秩矩阵,(计算理论研讨会。计算理论研讨会,STOC'13,美国加利福尼亚州帕洛阿尔托,2013年6月1-4日(2013)),665-674·Zbl 1293.65073号
[22] Hardt,M.,《理解矩阵补全的交替最小化》,(第55届IEEE计算机科学基础年度研讨会,第55届EEE计算机科学基础年会,2014年FOCS,美国宾夕法尼亚州费城,2014年10月18-21日(2014)),651-660
[23] Jain,P。;Tewari,A.,向量值输出回归问题的交替最小化,(神经信息处理系统进展28:2015年神经信息处理体系年会)。神经信息处理系统进展28:2015年12月7日至12日,加拿大魁北克省蒙特利尔(2015年),1126-1134
[24] Gupta,M.R。;Chen,Y.,EM算法的理论和应用,Found。趋势信号处理。,4, 3, 223-296 (2010) ·兹比尔1294.62137
[25] Indyk,P。;Motwani,R。;Venkatasubramanian,S.,噪声下的几何匹配:组合边界和算法,(SODA(1999)),457-465·Zbl 0934.68108号
[26] 丁·H。;Xu,J.,无局部性的约束数据聚类统一框架,(第二十六届ACM-SIAM离散算法年会论文集,第二十六届离散算法年会刊论文集,SODA’15(2015),工业和应用数学学会:美国宾夕法尼亚州费城,1471-1490·Zbl 1371.68291号
[27] 库马尔,A。;萨巴沃尔,Y。;Sen,S.,《任何维聚类问题的线性时间近似方案》,J.ACM,57,2,5(2010)·Zbl 1327.68334号
[28] M.稻田。;北卡罗来纳州加藤市。;Imai,H.,加权Voronoi图和随机化在基于方差的k聚类中的应用,(第十届计算几何年会论文集(1994),ACM),332-339
[29] Guha,S。;McGregor,A。;Venkatasubramanian,S.,熵和信息距离的次线性估计,ACM Trans。算法,5,4,35(2009)·Zbl 1298.68114号
[30] 约翰逊,W.B。;Lindenstrauss,J.,Lipschitz映射到Hilbert空间的扩展,Contemp。数学。,26, 189-206, 1 (1984) ·Zbl 0539.46017号
[31] Achlioptas,D.,《数据库友好随机投影:Johnson-Lindenstraus与二进制硬币》,J.Compute。系统。科学。,66, 4, 671-687 (2003) ·Zbl 1054.68040号
[32] 自由,E。;Zucker,S.W.,《Mailman算法:矩阵-向量乘法注释》,Inf.Process。莱特。,109, 3, 179-182 (2009) ·Zbl 1191.68832号
[33] 黄,Z。;丁·H。;Xu,J.,通过覆盖范围发现真相的更快算法,(算法和数据结构-第15届国际研讨会。算法和数据架构-第15次国际研讨会,2017年WADS,加拿大NL圣约翰,2017年7月31日至8月2日,会议记录(2017)),461-472·Zbl 1430.68280号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。