×

计算排列的期望和边际可能性。 (英语) Zbl 1482.62018年

摘要:本文演示了如何从一系列领域重新使用复杂算法,以帮助我们计算预期排列和边际可能性。这些结果在记录链接或身份解析领域中特别有用,在这些领域中,我们感兴趣的是跨数据集查找引用同一个人的记录对。讨论的所有计算都可以与随附的R包一起复制expperm公司.

MSC公司:

2008年6月62日 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝林,TR;Rubin,DB,《在记录链接中校准错误匹配率的方法》,美国统计协会杂志,90,430,694-707(1995)·Zbl 0925.62548号 ·doi:10.1080/01621459.1999年5月10日0476563
[2] Berkelaar M等人(2015)lpSolve:“lpSolve”v.5.5的接口,用于求解线性/整数程序。R包版本5.6.13。https://CRAN.R-project.org/package=lpSolve
[3] Bertsekas,DP,分配问题的新算法,数学程序,21,1,152-171(1981)·Zbl 0461.90069号 ·doi:10.1007/BF01584237
[4] Bilenko M、Kamath B、Mooney RJ(2006)《自适应阻塞:学习扩大记录链接》。2006年。2006年ICDM。第六届数据挖掘国际会议。IEEE,纽约,第87-96页
[5] 布鲁尔迪,RA;Gibson,PM,双重随机矩阵的凸多面体。I.永久函数的应用,J Comb Theory Ser A,22,2,194-230(1977)·Zbl 0355.15013号 ·doi:10.1016/0097-3165(77)90051-6
[6] Chertkov,M。;Yedidia,AB,用分数信念传播近似永久性,J Mach Learn Res,14,12029-2066(2013)·Zbl 1318.65022号
[7] 北卡罗来纳州西贝拉。;弗蒂尼,M。;Scannapieco,M。;托斯科,L。;Tuoto,T.,Relais:一个用于记录链接的开源工具包,Riv Stat Ufficiale,9,2-3,55-68(2007)
[8] Damerau,FJ,《计算机检测和纠正拼写错误的技术》,Commun ACM,7,3,171-176(1964)·数字对象标识代码:10.1145/363958.363994
[9] Diaconis,P。;格雷厄姆,R。;Holmes,SP,涉及有限位置排列的统计问题,Lect Notes Monogr Ser,36,195-222(2001)·Zbl 1373.62176号 ·doi:10.1214/lnms/12150090070
[10] 阿拉斯加州埃尔马加米德;伊佩罗提斯,PG;Verykios,VS,重复记录检测:一项调查,IEEE Trans Knowl Data Eng,19,1,1-16(2007)·doi:10.1109/TKDE.2007.250581
[11] Fellegi,IP;Sunter,AB,《记录联系理论》,《美国统计协会杂志》,64,328,1183-1210(1969)·doi:10.1080/01621459.1969.10501049
[12] Hankin RKS(2017)置换:有限集合的置换。R包版本1.0-2。https://CRAN.R-project.org/package=排列
[13] 堆,BR,立交排列,计算J,6,3,293-298(1963)·Zbl 0118.33307号 ·doi:10.1093/comjnl/6.3.293
[14] Herzog,T。;Scheuren,F。;Winkler,W.,《数据质量和记录链接技术》(2007),纽约:Springer,纽约·Zbl 1262.62004号
[15] Kim,G。;Chambers,R.,《不完全联系下的回归分析》,《计算统计数据分析》,56,9,2756-2770(2012)·Zbl 1255.62199号 ·doi:10.1016/j.csda.2012.02.026
[16] Knuth,D.,《计算机编程的艺术:生成所有元组和排列》。Addison-Wesley计算机科学和信息学报系列(2005),阅读:Addison-Whesley,阅读·Zbl 1127.68068号
[17] 拉希里,P。;医学博士Larsen,《关联数据回归分析》,美国统计协会杂志,100469222-230(2005)·Zbl 1117.62376号 ·doi:10.1198/0162145000001277
[18] McLeod P、Heasman D、Forbes I(2011)模拟记录链接数据。国家统计局技术报告。https://ec.europa.eu/eurostat/cros/content(英文)
[19] Mersmann O(2018)《微观基准:精确计时功能》。R软件包版本1.4-6。https://CRAN.R-project.org/package=微基准
[20] Michelson M,Knoblock CA(2006),学习记录链接的阻塞方案。在:人工智能进步协会,第440-445页
[21] Pasula,H。;拉塞尔,S。;奥斯特兰,M。;Ritov,Y.,用许多传感器跟踪许多物体,Int Joint Conf Artif Intell,991160-1171(1999)
[22] Ruskey,F。;Williams,A.,《生成组合的最酷方法》,《离散数学》,309、17、5305-5320(2009)·Zbl 1180.68297号 ·doi:10.1016/j.disc.2007.11.048
[23] Ryser,H.,组合数学。Carus数学专著(1963),纽约:美国数学协会,纽约·Zbl 0112.24806号
[24] Savicky P(2014)Pspearman:Spearman秩相关检验。R包版本0.3-0。https://CRAN.R-project.org/package=pspearman
[25] Scheuren,F。;Winkler,WE,计算机匹配数据文件的回归分析,Surv Methodol,19,1,39-58(1993)
[26] 她,Y。;Tang,S.,《重温迭代比例缩放:现代优化视角》,《计算图形统计杂志》,28,1-13(2018)·Zbl 1505.62368号 ·doi:10.1007/s11222-016-9712-8
[27] Simpson GL(2016)Permute:生成数据限制排列的函数。R包版本0.9-4。https://CRAN.R-project.org/package=permute
[28] Sinkhorn,R.,任意正矩阵和双随机矩阵之间的关系,《数学统计年鉴》,35,2,876-879(1964)·Zbl 0134.25302号 ·doi:10.1214/aoms/1177703591
[29] Valiant,LG,计算永久性的复杂性,Theor Compute Sci,8,2,189-201(1979)·Zbl 0415.68008号 ·doi:10.1016/0304-3975(79)90044-6
[30] Whang SE、Menestrina D、Koutrika G、Theobald M、Garcia-Molina H(2009)《迭代分块实体解析》。摘自:2009年ACM SIGMOD数据管理国际会议记录。ACM,纽约,第219-232页
[31] Yancey WE(2002)Bigmatch:一个从大文件中提取可能匹配项以进行记录链接的程序。美国人口普查局技术代表1,https://www.census.gov/srd/papers/pdf/rrc2002-01.pdf
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。