海量数据集的Gap bootstrap方法及其在交通工程中的应用

@文章{Lahiri2012GapBM,title={大规模数据集的Gap bootstrap方法及其在交通工程中的应用},author={Soumendra Nath Lahiri和Clifford H.Spiegelman以及法官Appiah和Laurence R.Rilett},journal={应用统计学年鉴},年份={2012},体积={6},页码={1552-1587},网址={https://api.semanticscholar.org/CorpusID:88512742}}
在本文中,我们描述了两种用于海量数据集的引导方法。由于计算负担和复杂的非均匀性模式,普通重采样方法的天真应用对于海量数据集往往不实用。相比之下,所提出的方法利用了一大类海量数据集的某些结构特性,将原始问题分解为一组更简单的子问题,分别求解数据表现出近似一致性的每个子问题

本文图表

大规模数据的可扩展引导

引入了“小自举包”(BLB),这是一种新的程序,它结合了自举和子抽样的特点,以产生一种稳健、计算效率高的评估估计器质量的方法。

估计旅行时间不确定性的重采样方法:Gap Bootstrap的应用

结果表明,对于本研究中使用的数据集,与传统方法和块引导方法相比,gap引导方法充分捕获了依赖结构,因此可能比块引导方法或传统引导方法产生更可靠的不确定性估计。

始发地-目的地矩阵的鲁棒估计

基于文献中称为L2误差的最近开发的统计程序,提出了一种用于估计网络原始目的地(OD)分割比例的约束稳健方法,该方法用于识别出行表。

基于最小假设下子样本的大样本置信区间

本文研究了通过逼近某些统计量的抽样分布来构造置信区的问题。通过适当的

依赖数据的样本重用方法研究

我们基于块引导和Richardson外推之间的交叉,提出了一种依赖数据的样本重用方法。而不是通过重采样块和

一般静止观测的折刀和引导

我们将jackknife和bootstrap估计标准误差的方法推广到观测值构成一般平稳序列的情况。我们不会试图降低身份证价值。

相关引导程序的自动块长度选择

这项工作为上述块自举方法提出了实用的最佳块大小估计值,并基于通过Politis和Romano的平顶窗进行谱估计的概念,提出了有限样本“可达到”相对效率的新概念。

具有长程相关误差的线性回归模型中R-、MD-和LAD-估计的渐近性

本文建立了当误差为高斯或函数时,加权残差经验过程在线性回归环境中与其自然估计的一致贴近性

基于自动车辆识别数据的实时原产地估计

本文提出了几种结合AVI数据和路段交通量的方法,以实时估计OD交通量,并使用不同的信息组合评估了16个案例,其中考虑了路段交通量、历史动态OD信息、观测到的路段选择比例以及使用总路段行程时间估计的路段选择。