正则化的近似共充分采样
现在可以在aCSS框架内处理更复杂的估计问题,包括高斯混合模型和高维高斯线性模型(其中MLE在正则化下表现良好,例如$\ell_1$惩罚或形状约束)。 适应性收集数据的随机测试
本文提出了一个对自适应采集数据(尽管其不可变)进行随机化测试的通用框架,该框架使用了一种新的加权随机化试验,并针对各种流行的自适应分配算法、数据生成环境、,推理任务的类型。 高效合成数据的一步
该方法允许构造两个部分合成数据集,即保留摘要统计信息而不使用正式的隐私方法,以及完全合成数据,即满足差异隐私(DP)的有力保证,这两个数据集都具有渐近有效的摘要统计信息。 秩变换子抽样:多数据分裂和可交换p值的推断
本文引入秩变换子抽样作为在温和假设下对组合统计量或p值进行大样本推断的通用方法,并将其应用于一系列问题,包括测试高维数据中的单峰性,测试参数分位数回归模型的有效性,在顺序随机试验中测试无直接影响,并校准交叉拟合双机器学习置信区间。 通过条件独立性生成仿冒产品
结果表明,$\mathbb{R}^p$上的任何概率测度$mu$都可以近似为形式为$$\mu_0\bigl(a_1\times\ldots\times a_p\bigr)=E\bigl\{\prod_{i=1}^pP(X_i\ in a_i\ mid Z)\bigr}的概率测度$\mu_0$$$ 不同私有Kolmogorov-Smirnov型试验
本文基于Kolmogorov-Smirnov、Kuiper、Cram’er-von Mises和Wasserstein检验统计量,开发了几种新的差异私有(DP)非参数假设检验,这些检验都可以表示为经验累积分布函数(ecdfs)的伪度量,并可用于检验两个样本的质量假设,和配对数据。 通过随机选择背景变量校正混淆
提出了一种新的基于X对Y回归系数在选择不同背景特征时的稳定性的因果关系判别准则,证明了当且仅当X不包含因果驱动时,V收敛于零。