Bayesian Pseudo Posterior Mechanism under Asymptotic Differential Privacy

Terrance D. Savitsky; Matthew R.Williams; Jingchen Hu

我们提出了一种贝叶斯伪后验机制，以生成具有$（\epsilon，\pi）-$概率差异隐私（pDP）保证的记录级合成数据库，其中$\pi$表示任何观察到的数据库超过$\epsilon$的概率。伪后验机制采用数据记录诱导的、基于风险的权重向量，权重值为$\ in[0,1]$，通过外科手术降低高风险记录对模型估计和生成记录级合成数据以供公开发布的可能性贡献。伪后验合成器通过在对数伪似然效用函数下使用该记录的Lipschitz界为每个数据记录构造权重，该函数推广了用于构造正式私有数据生成机制的指数机制（EM）。通过选择权重来消除具有非有限log-likelihood值的似然贡献，我们保证了在每个样本大小下伪后验机制的有限局部隐私保证。我们的结果可以应用于数据传播者以可计算的方式设想的任何合成模型，该方法仅涉及参数的伪后验分布估计，$θ$，与最近使用通过EM实现的自然边界效用函数的方法不同，我们指定了保证$\pi$到$0$在数据库空间上渐近收缩的条件，这样我们的方法提供的保证形式是渐近的。我们从美国劳工统计局（U.S.Bureau of Labor Statistics）发布的消费者支出调查（Consumer Expendence Surveys）数据库中说明了我们对敏感家庭收入变量的伪后验机制。我们表明，与EM相比，我们的伪后验机制的合成数据中的效用得到了更好的保留，两者都是使用相同的非私有合成器进行估计的，这是因为我们使用了目标下加权。

渐进差异隐私下的贝叶斯伪后验机制

摘要