合成器

R包synthop。为统计披露控制生成敏感微数据的合成版本。一种工具,用于生成包含机密信息的微数据的合成版本,以便安全地发布给用户进行探索性分析。生成合成数据的关键目标是用合成的原始值替换敏感的原始值,从而使数据集中包含的统计信息失真最小。变量可以是分类的,也可以是连续的,使用序列建模方法逐一综合。替换是通过使用参数化或分类和回归树模型从与原始数据拟合的条件分布中提取来生成的。数据是通过syn()函数合成的,如果使用默认设置,或者使用用户定义的方法,syn()可以很大程度上实现自动化。可选参数可用于影响披露风险和综合数据的分析质量。