跳到内容

孟秀霞/切向-沃瑟斯坦投影

文件夹和文件

姓名姓名
上次提交消息
上次提交日期

最新提交

 
 
 
 
 
 
 
 
 

存储库文件导航

切线Wasserstein投影

Gunsilius,Hsieh&Lee(2022)

概述

此存储库中的代码构建了附带论文中的结果、绘图和表格,可在https://arxiv.org/abs/2207.14727.

数据可用性和产地声明

可用性摘要

  • 此处使用的所有数据均公开可用。

每个数据源的详细信息

数据文件:数据/乐高积木

  • 对于Medicaid扩展应用程序,可以从IPUMS下载数据:https://usa.ipums.org/usa/我们下载了正文中所述的变量:HINSCAID、EMPSTAT、UHRSWORK、INCWAGE。我们选择了其他技术人员级别的ID变量,以允许我们选择户主和配偶(如果有)。我们采用了随附文件附录B.2中提到的进一步样本选择标准。

此处提供的数据文件:https://www.dropbox.com/sh/y43s568l44ny8pz/AADmFeUdanq9PzKHYhESaPBaa?dl=0

数据集列表

数据文件 来源 笔记 提供
数据/Lego_bricks/001.png 以上列出 正文第4.2节中的目标图像 是的
数据/Lego_bricks/0040.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0080.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0120.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0160.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0200.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0240.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0280.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0320.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0360.png 以上列出 正文第4.2节中的控制图像 是的
数据/Lego_bricks/0400.png 以上列出 正文第4.2节中的控制图像 是的
数据/Medicaid_Data/ 以上列出 用于获得最佳权重λ星的ACS数据 对;在上面的Dropbox文件夹中
数据/医疗补助数据/反事实 以上列出 用于获得第4.3节中的反事实分布的ACS数据 对;在上面的Dropbox文件夹中

计算要求

软件要求

模拟和应用程序是使用Python/3.8.1运行的。

  • ot(pip安装罐)
  • cvxpy公司
  • numpy公司
  • 马特普洛特利布
  • 熊猫
  • 海运的

内存和运行时要求

总结

在标准(当前年份)台式机上重现分析所需的大致时间:

  • 1-3天

细节

该代码上次是在MacOS 12.4版的8核基于应用程序的笔记本电脑.

部分代码上次在36核Intel服务器,180 GB RAM计算耗时2小时。

程序/代码说明

  • 中的程序Python代码将执行正文中描述的所有模拟和估计。这些程序还将生成其中的所有表格和绘图。

复制程序说明

  • 将存储库下载到本地计算机。
  • 从下载医疗保险数据医疗补助数据/干预前数据Dropbox上的子文件夹(链接在上面)到目录:数据/Medicaid_Data.
  • 从下载医疗保险数据医疗补助数据/反事实数据Dropbox上的子文件夹(链接在上面)到目录:数据/医疗补助数据/反事实.
  • 移动数据文件夹到Python代码子目录。
  • 运行Python代码/混合高斯模拟.ipynb用于高斯模拟。
  • 运行Python代码/乐高积木模拟.py用于Lego Brick图像复制。
  • 运行Python代码/Medicaid.ipynb用于Medicaid扩展应用程序。

.png文件将存储在Python代码默认情况下为子目录。这些表是在每个.ipynb程序中生成的。如果您希望将.png文件保存在其他目录中,请更改相应的打印保存图()程序中的命令。

细节

  • Python代码/twp_utils.py:定义了重心投影和正文中描述的投影方法。
  • Python代码/混合高斯模拟.ipynb:包含正文中描述的高斯模拟。
  • Python代码/乐高积木模拟.py:包含正文中描述的Lego Brick图像复制。
  • Python代码/Medicaid.ipynb:包含正文中描述的Medicaid扩展应用程序。

除了Python代码/乐高积木模拟.py,在装有Apple M1处理器的笔记本电脑上运行所有程序只需不到5分钟。正在运行Python代码/乐高积木模拟.py在36核的群集计算机上,从开始到结束需要2个小时。

表格和程序列表

提供的代码再现了:

  • 论文中的所有表格
  • 论文中的图2至图7
图/表# 程序 行(块)号
表1 Python代码/混合高斯模拟.ipynb 8
表2 Python代码/Mediid.ipynb 9
表3 Python代码/混合高斯模拟.ipynb 12
图2(右) Python代码/乐高积木模拟.py 152
图3(重量) Python代码/乐高积木模拟.py 144
图4 Python代码/Medicaid.ipynb 19, 20
图5 Python代码/Medicaid.ipynb 21, 22
图6 Python代码/Medicaid.ipynb 10、12
图7 Python代码/Mediid.ipynb 14, 15

工具书类

史蒂文·拉格尔斯(Steven Ruggles)、莎拉·弗洛德(Sarah Flood)、罗纳德·戈肯(Ronald Goeken)、梅根·肖韦勒(Megan Schouweiler)和马修·索贝克(Matthew Sobek)。IPUMS USA:12.0版[数据集]。明尼阿波利斯,明尼苏达州:IPUMS,2022年。https://doi.org/10.18128/D010.V12.0

关于

Gunsilius,Hsieh&Lee(2022)

资源

星星

观察者

叉子

发布

未发布版本

包装

未发布包