摘要
在评估目标参数的人群风险取决于未知因素的情况下,我们为统计学习提供了非症状性超额风险保证妨害参数这必须根据数据进行估计。我们分析了一种两阶段样本分裂元算法,该算法将目标参数和干扰参数的任意估计算法作为输入。我们证明,如果人口风险满足一个条件,即内曼正交性,妨害估计误差对元算法实现的超额风险界的影响是二阶的。我们的定理对用于目标和累赘的特定算法是不可知的,并且只对其各自的性能进行了假设。这使得可以使用机器学习的大量现有结果,为使用讨厌的组件进行学习提供新的保证。此外,通过关注超额风险而非参数估计,我们可以在比以往工作更弱的假设下提供利率,并适应目标参数属于复杂非参数类的设置。我们提供了关于妨害类和目标类的度量熵的条件,以便预言率以相同的顺序,就好像我们知道了讨厌的参数一样。
致谢
我们感谢陈晓红指出了额外的相关工作。部分工作是在DF在微软研究院实习期间完成的。DF感谢脸书博士奖学金和国家科学基金会Tripods拨款#1740751的支持。
引用
下载引文
迪伦·福斯特。
瓦西里斯·西兰卡尼斯。
“正交统计学习。”
安。统计师。
51
(3)
879 - 908,
2023年6月。
https://doi.org/10.1214/23-AOS2258
问询处
收到日期:2020年9月1日;修订日期:2022年8月1日;发布日期:2023年6月
欧几里德项目首次推出:2023年8月20日
数字对象标识符:10.1214/23-AOS2258
学科:
主要用户:62G08号
次要:62C20个,62D20型
关键词:双机器学习,局部Rademacher复杂性,内曼正交性,政策学习,统计学习,治疗效果
版权所有©2023数学统计研究所