从人类反应数据中进行优化和私人学习
阮杜克(Duc Nguyen)、安德森·叶张(Anderson Ye Zhang)
第26届国际人工智能与统计会议论文集,PMLR 206:922-9582023年。
摘要
项目反应理论(IRT)是研究人们如何做出概率决策的理论,在教育测试、推荐系统等方面有多种应用。二进制响应数据的Rasch模型是IRT中最基本的模型之一,是一个具有重要现实意义的活跃研究领域。最近,Nguyen和Zhang(2022)提出了一种高效且准确的新谱估计算法。在这项工作中,我们以两种重要的方式扩展了他们的结果。首先,我们获得了谱算法的精确入口误差界,补充了他们工作中的“平均误差”$\ell_2$界。值得注意的是,在温和的采样条件下,谱算法实现了最小最大最佳入口误差界(对数因子模)。在精细分析的基础上,我们还表明,光谱算法对于前$K$恢复具有最佳的样本复杂性(例如,从批准/不批准响应数据中确定最佳$K$项),这解释了之前工作中有趣的经验发现。我们的第二个贡献解决了IRT中一个重要但尚未研究的主题:隐私。尽管IRT以人为中心的应用,但在文献中还没有提出任何隐私保护机制。我们利用其独特的马尔可夫链公式和离散高斯机制开发了谱算法的私有扩展(Canonne等人,2020年)。实验表明,我们的方法比低到中度隐私机制中的基线要准确得多。
引用本文
相关材料