Optimal and Private Learning from Human Response Data

Duc Nguyen; Anderson Ye Zhang

从人类反应数据中进行优化和私人学习

阮杜克（Duc Nguyen）、安德森·叶张（Anderson Ye Zhang）

第26届国际人工智能与统计会议论文集，PMLR 206:922-9582023年。

摘要

项目反应理论（IRT）是研究人们如何做出概率决策的理论，在教育测试、推荐系统等方面有多种应用。二进制响应数据的Rasch模型是IRT中最基本的模型之一，是一个具有重要现实意义的活跃研究领域。最近，Nguyen和Zhang（2022）提出了一种高效且准确的新谱估计算法。在这项工作中，我们以两种重要的方式扩展了他们的结果。首先，我们获得了谱算法的精确入口误差界，补充了他们工作中的“平均误差”$\ell_2$界。值得注意的是，在温和的采样条件下，谱算法实现了最小最大最佳入口误差界（对数因子模）。在精细分析的基础上，我们还表明，光谱算法对于前$K$恢复具有最佳的样本复杂性（例如，从批准/不批准响应数据中确定最佳$K$项），这解释了之前工作中有趣的经验发现。我们的第二个贡献解决了IRT中一个重要但尚未研究的主题：隐私。尽管IRT以人为中心的应用，但在文献中还没有提出任何隐私保护机制。我们利用其独特的马尔可夫链公式和离散高斯机制开发了谱算法的私有扩展（Canonne等人，2020年）。实验表明，我们的方法比低到中度隐私机制中的基线要准确得多。

引用本文

BibTeX公司

@会议记录{pmlr-v206-nguyen23a，title={从人类反应数据中进行优化和私人学习}，author={Nguyen，Duc和Zhang，Anderson Ye}，booktitle={第26届国际人工智能与统计会议论文集}，页数={922--958}，年份＝{2023}，editor={Ruiz、Francisco和Dy、Jennifer和van de Meent、Jan-Willem}，体积={206}，series={机器学习研究论文集}，月={4月25日--27日}，publisher={PMLR}，pdf={https://proceedings.mlr.press/v206/nguyen23a/nguyen23a.pdf},url={https://proceedings.mlr.press/v206/nuyen23a.html},abstract={项目反应理论（IRT）是研究人们如何做出概率决策的研究，在教育测试、推荐系统等方面有多种应用。二进制响应数据的Rasch模型是IRT中最基本的模型之一，是一个具有重要现实意义的活跃研究领域。最近，Nguyen和Zhang（2022）提出了一种高效且准确的新谱估计算法。在这项工作中，我们以两种重要的方式扩展了他们的结果。首先，我们获得了光谱算法的精确入口误差界，补充了他们工作中的“平均误差”$\ell_2$界。值得注意的是，在温和的采样条件下，光谱算法实现了最小最大最优入口误差界（模对数因子）。在精细分析的基础上，我们还表明，光谱算法对于前$K$恢复具有最佳的样本复杂性（例如，从批准/不批准响应数据中确定最佳$K$项），这解释了之前工作中有趣的经验发现。我们的第二个贡献解决了IRT中一个重要但尚未研究的主题：隐私。尽管IRT以人为中心的应用，但在文献中还没有提出任何隐私保护机制。我们利用其独特的马尔可夫链公式和离散高斯机制开发了谱算法的私有扩展（Canonne等人，2020年）。实验表明，我们的方法比低到中度隐私机制中的基线要准确得多。}}

尾注

%0会议论文%从人类反应数据中进行优化和私人学习%阮氏公爵%安德森·叶张%第26届国际人工智能与统计会议论文集%C机器学习研究进展%D 2023年%E弗朗西斯科·鲁伊斯%E詹妮弗·戴伊%E Jan-Willem van de Meent公司%F pmlr-v206-nguyen23a公司%我PMLR%电话922--958%U型https://proceedings.mlr.press/v206/nuyen23a.html%V 206型%X项目反应理论（IRT）研究人们如何做出概率决策，在教育测试、推荐系统等方面有多种应用。二进制响应数据的Rasch模型是IRT中最基本的模型之一，是一个具有重要现实意义的活跃研究领域。最近，Nguyen和Zhang（2022）提出了一种高效且准确的新谱估计算法。在这项工作中，我们以两种重要的方式扩展了他们的结果。首先，我们获得了谱算法的精确入口误差界，补充了他们工作中的“平均误差”$\ell_2$界。值得注意的是，在温和的采样条件下，谱算法实现了最小最大最佳入口误差界（对数因子模）。在精细分析的基础上，我们还表明，光谱算法对于前$K$恢复具有最佳的样本复杂性（例如，从批准/不批准响应数据中确定最佳$K$项），这解释了之前工作中有趣的经验发现。我们的第二个贡献解决了IRT中一个重要但尚未研究的主题：隐私。尽管IRT以人为中心的应用，但在文献中还没有提出任何隐私保护机制。我们利用其独特的马尔可夫链公式和离散高斯机制开发了谱算法的私有扩展（Canonne等人，2020年）。实验表明，在低到中等隐私制度下，我们的方法明显比基线更准确。

亚太地区

Nguyen，D.和Zhang，A.Y.（2023）。从人类反应数据中进行优化和私人学习。第26届国际人工智能与统计会议论文集，英寸机器学习研究进展206:922-958网址：https://proceedings.mlr.press/v206/nuyen23a.html。

从人类反应数据中进行优化和私人学习

摘要

引用本文

相关材料