Exploring the Gap Between Tolerant and Non-Tolerant Distribution Testing

Chakraborty, Sourav; Fischer, Eldar; Ghosh, Arijit; Mishra, Gopinath; Sen, Sayantan

doi:10.4230/LIPIcs.APPROX/RANDOM.2022.27

摘要

分布测试框架目前普遍存在于属性测试领域。在这个模型中，输入是一个概率分布，可以通过从预言机中独立抽取样本来访问。测试任务是区分满足某种特性的分布和距离测量值很远的分布。容错测试的任务施加了进一步的限制，即接近满足特性的分布也被接受。这项工作的重点是分布的非容限测试的样本复杂性与其容限测试对应项之间的联系。当将我们的范围限制为分布的标号变（对称）性质时，我们证明了间隙最多是二次的，忽略了多项式因素。相反，均匀分布的性质确实已知有一个近似二次间隙。当转移到一般的，不一定是标签不变的性质时，情况更复杂，我们给出了一些部分结果。我们证明，如果一个性质要求分布是非集中的，即分布的概率质量充分分布，则不能用o（√n）多个样本对其进行非相容性检验，其中n表示宇宙大小。显然，这最多意味着一个二次间隙，因为可以使用许多样本来学习分布（因此可以针对任何属性进行宽容的测试）。非集中是对性质的强烈要求，因为我们也证明了它们的容差测试有一个接近线性的下限。除了分布是非集中的情况外，我们还显示了如果输入分布非常集中，即它主要支持宇宙大小s的子集，那么它可以仅使用𝒪（s）多个样本来学习。学习过程适应输入，并且在事先不知道的情况下工作。

Jayadev Acharya、Clément L.Canonne、Cody Freitag、Ziteng Sun和Himanshu Tyagi。信息约束下的推断三：局部隐私约束。IEEE J.选择。区域信息理论，第253-267页，2021年。网址：https://doi.org/10.109/JSAIT.2021.3053569.
贾亚德夫·阿查里亚（Jayadev Acharya）、君士坦丁诺·达斯卡拉基斯（Constantinos Daskalakis）和高塔姆·卡马特（Gautam Kamath）。分布特性的最佳测试。在NIPS中，第3591-3599页，2015年。网址：https://proceedings.neurips.cc/paper/2015/hash/1f36c15d6a3d18d52e8d493bc8187cb9-摘要.html.
贾亚德夫·阿查里亚（Jayadev Acharya）、伊利亚斯·迪亚科尼科拉斯（Ilias Diakonikolas）、杰里·李（Jerry Li）和路德维希·施密特（Ludwig Schmidt）。近线性时间内的样本最优密度估计。在SODA中，第1278-1289页，2017年。网址：https://doi.org/10.1137/1.9781611974782.83.
Jayadev Acharya、Peter Kairouz、Yuhan Liu和Ziteng Sun。在隐私和通信约束下估计稀疏离散分布。在ALT中，第79-982021页。网址：http://proceedings.mlr.press/v132/acharya21b.html.
玛丽亚姆·阿里亚克巴普尔（Maryam Aliakbarpour）、伊利亚斯·迪亚科尼科拉斯（Ilias Diakonikolas）、丹尼尔·凯恩（Daniel Kane）和罗尼特·鲁宾菲尔德（Ronitt Rubinfeld）。通过样本排列对分布进行私有测试。在NeurIPS中，第10877-10888页，2019年。网址：https://proceedings.neurips.cc/paper/2019/hash/8e036cc193d0af59aa9b22821248292b-Abstract.html.
诺加·阿隆、埃里克·布莱斯、苏拉夫·查克拉波蒂、大卫·加西亚·索里亚诺和阿里·马茨利娅。测试函数同构的几乎紧边界。SIAM J.计算。，42(2):459-493, 2013. 网址：https://doi.org/10.1137/10832677.
Tugkan Batu和Clément L.Canonne。通用均匀性测试。FOCS，第880-889页，2017年。网址：https://doi.org/10.109/FOCS.2017.86.
Tugkan Batu、Lance Fortnow、Eldar Fischer、Ravi Kumar、Ronitt Rubinfeld和Patrick White。测试随机变量的独立性和一致性。在FOCS中，第442-4512001页。网址：https://doi.org/10.109/SFCS.2001.959920.
Tugkan Batu、Lance Fortnow、Ronitt Rubinfeld、Warren D.Smith和Patrick White。测试分布是否接近。FOCS，第259-269页，2000年。网址：https://doi.org/10.109/SFCS.2000.892113.
Shai Ben-David、John Blitzer、Koby Crammer、Alex Kulesza、Fernando Pereira和Jennifer Wortman Vaughan。从不同领域学习的理论。机器。学习。，第151-175页，2010年。网址：https://doi.org/10.1007/s10994-009-5152-4.
Dimitris Bertsimas和John N Tsitsiklis。线性优化导论，第6卷。Athena Scientific Belmont，马萨诸塞州，1997年。
埃里克·布莱斯（Eric Blais）、克莱门特·卡农（Clément L.Canonne）、塔利亚·伊登（Talya Eden）、阿米特·列维（Amit Levi）和达娜·罗恩（Dana Ron）。容忍军政府测试以及与子模块优化和功能同构的连接。ACM事务处理。计算。理论，第24:1-24:33页，2019年。网址：https://doi.org/10.1145/3337789.
Clément L Canonne公司。关于学习离散分布的简短说明。https://github.com/ccanone/probabilitydistributiontoolbox/blob/master/learning.pdf, 2020.
克莱门特·卡农。关于分布测试的调查：你的数据很大。但它是蓝色的吗？《计算图书馆理论》，2020年。网址：https://doi.org/10.4086/toc.gs.2020.009.
Clément L.Canonne、Ilias Diakonikolas、Themis Goulekis和Ronitt Rubinfeld。测试离散分布的形状限制。理论计算。系统。，2018年第4-62页。网址：https://doi.org/10.1007/s00224-017-9785-6.
Clément L.Canonne、Ayush Jain、Gautam Kamath和Jerry Li。分布测试中的容差价格。在COLT中，第573-6242022页。网址：https://proceedings.mlr.press/v178/canonne22a.html.
Sourav Chakraborty、Eldar Fischer、Arijit Ghosh、Gopinath Mishra和Sayantan Sen.探索耐受性和非耐受性分布测试之间的差距。CoRR，2021年。网址：http://arxiv.org/abs/2110.09972.
陈伟宁、彼得·凯鲁兹和艾弗·奥祖鲁。打破沟通-隐私-准确性三重困境。NeurIPS，2020年。网址：https://proceedings.neurips.cc/paper/2020/hash/222afbe0d68c61de60374b96f1d86715-Abstract.html.
格雷戈里·考德（Gregory W Corder）和戴尔·I·福尔曼（Dale I Foreman）。非参数统计：逐步方法。John Wiley&Sons，2014年。
托马斯·克文和乔伊·托马斯。信息论要素。威利，2001年。网址：https://doi.org/10.1002/0471200611.
Constantinos Daskalakis、Gautam Kamath和John Wright。哪些分布距离可以次线性测试？SODA，第2747-2764页，2018年。网址：https://doi.org/10.1137/1.9781611975031.175.
伊利亚斯·迪亚科尼科拉斯和丹尼尔·凯恩。一种测试离散分布特性的新方法。FOCS，第685-694页，2016年。网址：https://doi.org/10.109/FOCS.2016.78.
伊利亚斯·迪亚科尼科拉斯、丹尼尔·M·凯恩和阿利斯泰尔·斯图尔特。高维高斯和高斯混合稳健估计的统计查询下限。FOCS，第73-84页，2017年。网址：https://doi.org/10.109/FOCS.2017.16.
伊利亚斯·迪亚科尼科拉斯（Ilias Diakonikolas）、丹尼尔·凯恩（Daniel M.Kane）和阿利斯泰尔·斯图尔特（Alistair Stewart）。广义均匀性测试的尖锐界限。在NeurIPS中，第6204-6213页，2018年。网址：https://proceedings.neurips.cc/paper/2018/hash/fc325d4b598aaede18b53dca4ecfcb9c-Abstract.html.
埃尔达·费舍尔（Eldar Fischer）、奥德·拉基什（Oded Lachish）和雅杜·瓦苏提夫（Yadu Vasudev）。为基于样本的测试和多测试可伸缩性权衡查询复杂性。FOCS，第1163-1182页，2015年。网址：https://doi.org/10.1109/FOCS.2015.75.
埃尔达·费舍尔（Eldar Fischer）、奥德·拉基什（Oded Lachish）和雅杜·瓦苏提夫（Yadu Vasudev）。改进和扩展形状受限特性的分布测试。在STACS中，第31:1-31:142017页。网址：https://doi.org/10.4230/LIPIcs.STACS.2017.31.
埃尔达·费舍尔和阿里·马思利娅。测试图同构。SIAM J.计算。，第207-225页，2008年。网址：https://doi.org/10.1137/070680795.
奥德·戈德里奇。性能测试简介。剑桥大学出版社，2017年。网址：https://doi.org/10.1017/9781108135252.
奥德·戈德里奇。在有界度图模型中测试同构。电子。计算机学术讨论会。复杂。，第102页，2019年。网址：https://eccc.weizmann.ac.il/report/2019/102.
奥德·戈尔德雷奇和达娜·罗恩。关于有界度图的测试展开。电子。计算机学术讨论会。复杂。，7(20), 2000. 网址：https://eccc.weizmann.ac.il/eccc-reports/2000/TR00-020/index.html.
奥德·戈尔德雷奇和达娜·罗恩。基于样本的测试人员。ACM事务处理。计算。理论，第7:1-7:54页，2016年。网址：https://doi.org/10.1145/2898355.
Sivakanth Gopi、Gautam Kamath、Janardhan Kulkarni、Aleksandar Nikolov、Zhiwei Steven Wu和Huanyu Zhang。本地私有假设选择。COLT，第1785-1816页，2020年。网址：http://proceedings.mlr.press/v125/gopi20a.html.
特里·金。方格测试指南。Taylor和Francis，1997年。
大卫·J·C·麦凯。信息理论、推理和学习算法。剑桥大学出版社，2003年。
利亚姆·帕宁斯基（Liam Paninski）。给定稀疏采样离散数据的一致性测试。IEEE传输。《信息论》，第4750-4755页，2008年。网址：https://doi.org/10.109/TIT.2008.928987.
Michal Parnas、Dana Ron和Ronitt Rubinfeld。公差性能测试和距离近似。J.计算。系统。科学。，第1012-1042页，2006年。网址：https://doi.org/10.1016/j.jcss.2006.03.002.
格雷戈里·瓦利安特和保罗·瓦利安。线性估计的威力。在FOCS中，第403-412页，2011年。网址：https://doi.org/10.109/FOCS.2011.81.
格雷戈里·瓦利安特和保罗·瓦利安。一个自动不等式证明器和实例最优身份测试。SIAM J.计算。，第429-455页，2017年。网址：https://doi.org/10.1137/151002526.
格雷戈里·瓦利安特和保罗·瓦利安。估计未知：改进了熵和其他属性的估计。J.ACM，第37:1-37:41页，2017年。网址：https://doi.org/10.1145/3125643.
保罗·瓦利安特。测试分布的对称性。SIAM J.计算。，第1927-1968页，2011年。网址：https://doi.org/10.1137/080734066.
张焕宇。差异隐私模型中的统计推断。CoRR，abs/2108.05000，2021。网址：http://arxiv.org/abs/1208.05000.

探索公差和非公差分布测试之间的差距

作者 Sourav Chakraborty公司, 埃尔达·费舍尔, 阿里吉特·戈什, 戈皮纳特·米什拉, 萨扬坦·森

文件

文件标识符

作者详细信息

致谢

引用为获取BibTex

摘要

主题分类

ACM科目分类

关键词

韵律学

工具书类

感谢您的反馈！

无法发送消息