主动信息假设检验

@第{DazPachn2020条假设TW,title={主动信息假设检验},作者={Daniel Andr{'e}s D{'i}az-Pach{'o}n和Juan Saenz和J.Sunil Rao},日志={ArXiv},年份={2020年},体积={abs/2011.04834},url={https://api.semanticscholar.org/CorpusID:213535563}}

本文中的表格

使用两种分布假设检验识别数据中的偏差

这项工作确定了训练数据中关于拟议分布的偏差,而无需训练模型,并允许它返回给定数据集的“最接近的合理解释”,从而可能揭示生成这些数据的过程中的潜在偏差。

知识获取的形式化框架:超越机器学习

建立了一个数学框架,通过根据贝叶斯规则定义的认知概率表达信念,可以精确地定义代理的学习(增加真实信念的数量)和知识。

利用主动信息评估、测试和估计微调量

引入了一个通用框架来估计搜索算法中注入了多少外部信息,即所谓的活动信息。这被重新表述为微调测试,

双分布假设检验的有限样本界

证明了新的有限样本界,它允许只估计所需数量(例如规范函数值)的两个分布假设检验,从而将其与传统的p值区分开来。

有可能知道宇宙微调吗?

微调研究某些物理参数或它们之间的相关比率是否位于所谓的小概率寿命允许区间内,超出该区间的碳基寿命

宇宙调谐是精细的还是粗糙的?

科学家们一直在争论宇宙对生命的微调,即自然常数(或它们之间的比率)必须属于很小的间隔才能存在生命

使用最小组件分析的模式搜索

本文证明了当数据服从多元正态分布时,通过在数据服从正态分布的情况下实施“最小成分分析”,可以得到最优尺寸的盒子,即在相同维数和给定概率的所有可能盒子中,盒子的尺寸是最小的。

带有检验误差的有偏抽样的患病率估计修正

这项工作提出了一种流行率估计方法,该方法减少了因测试错误和症状个体过采样而产生的偏见的影响,在某些情况下完全消除了这种影响,如以色列卫生部的正式结果、模拟和COVID‐19数据所示。

基于最小分量分析的高维模式搜索

证明了对于多元正态分布或拉普拉斯分布,通过实施“最小成分分析”可以获得最优体积的盒子,即在相同维数和固定概率的所有可能盒子上,盒子的体积是最小的。

广义活动信息:无界域的扩展

作为活动信息,最大熵的D不平衡可以从具有无限支持度的基线中进行评估,这就是本文的目的。

贝努利的不充分理由原则与计算机搜索中的信息保存

这一讨论解决了COI和一些搜索算法在一大类问题上表现良好这一观察结果之间看似冲突的问题。

搜索中的信息保护:衡量成功的成本

本文提出了三种方法来表征成功搜索所需的信息,并基于这些信息方法开发了一种方法,以衡量特定问题信息促进成功搜索的有效性。

复杂特定信息的统一模型

介绍了复杂特定信息的数学理论,该理论将计算特定复杂度的几种先前方法统一为一种通用的数学形式,表明在任何给定的连续或离散分布下,不太可能有较大的指定复杂度值,并且可以使用标准模型来形成统计假设检验。

局部稀疏凹凸搜索

这项工作引入了一种新颖的有监督和多变量凸点搜索策略,用于探索多个连续变量目标函数的模式或类,在类发现问题上优于朴素PRIM以及竞争性非参数有监督和无监督方法。

通过活动信息进行模式搜索

开发了一种称为主动信息模式搜索(AIMH)的算法,当应用于整个空间时,该算法将显示是否存在任何模式以及它们在哪里,并且表明AIMH是一致的,有助于克服维度诅咒的问题。

高维数据中的凹凸搜索

本文基于“病人”规则归纳的概念,提出了一种针对这一目标的程序,并与大多数规则归纳方法使用的贪婪规则归纳和一些划分树技术(如CART)使用的半贪婪规则归纳进行了对比。

优化无免费午餐定理

开发了一个框架来探索有效的优化算法和它们正在解决的问题之间的联系。提出了一些“无免费午餐”(NFL)定理,其中

基于主成分的无监督凹凸搜索

这项工作开发了正态下患者规则归纳法(PRIM)的快速版本,并证明了预测空间的主成分旋转实际上是如何生成改进的模式估计量的。