我们提出了两类改进的互信息估计,根据联合概率密度分布的随机点样本。与基于binnings的传统估计不同,它们基于来自-最近邻距离。这意味着它们具有数据效率(我们将结构分解到尽可能小的尺度)、自适应(在数据较多的地方分辨率较高)和最小偏差。事实上,潜在熵估计值的偏差主要是由于最小分辨率下密度的不均匀性,给出了典型的系统误差,该误差随对于点。从数值上看,我们发现这两个家族准确的对于独立分布,即估计量消失(直至统计波动),如果这适用于所有测试的边际分布和和此外,我们给出了两个以上随机变量之间冗余的估计。我们将我们的算法与现有算法进行了详细的比较。最后,我们证明了我们的估计器在评估从独立分量分析(ICA)获得的分量的实际独立性、改进ICA以及估计盲源分离的可靠性方面的有用性。
13更多内政部:https://doi.org/10.103/PhysRevE.69.066138