intRinsic:R包,用于基于模型的数据集内禀维估计

@第{Denti2021intRinsicAR条,title={intRinsic:R包,用于基于模型的数据集内禀维估计},作者={Francesco Denti},日志={J.Stat.Softw.},年份={2021},体积={106},网址={https://api.semanticscholar.org/CorpusID:232014165}}
本文说明了intRinsic,这是一个R包,它实现了数据集内在维度的新颖的、最先进的、基于lihood的估算器,这是大多数降维技术的基本量。为了使这些新颖的估算器易于访问,该包包含少量高级函数,这些函数依赖于更广泛的高效低级例程集。一般来说,intRinsic包含两类模型:同质

询问这篇论文
AI供电

广义比值本征维数估计

引入了一种新的统计方法Gride,该方法允许将id作为标尺的显式函数进行估计,而无需执行任何抽取,并且基于严格的分布结果,从而能够量化估计的不确定性。

Scikit-Dimension:用于内部维度估计的Python包

scikit-dimension包提供了基于scik-it-lean应用程序编程接口的大多数已知ID估计器的统一实现,以评估全局和局部固有维度,以及文献中广泛存在的合成玩具和基准数据集的生成器。

关于Covid-19数据的内在维度:全球视角(预印本)

值得强调的是,高收入国家更有可能处于低维流形上,这可能是由于人口老龄化、合并症以及因19型冠状病毒增加的人均死亡率负担所致。

新冠肺炎数据内在维度的全球视角

高收入国家如何更容易陷入低维流形,这可能是由于人口老龄化、合并症和新冠肺炎增加的人均死亡率负担所致。

岛叶皮层的定型目标导向的多种动力学

研究发现,神经元流形中的刻板印象活动模式反映了任务依赖性目标导向的奖赏预期,而不是舔、尝或正价,这揭示了岛叶皮层中的核心计算,可以解释其参与涉及异常动机的病理学。

基于模型的内维数估计的分布结果

本文回顾了最近在文献中介绍的一种基于似然的内禀维数估计方法——TWO-NN模型,并利用连续距离比和一般距离比的新分布结果导出了内禀维估计量,称为Cride和Gride。

广义比值本征维数估计

引入了一种新的统计方法Gride,该方法允许将id作为标尺的显式函数进行估计,而无需执行任何抽取,并且基于严格的分布结果,从而能够量化估计的不确定性。

用最小邻域信息估计数据集的内在维数

提出了一种仅使用样本中每个点的第一个和第二个最近邻点的距离的新ID估计器,它使我们能够减少曲率、密度变化的影响以及由此产生的计算成本。

内在维度估计:相关技术和基准框架

本文综述了一些最有趣、使用最广泛、最先进的内在维数估计方法,并提出了一个基准框架,可用于比较评估相关的最先进的估计方法。

紧局部内的内在维数估计

基于最新的内禀维数极值理论模型,即局部内禀维(LID),提出了一种即使由20个样本点组成的“紧”局部也稳定的局部ID估计策略。

ider:带R的内禀维数估计

介绍了一个R包,它实现了八种固有维数估计方法,包括最近提出的基于概率质量函数二阶展开的方法和广义线性模型。

基于近邻信息的内禀维数估计

提出了一种直观吸引人的基于近邻信息的本征维数非迭代估计器,该估计器能很好地识别各种人工数据集的真实维数,并且对样本数量和算法参数相当不敏感。

Scikit-Dimension:用于内部维度估计的Python包

scikit-dimension包提供了基于scik-it-lean应用程序编程接口的大多数已知ID估计器的统一实现,以评估全局和局部固有维度,以及文献中广泛存在的合成玩具和基准数据集的生成器。

潜在变量聚类模型的最优贝叶斯估计

采用贝叶斯决策理论方法定义聚类的最优性准则,并提出一种快速且与上下文相关的贪婪算法来寻找最佳分配,从而同时解决聚类和模型选择问题。

基于期望单纯形偏度的低偏差局部内禀维数估计

这项工作引入了一种利用维数诅咒/祝福的方法,并产生具有非常低偏差的局部内在维数估计量,即使在内在维数高于数据点数量且方差相对较低的情况下也是如此。
...