了望使用leave-on-out核密度估计和极值理论识别数据中的异常值。使用拓扑数据分析中的持久同源性技术计算核密度估计的带宽。利用峰值过阈值方法,将广义Pareto分布拟合到leave-on-out kde值的对数上,以识别离群值。

请参见Kandanaarachi和Hyndman(2021年)用于基础方法。

安装

您可以从安装lookout的发布版本CRAN(起重机)具有:

#install.packages(“lookout”)

以及来自的开发版本github具有:

#install.packages(“devtools”)
开发工具::安装github(“sevvandi/lookout”)

例子

图书馆(了望)
 <- 了望(忠实的)

#>使用lookout算法剔除KDE异常值
#>
#>呼叫:了望(X=忠实)
#>
#>异常值概率
#> 1       24  0.01371435
#> 2      149  0.00000000
#> 3      211  0.00000000
自动绘图()
#>警告:“guides(<scale>=FALSE)”已弃用。请使用“指南(<scale>=
#>“无”)`。

接下来我们来看异常值持久性。离群值持久性图显示了在不同显著性水平的带宽值范围内持续存在的离群值。强度与重要性水平成反比。如果显著性水平为0.01,则强度为10,如果为0.1,则强度是1。

坚持不懈 <- 持久化离群值(忠实的)
自动绘图(坚持不懈)