通用离群序列检测的线性复杂指数一致性检验

@文章{Bu2017LinearcomplexityET,title={通用离群序列检测的线性复杂指数一致性检验},author={Yuheng Bu和Shaofeng Zou以及Venugopal V.Veeravalli},期刊={2017 IEEE国际信息理论研讨会(ISIT)},年份={2017年},页码={988-992},url={https://api.semanticscholar.org/CorpusID:15812113}}
针对这一问题,提出了一类基于分布聚类的不同测试,与GL测试相比,该测试具有指数一致性,其时间复杂度与序列总数呈线性关系,而GL测试的时间复杂度则与离群点数量呈指数关系。

本文中的数字

连续序列的指数一致离群假设检验

本文提出了无分布测试,并证明了三种不同测试设计(定长测试、顺序测试和两阶段测试)的误分类错误、误拒绝和误报警概率呈指数级快速衰减。

二阶渐近最优泛孤立点假设检验

本文提出了一种基于阈值的通用测试方法,确保误分类误差和虚警概率呈指数衰减,并证明了该测试在广义Neyman-Pearson意义下的最佳性。

异常值假设检验的渐近性

这项工作重新审视了Li等人(TIT 2014)的离群值假设检验框架,推导了广义Neyman-Pearson准则下最优检验的基本极限,并推导了名义分布和异常分布的每个元组的误拒概率的界,作为阈值的函数。

二阶渐近最优离群值假设检验

本文重新审视了Li等人(TIT 2014)的离群值假设检验框架,推导了广义Neyman-Pearson准则下最优检验的基本极限,并提出了一种基于阈值的检验,确保误分类误差和虚警概率呈指数衰减。

具有拒绝选项的二阶渐近最优通用孤立序列检测

提出了一种二阶渐近最优检验,它为离群序列检测提供了有限样本近似,并推广到多个离群序列,其中每个离群序列可以遵循不同的异常分布。

普遍约束下的序列离群假设检验

提出了一种序列检验,其平均样本量有界,理论性能优于定长检验,而Li、Nitinawarat和Veeravalli(2017)的相应序列检验无法保证这一点。

复合分布数据序列的K-Medoids聚类

研究表明,当每个数据序列中的样本数趋于无穷大时,错误概率以指数形式快速衰减,针对已知和未知数量的分布簇,提出了基于分布距离度量的k-medoids算法。

状态变量挖掘:基于大数据中信息重要性的信息分歧

提出了基于MITM的消息重要性传递容量,为有干扰的信息传递过程提供了一个上界,并将MITM推广到连续情况,并通过测量信息距离讨论了其鲁棒性。

顺序(最快)变化检测:经典结果和新方向

本文讨论了序列变化检测与其他领域交叉处出现的一些新维度,以及现代应用程序的选择和开放问题的备注。

异常数据流的非参数检测

研究表明,对于使用最大平均差异作为度量构建的任意无分布测试,没有任何测试是一致的,该度量基于分布在再现核希尔伯特空间中的平均嵌入。

孤立序列检测的线性复杂度指数一致性检验

针对这一基于分布聚类的离群序列检测问题,提出了一类不同的测试,与GL测试相比,该测试具有指数一致性,时间复杂度与序列总数呈线性关系,而GL测试具有指数的时间复杂度。

大数据集中的离群序列检测:通用假设检验与聚类的比较

证明了广义似然检验等价于以Kullback-Leibler散度为差异测度的概率单形上的组合聚类。

通用离群序列检测的线性复指数一致性检验

提出了一类基于分布聚类的测试,结果表明,这类测试与线性形式中的线性时间复杂度呈指数一致,性能与现有测试相似,但计算效率更高。

连续观测的通用离群序列检测

将基于KL发散度的检测方法与基于最大平均差(MMD)机器学习方法的最近针对该问题引入的检测方法的检测性能进行了比较。

通用异常值假设检验

提出了一种基于广义似然原理的通用检验方法,证明了该方法具有普遍的指数一致性,并导出了该检验所能达到的误差指数的单字母特征。

通用序列异常值假设检验

本文提出并证明了一种通用检验在零假设下是通用指数一致的,在所有其他假设下保持通用指数一致性。

多序列上的最快搜索

结果表明,众所周知,累积和(CUSUM)检验对于非贝叶斯统计变化点检测公式是最优的,对于所研究的问题是最优的。

信息论聚类中的度量结构

本文提供了第一个多项式时间聚类算法,该算法使用KL-divergenes对一般输入具有可证明的保证,并找到了KL-Divergenes的“松弛”度量结构。

大数据集中的离群序列检测:一种数据驱动方法

本文提出并分析了在假设检验框架下,在不同的异常恢复目标和对异常值潜在统计信息的不同认识程度下的异常序列检测。

利用类条件分布模型检测代表性不足的生物序列

该程序旨在帮助领域专家通过深入研究少量统计上代表性不足且功能有趣的序列,实现具有成本效益的知识定性扩展。