基于符号主成分分析的区间数据信息提取

作者

  • M.R.Oliveira先生 葡萄牙里斯本大学CEMAT和高等教育学院
  • 维莱拉先生 葡萄牙里斯本大学CEMAT和高等教育学院
  • A.帕切科 葡萄牙里斯本大学CEMAT和高等教育学院
  • 鲁伊·瓦拉达斯 葡萄牙里斯本大学高等技术学院
  • 保罗·萨尔瓦多 信息技术与葡萄牙阿韦罗大学

内政部:

https://doi.org/10.17713/ajs.v46i3-4.673

摘要

我们引入了随机区间值变量的符号方差和协方差的一般定义,从而对四种已知的符号主成分估计方法:CPCA、VPCA、CIPCA和SymCovPCA进行了统一和深入的解释。此外,我们建议使用符号主成分的截断版本,即使用原始符号变量的严格子集,作为改进符号主成分解释的一种方法。此外,通过对真实数据集的分析,可以对互联网流量应用程序进行有意义的描述,同时突出本文所考虑的符号主成分估计方法之间的相似性。

工具书类

Bertrand P,Goupil F(2000年)。符号数据的描述性统计。HH Bock,E Diday(编辑),《符号数据分析,分类研究,数据分析和知识》

组织,第106-124页。施普林格-柏林-海德堡。

Billard L(2008)。复杂定量数据的样本协方差函数。《世界机构间常委会会议记录》,日本横滨,第157-163页。

Billard L,Diday E(2003)。从数据统计到知识统计:符号数据分析。美国统计协会杂志,98,470-487。

Billard L,Diday E(2006)。符号数据分析:概念统计和数据挖掘。约翰·威利父子公司。

Cadima JFCL,Jolliffe IT(2001)。变量选择和主要子空间的解释。《农业、生物和环境统计杂志》,6(1),62-79。

Cazes P、Chouakria A、Diday E、Schektman Y(1997)。《主要成分分析》扩展版。《应用统计评论》,45(3),5-24。

Chouakria A(1998)。类型间隔因子分析方法扩展。巴黎多芬大学博士论文。

De Carvalho FdA、Brito P、Bock HH(2006年)。基于L2距离的区间数据动态聚类。计算统计学,21(2),231-250。

Diday E(1987)。聚类中的符号方法及相关数据分析方法。德国亚琛IFCS第一届会议记录。H.Bock主编,北荷兰人。

Le-Rademacher J,Billard L(2012)。区间值数据的符号协方差主成分分析与可视化。计算与图形统计,21(2),413-432。

帕斯科尔C(2014)。对电信中变量选择和稳健异常检测的贡献。葡萄牙里斯本大学高等教育学院博士论文。

Pascoal C、Oliveira M、Valadas R、Filzmoser P、Salvador P、Pacheco A(2012年)。鲁棒特征选择和鲁棒PCA在互联网流量异常检测中的应用。INFOCOM,2012年IEEE会议记录,第1755-1763页。ISSN 0743-166X。

Vilela M(2015)。区间数据的经典稳健符号主成分分析。葡萄牙里斯本大学高等教育学院硕士论文。

王浩、关锐、吴杰(2012)。CIPCA:基于完整信息的区间值数据主成分分析。神经计算,86,158-169。

下载

出版

2017-04-12

如何引用

Oliveira,M.R.、Viela,M.、Pacheco,A.、Valadas,R.和Salvador,P.(2017)。使用符号主成分分析从区间数据中提取信息。奥地利统计杂志,46(3-4), 79–87. https://doi.org/10.17713/ajs.v46i3-4.673