×

探索具有互信息和应用的高维大数据相关性分析。 (英语) Zbl 1368.62176号

曹炳元(主编)等,东方思维与模糊逻辑国际会议。2015年8月17日至20日,中国大连,庆祝复杂系统和大数据时代50周年。查姆:施普林格(ISBN 978-3-319-30873-9/pbk;978-3-3169-30874-6/电子书)。《智能系统与计算进展》443,361-371(2016)。
摘要:应用信息熵理论,我们提出了一种多变量关系相关性的度量方法:高维最大互信息系数(HMIC)。它是一种基于最大信息的非参数探索(MINE)统计,用于识别和分类大数据集中的关系,推广了互变量中的最大信息系数(MIC)度量。为了降低HMIC计算的复杂性,利用数据网格的思想提出了改进的均匀网格。同时,建立了一些最优的单轴分割算法(SAR),以确保HMIC测量的可行性。最后,我们应用HMIC分析了大学生身体测量数据集。
有关整个系列,请参见[Zbl 1369.03020号].

MSC公司:

62小时86 多元分析与模糊性
62时20分 关联度量(相关性、典型相关性等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] David,N.:Reshef:检测大数据集中的新关联。《科学》3341518-1524(2011)·Zbl 1359.62216号 ·doi:10.1126/science.1205438
[2] 姜瑜、张琪、刘春春:基于多变量互信息理论探索大数据集的一些新方法。J.西奥。申请。通知。Technol公司。2(47), 547–550 (2013)
[3] 泽水,X.:直觉模糊聚合算子。IEEE传输。模糊系统。15(6), 1179–1187 (2007) ·Zbl 05516331号 ·doi:10.10109/TFUZZ.2006.890678
[4] Karpinets,T.V.,Park,B.H.,Uberbacher,E.C.:使用关联网络分析大型生物数据集。编号。《酸类研究》40(17),1-8(2012)·doi:10.1093/nar/gks403
[5] Wang,L.,Wang,X.:关于订单统计的最坏情况数据集。申请。数学。信息科学。2(6), 356–362 (2012)
[6] Guindon,S.、Dufayard,J.-F.、Lefort,V.、Anisimova,M.:Wim Hordijk和Olivier Gascuel:估计最大似然系统发育的新算法和方法:评估PhyML 3.0的性能。系统。生物3(59),307–321(2010)·doi:10.1093/sysbio/syq010
[7] García,S.、Fernández,a.、Luengo,J.、Herrera,F.:计算智能和数据挖掘实验设计中多重比较的高级非参数测试:权力的实验分析。信息科学。10(180),2044–2064(2010)·Zbl 05758514号 ·doi:10.1016/j.ins.2009.12.010
[8] Erceg-Hurn,D.M.,Mirosevich,V.M.:现代稳健统计方法。美国心理医生。协会7(63),591-601(2008)·doi:10.1037/0003-066X.63.7.591
[9] Tamura,K.、Peterson,D.、Petersson,N.、Stecher,G.、Nei,M.、Kumar,S.:使用最大似然、进化距离和最大简约方法进行分子进化遗传学分析。分子生物学。进化。10(28), 2731–2739 (2011) ·doi:10.1093/molbev/msr121
[10] Albanese,D.,Filosi,M.,Visintainer,R.:cmine,minerva and minepy:MINE套件及其R和Python包装的C引擎,第1-10页(2012年)。arXiv:1208.4271[统计ML]
[11] Das,J.、Mohammed,J.和Haiyuan,Y.:相互作用动力学的基因组尺度分析揭示了生物网络的组织。生物信息学28(14),1873-1878(2012)·doi:10.1093/bioinformatics/bts283
[12] Deng,X.,Havukkala,I.,Deng,X:大尺度基因组2D可视化揭示了鸟类基因组中广泛的CG-AT斜相关。BMC演变。生物学234(7),1471-1482(2007)
[13] Kulczycki,P.:控制工程的非参数估计。摘自:第四届WSEAS/IASME动力系统与控制国际会议,第115–121页(2008)
[14] Cover T.M.,Thomas,J.A.:信息理论的要素。威利,纽约(1991)·兹比尔0762.94001 ·doi:10.1002/0471200611
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。