×

传递熵和部分传递熵的缺点:扩展它们以避免维数灾难。 (英语) Zbl 1459.62174号

概要:传递熵(TE)捕获了两个变量之间的定向关系。部分传递熵(PTE)解释了多元系统中所有混杂变量的存在,并仅推断出直接因果关系。然而,部分传递熵的计算涉及高维分布,因此在多变量的情况下可能不可靠。在这项工作中,通过根据驱动或响应变量的相互关系,基于不同场景构建减少数量的混杂变量,引入了部分传递熵的不同变体。利用随机森林(RF)方法对基于连接的PTE变体进行了合成时间序列评估。实证结果表明,所建议的变量优于传递熵和部分传递熵,特别是在高维系统的情况下。在对金融时间序列应用因果关系度量时,上述发现得到了进一步强调。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
62P05号 统计学在精算科学和金融数学中的应用
91B84号 经济时间序列分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Angelini,L.,De Tommaso,M.,Marinazzo,D.,Nitti,L..,Pellicoro,M.&Stramaglia,S.[2010]“冗余变量和格兰杰因果关系”,《物理学》。修订版E81037201。
[2] Balcilar,M.、Ozdemir,Z.、Shahbaz,M.和Gunes,S.[2018]“通货膨胀是否导致黄金市场价格变化?来自均值和方差非参数分位数因果关系测试的G7国家证据,”Appl。经济学50,1891-1909年。
[3] Barnett,L.、Barrett,A.和Seth,A.[2009]“Granger因果关系和传递熵对于高斯变量是等价的”,Phys。修订稿第103页,第238701页。
[4] Blinowska,K.,Ku-shi,R.&Kamiñski,M.[2004]“多元过程中的格兰杰因果关系和信息流”,《物理学》。修订版E70050902。
[5] Blinowska,K.[2011]《从多通道数据中确定定向连接性的方法综述》,《医学生物学》。发动机。计算49521-529。
[6] Bossomaier,T.、Barnett,L.、Harré,M.和Lizier,J.[2016]传输熵导论(Springer)·Zbl 1410.62002号
[7] Breiman,L.[2001]《随机森林》,马赫。学习45,5-32·Zbl 1007.68152号
[8] Di Bartolomeo,G.和Saltari,E.【2018】“当前的宏观经济挑战”,宏观经济。第22页,第1-3页。
[9] Eichler,M.[2012]“多元时间序列的图形建模”,Probab。Th.相关。字段153,233-268·Zbl 1316.60049号
[10] Franciotti,R.&Falasca,N.[2018]“时域条件格兰杰因果关系分析的可靠性”,PeerJ Preprints6,e26703v1。
[11] Gencaga,D.[2018]“传递熵”,Entropy20,288。
[12] Genuer,R.、Poggi,J.-M.、Tuleau-Malot,C.和Villa-Vialaneix,N.[2017]“大数据的随机森林”,大数据研究9,28-46。
[13] Geweke,J.[1984]“时间序列间条件线性相关性和反馈的度量”,J.美国统计学家。协会79907-915·Zbl 0553.62083号
[14] Granger,C.[1969]“通过计量经济学模型和交叉谱方法研究因果关系”,《计量经济学》37,424-438·Zbl 1366.91115号
[15] Hlinka,J.、Hartman,D.、Vejmelka,M.、Runge,J.,Marwan,N.、Kurth,J.和Paluš,M.[2013]“使用条件互信息的定向气候网络推断的可靠性”,Entropy152023-2045·Zbl 1296.62218号
[16] Ho,T.[1995]“随机决策森林”,Proc。第三届国际会议文件分析与识别,第278-282页。
[17] Ho,T.[1998]“构建决策森林的随机子空间方法”,IEEE Trans。帕特。分析。机器。情报.20,832-844。
[18] Ishwaran,H.、Kogalur,U.、Gorodeski,E.、Minn,A.和Lauer,M.[2010]“生存数据的高维变量选择”,《美国统计杂志》。协会105,205-217·Zbl 1397.62220号
[19] Kraskov,A.,Stögbauer,H.&Grassberger,P.[2004]“估计相互信息”,《物理学》。版本E69066138。
[20] Kugiumtzis,D.[2013a]“非均匀嵌入的直接耦合信息测量”,Phys。修订版E87,062918。
[21] Kugiumtzis,D.[2013b]“秩向量上的部分传递熵”,《欧洲物理学》。J.:专题222401-420。
[22] Kullback,S.&Leibler,R.[1951]“关于信息和充分性”,《数学年鉴》。统计22,79-86·Zbl 0042.38403号
[23] Liu,Y.[2014]“大数据环境中的随机森林算法”,计算。模型。新技术.18147-151。
[24] Louppe,G.[2014]“理解随机森林:从理论到实践论文”,比利时列日大学博士论文。
[25] Lungarella,M.,Ishiguro,K.,Kuniyoshi,Y.&Otsu,N.[2007]“量化二元时间序列因果结构的方法”,《国际分岔与混沌》17,903-921·兹比尔1141.37367
[26] Lütkepohl,H.[1982]“因忽略变量而导致的不可用性”,《经济学杂志》19,367-378。
[27] Marinazzo,D.,Pellicoro,M.和Stramaglia,S.[2008]“非线性Granger因果关系的核方法”,Phys。修订版Lett.100,144103。
[28] Marinazzo,D.、Pellicoro,M.和Stramaglia,S.[2012]“多元数据集中部分条件作用的因果信息方法”,计算。数学。方法。Med.2012,303601·Zbl 1244.62126号
[29] Montalto,A.、Faes,L.和Marinazzo,D.[2014]“静音:一个用于比较多元传递熵的已建立和新估计值的matlab工具箱”,PLoS ONE9,e109462。
[30] Mwaffo,V.、Butail,S.和Porfiri,M.【2017年】,“最大可能意义上的成对互动分析,以确定团队领导者”,Front。机器人。AI4,35。
[31] Paluš,M.,Hartman,D.,Hlinka,J.,Vejmelka,M.&Donner,R.[2011]“区分气候网络中动态的连通性”,Nonlin。过程。地球物理学.18751-763。
[32] Papana,A.、Kugiumtzis,D.和Larsson,P.[2012]“直接因果效应的检测及其在癫痫脑电图分析中的应用”,《国际分叉与混沌》22,1250222-1-7·Zbl 1258.94030号
[33] Papana,A.,Kyrtsou,C.,Kugiumtzis,D.&Diks,C.[2013]“多元时间序列中直接因果关系度量的模拟研究”,Entropy152635-2661·Zbl 1336.62153号
[34] Papana,A.,Kyrtsou,C.,Kugiumtzis,D.&Diks,C.[2017]“因果关系测试重采样方法评估:美国通货膨胀行为注释”,《公共科学图书馆·ONE12》,e0180852·Zbl 1336.62153号
[35] Pilkiewicz,K.、Lemasson,B.、Rowland,M.、Hein,A.、Sun,J.、Berdahl,A.、Mayo,M.和Moehlis,J.,Porfiri,M.,Fernández-Juricic,E.等人[2020]“使用信息理论工具解码集体通信”,J.Roy。Soc.接口17,20190563。
[36] Porfiri,M.【2018年】,“通过传递熵推断斑马鱼-机器人相互作用中的因果关系:捕捉大鱼的小诱饵”,Anim。行为。认知5,341-367。
[37] Porfiri,M.和Ruiz Marín,M.[2018]“通过传递熵推断时变网络,布尔网络模型的情况”,Chaos28103123·Zbl 1400.90082号
[38] Qian,J.,Diez,I.,Ortiz-Terán,L.,Bonadio,C.,Liddell,T.,GoñI,J.&Sepulcre,J.[2018]“正连通性预测人脑网络的动态内在拓扑结构”,Front。系统。《神经科学》12、38。
[39] Quiroga,R.,Kraskov,A.,Kreuz,T.&Grassberger,P.[2002]“实际数据中不同同步措施的性能:脑电图信号的案例研究”,《物理学》。修订版E65041903。
[40] Runge,J.[2018]“从时间序列重构因果网络:从理论假设到实际估计”,Chaos28,075310·Zbl 1396.62218号
[41] Runge,J.,Bathiany,S.,Bolt,E.,Camps-Valls,G.,Coumou,D.,Deyle,E.,Glymour,C.,Kretschmer,M.,Mahecha,M..,Muñoz-Marí,J.等人[2019]“从地球系统科学中的时间序列推断因果关系”,《国家公社》第10期,第1-13页。
[42] Schelter,B.、Winterhalder,M.、Eichler,M.,Peifer,M..、Hellwig,B.、Guschlbauer,B.、Lücking,C.、Dahlhaus,R.和Timmer,J.[2006]“使用部分定向一致性测试神经信号之间的定向影响”,《神经科学杂志》。方法152,210-219。
[43] Schindlerova,K.【2011年】,“格兰杰因果关系和转移熵的等价性:推广”,应用。数学。科学5,3637-3648·Zbl 1242.62096号
[44] Schreiber,T.[2000]“测量信息传递”,《物理学》。修订稿85,461。
[45] Seth,A.、Barrett,A.和Barnett,L.【2015】“神经科学和神经成像中的Granger因果关系分析”,《神经科学杂志》,第35卷,第3293-3297页。
[46] Siggiridou,E.,Koutlis,C.,Tsimpiris,A.,Kimiskidis,V.&Kugiumtzis,D.[2015]“多变量时间序列的因果网络及其在癫痫中的应用”,第37届国际会议IEEE医学与生物学会工程(EMBC),第4041-4044页。
[47] Sipahi,R.&Porfiri,M.[2020]“利用时延改进基于传递熵的网络重建:方法和验证”,Chaos30231225·兹比尔1432.37108
[48] Smirnov,D.[2013]“传递熵的虚假因果关系”,《物理学》。版本E87,042917。
[49] Spencer,E.、Martinet,L.-E.、Eskandar,E.,Chu,C.、Kolaczyk,E.、Cash,S.、Eden,U.和Kramer,M.[2018]“通过时间平滑提高Granger-casause分析能力的程序”,《神经科学杂志》。方法308,48-61。
[50] Stramaglia,S.、Cortes,J.和Marinazzo,D.[2014]“动力学网络格兰杰因果分析中的Scynergy和冗余”,《新物理学杂志》第16卷,第105003页。
[51] Sun,J.&Bollt,E.[2014]“因果熵确定了间接影响、邻域优势和预期耦合”,《物理学》D267,49-57·Zbl 1285.62009号
[52] Takens,F.[1981]“检测湍流中的奇怪吸引子”,《动力系统与湍流》,沃里克1980年,兰德·D·杨·L·S编辑(施普林格,柏林,海德堡),第366-381页·Zbl 0513.58032号
[53] Toriumi,F.&Komura,K.[2018]“基于传递熵的信息传播的投资指数构建”,计算。经济学51,159-172。
[54] Upadhyay,S.、Banerjee,A.和Panigrahi,P.[2020]“金融网络中全球危机的因果演变”,《物理学》A554,124690。
[55] Vakorin,V.、Krakovska,O.和McIntosh,A.[2009]“间接联系对因果关系估计的混淆效应”,《神经科学杂志》。方法184,152-160。
[56] Verdes,P.[2005]“从多元时间序列评估因果关系”,Phys。修订版E72026222。
[57] Wallot,S.&Mönster,D.[2018]“在matlab中估计多维时间序列嵌入参数时平均互信息(ami)和伪最近邻(fnn)的计算”,Front。《心理学》第9卷,1679年。
[58] Yao,D.&Zhan,X.[2018]“基于随机森林的特征选择算法研究”,Proc。第四届国际电子工程与信息科学大会(ICEEIS 2017),中国海口,第151页。
[59] Yu,G.-H.和Huang,C.-C.[2001]“无分布绘图位置”,Stochast。环境。Res.风险评估.15,462-476·Zbl 0988.62001号
[60] Zachariadis,T.[2006]“关于能源和经济之间因果关系的探索”,讨论文件2006-05,塞浦路斯大学,技术代表。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。