跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
J应用统计。2023; 50(15): 3125–3141.
2022年7月21日在线发布。 数字对象标识:10.1080/02664763.2022.2101631
PMCID公司:项目经理10631386
PMID:37969547

信息源的复杂性

摘要

计算复杂系统的熵是科学和工程问题中的一个重要问题。然而,当直接计算熵时,这种计算通常计算量很大。本文介绍了三类信息源,每类信息源的所有成员的熵值都相同。这些类是根据Ω上的三种自映射创建的特殊动力学来表征的,并且A类,其中Ω是概率空间A类是一个有限集。对信息源乘积的秩变量进行了近似,证明了两个信息源乘乘积的拓扑熵等于它们的拓扑熵之和。

关键词:拓扑熵、度量熵、置换拓扑熵、置换度量熵、信息源、量子信息系统
AMS分类:37B40、94A17、37M25、54C70

1.简介

熵是确定动力系统复杂性的主要工具之一[1,2,4,7,14,17,19]. 1981年,测量理论和拓扑熵被广泛研究[26]. 置换熵的概念是在2002年提出的,作为时间序列复杂性的一种替代度量[6]. 2010年,研究了信息和排列熵之间的关系[1]. 在接下来的几年里,研究了超动力系统的香农熵[10]证明了该熵的加法定理和Kolmogorov-Sinai定理[14]. 然后在2017年,引入了超系统的信息熵[15]. 2019年提出了超群上系统的熵,其中计算了化学代数和一些基本系统的熵[16]. 然而,熵理论中的一个重要问题是如何计算高度复杂系统的熵。具体地说,当所考虑的系统的复杂程度很高时,使用其定义计算熵通常是不可能的,或者至少是非常昂贵的。

许多研究人员致力于开发适当的方法来计算复杂系统的熵。一种方法是使用考虑中的系统的特殊物理结构。基于这一思想,我们采用了一些方法来计算系统的热力学熵和量子信息系统的熵[9]. 另一种方法是确定与第一个系统共轭的系统的熵,并且计算其熵的成本更低。第三种方法是计算信息源的置换熵,并使用结果确定所考虑系统的熵[1,2,26]. 在许多系统的情况下,可以将它们的熵与特殊信息源的置换熵联系起来[1,6,13]. 作为一个经典示例,通过离散系统并将其视为信息源来计算一类SDE的熵[25]. 应该注意的是,与直接计算熵的方法相比,使用算法方法计算置换熵通常要容易得多。

本文提出了一种确定信息源排列熵的方法。为了计算给定信息源的熵,我们通过适当的测度保持函数找到另一个具有相同置换熵的信息源。我们还证明了两个信息源的乘积的拓扑熵等于两个信息源的熵之和。我们还发现了R(右)n个×T型使用R(右)n个R(右)n个T型这些边界可以帮助近似信息源的置换熵。

2.前期工作

在本节中,我们简要回顾了一些对我们研究至关重要的概念。有关更多详细信息,请参阅[,11,18–23]. 在本文中,假设(Ω,F类,μ)是一个概率空间。

2.1. 信息来源

是Ω离散有限状态空间上的随机变量A类={1,,|A类|}.A映射第页:A类[0,1]由定义第页()=μ{ωΩ:(ω)=}现在,香农熵[1]第页,共页由提供

H(H)μ()=A类第页()日志第页().

有限空间随机过程是一个序列(n个)随机变量的n个:ΩA类,其中n个N个0={0,1,2,}由于本文考虑的信息源基本上是离散时间随机过程,因此我们可以将随机过程的图像视为一组离散点(图1).

保存图片、插图等的外部文件。对象名称为CJAS_A_2101631_F0001_OB.jpg

随机过程的图像具有A类={1,2,}Ω={u个,w个}。每个“星”表示u个,每个“加号”代表w个.

对于L(左)1n个0,映射第页n个,L(左):A类L(左)[0,1]可以由定义

第页n个,L(左)(0,,L(左)1)=μ{ωΩ:n个(ω)=0,,n个+L(左)1(ω)=L(左)1}.

一个过程称为静止n个0L(左)1,第页0,L(左)=第页n个,L(左).

假设A类配备了离散拓扑,并让(A类N个0,τ)是产品拓扑空间,其中τ是产品拓扑。这套A类0,,L(左)1={ξA类N个0:ξ0=0,,ξL(左)1=L(左)1}称为气缸组。所有气缸组的集合是τ。此集合可以配备概率度量由定义

(A类0,,L(左)1)=第页0,L(左)(0,,L(左)1).

考虑到单侧移位映射

Σ:A类N个0A类N个0(n个)(n个+1),

-保留,遍历性的概念可以为信息源定义如下所示。来源如果∑相对于测度是遍历的,则称为遍历的.

2.2. 信息源的熵

在整篇论文中L(左)-元组(0,,L(左)1)表示为0L(左)1,其中L(左)1.的拓扑熵0L(左)1由定义[1,2]

H(H)t吨第页(0L(左)1)=1L(左)日志N个(,L(左)),

在哪儿N个(,L(左))是的图像0L(左)1具体来说,

N个(,L(左))={(0(ω),,L(左)1(ω)):ωΩ}.

拓扑熵由定义

小时t吨第页()=酸橙酱L(左)H(H)t吨第页(0L(左)1).

对于L(左)-元组0L(左)1,香农熵由下式给出[1,2]

H(H)(0L(左)1)=1L(左)0,,L(左)1((0,,L(左)1)日志(0,,L(左)1)).

源的香农熵由定义[1,2]

小时()=L(左)(H(H)(0L(左)1)).

定理2.1

我们有:2H(H)(01)H(H)(0)+H(H)(1).

证明。

1随心所欲。我们有

0第页0,1(0,1)=0μ{ωΩ:0(ω)=0,1(ω)=1}=0μ{ωΩ:1(ω)=1}=第页(1).

因此,

0第页(0|1)=0第页0,1(0,1)第页(1)=1,对于每一个1.

功能

小时(x个)={x个日志x个;x个00;x个=0,

是凸的,即每个1,,k个[0,+)0α0,,αk个1具有=0k个α=1,我们有小时(=0k个α)=0k个α小时()因此,对于每个0,我们得到

(1第页(0|1)第页(1))日志(1第页(0|1)第页(1))1第页(1)(第页(0|1)日志第页(0|1)),

第页(0)日志第页(0)1第页(0|1)第页(1)日志第页(0|1).

因此,

0,1第页0,1(0,1)日志第页0,1(0,1)=0,1第页(0|1)第页(1)日志(第页(0|1)第页(1))=0,1第页(0|1)第页(1)(日志第页(0|1)+日志第页(1))=0,1第页(0|1)第页(1)日志第页(0|1)+0,1第页(0|1)第页(1)日志第页(1)=0,1第页(0|1)第页(1)日志第页(0|1)+1第页(1)日志第页(1)0第页(0)日志第页(0)+1第页(1)日志第页(1).

因此,

0,1第页0,1(0,1)日志第页0,1(0,1)20第页(0)日志第页(0)2+1第页(1)日志第页(1)2.

因此,我们得到

H(H)(0,1)H(H)(0)2+H(H)(1)2.

可以很容易地进行检查H(H)(0L(左)1)小时t吨第页(0L(左)1)因此,

小时()小时t吨第页().

现在考虑字母表A类信息源的被赋予命令'“所以(A类,)是一个完全有序的集合。新的排序“≺”在A类由''如下所示:

j个如果只有如果<j个(=j个<j个).

A序列k个k个+L(左)1=(k个,,k个+L(左)1)长度的L(左)据说有订单模式π如果

k个+π(0)k个+π(1)k个+π(L(左)1),

哪里,j个A类,k个N个j个.

根据上面定义的新排序,可以将排列与每个单词相关联。这种分配不一定是一对一的。

例2.2

我们假设A类是一组英语字母及其通常的顺序,即A<B<C<D<…<Z。然后单词“INFORMATION”可以表示为010=(,N个,F类,O(运行),R(右),M(M),A类,T型,,O(运行),N个)现在,我们可以关联置换π“信息”一词由π(0)=6,π(1)=2,π(2)=0,π()=8,π(4)=5,π(5)=1,π(6)=10,π(7)=,π(8)=9,π(9)=4、和π(10)=7.我们有0=,1=N个,2=F类,=O(运行),4=R(右),5=M(M),6=A类,7=T型,8=,9=O(运行)、和10=N个最后,通过排序定义,我们得到62085110947.

示例2.3

考虑英语字母集及其排序06=(电子,N个,T型,R(右),O(运行),P(P),Y(Y))06=(A类,B类,电子,F类,D类,C类,G公司),我们可以关联映射π=[0,1,4,5,,2,6]因此,将排列与单词关联起来的映射可能不一定是一对一的。

每个词对置换的依赖性导致了度量熵和拓扑置换熵的定义。发送到源=(n个)n个N个0,一个概率过程R(右)=(R(右)n个)n个N个0可以关联,由定义

R(右)n个(ω)==0n个δ((ω)n个(ω)),

哪里

δ((ω)n个(ω))={1;(ω)n个(ω)0;否则

序列R(右)=(R(右)n个)n个N个0定义了一个非平稳的离散时间过程。如果这个词第页0L(左)1对应于0L(左)1、和0L(左)1定义排列π,然后是π第页0L(左)1是一对一的。

在示例2.2中,如果010=(,N个,F类,O(运行),R(右),M(M),A类,T型,,O(运行),N个),然后

第页0=1,第页1=2,第页2=1,第页=4,第页4=5,第页5=,第页6=1,第页7=8,第页8=4,第页9=8,第页10=7

因此,排列[6,2,0,8,5,1,10,,9,4,7]对应于单词

第页010=(1,2,1,4,5,,1,8,4,8,7).

度量置换熵L(左)-元组0L(左)1[1,2]由定义

H(H)(0L(左)1)=H(H)(R(右)0L(左)1)=1L(左)1第页0,,第页L(左)1(第页0L(左)1)日志(第页0L(左)1).

源的度量置换熵[1,2]由提供

小时()=酸橙酱L(左)H(H)(0L(左)1).

类似地L(左)-元组0L(左)1[1,2]由定义

H(H)t吨第页(0L(左)1)=H(H)t吨第页(R(右)0L(左)1)=1L(左)1×日志N个(R(右),L(左)).

最后,源的拓扑置换熵[1,2]由提供

小时t吨第页()=酸橙酱L(左)H(H)t吨第页(0L(左)1)=小时(R(右)).

3.三类信息源

考虑概率测度空间(Ω,F类,μ).让=(n个)n个N个0使用字母表作为有限字母源A类,假设(f):ΩΩ是一个保持度量值的映射。致这对夫妇(,(f)),我们关联另一个有限字母源(f)=(n个(f))n个N个0,其中

n个(f):ΩA类n个(f)(ω)n个((f)(ω)).

在这一节中,我们找到了连接信息源的每个熵的一些关系,包括度量熵、拓扑熵、置换度量熵和置换拓扑熵(f)。然后我们联系到这对夫妇(,(f)),另一个有限字母源并找出度量熵、拓扑熵、置换度量熵和置换拓扑熵之间的一些联系和熵=(n个),其中

n个:ΩA类n个(ω)(n个(ω)).

同时,我们定义了源G公司用于地图1,2,,其中G公司=(1,2,),我们将上述四种类型的熵中的每一种应用于源时都联系起来熵应用于G公司,其中

G公司n个:ΩA类G公司n个(ω)n个(n个)(ω)),

G公司=(G公司n个).

定理3.1

我们有

  1. 小时((f))=小时(),
  2. 小时t吨第页((f))小时t吨第页(),如果(f)是一张俯瞰图。

证明。

(3.1)自(f)我们保留了度量

μ(01(0)L(左)11(L(左)1))=μ((f)1(01(0)L(左)11(L(左)1)))=第页0,L(左)(0,,L(左)1).

因此,

μ{ωΩ:0(ω)=0,,L(左)1(ω)=L(左)1}=μ{ωΩ:0((f)(ω))=0,,L(左)1((f)(ω))=L(左)1}=第页0,L(左)(0,,L(左)1).

因此,

H(H)(0(f)L(左)1)=1L(左)0,,L(左)1(0,,L(左)1)日志(0,,L(左)1)=H(H)(0L(左)1).

因此,小时((f))=小时().

(3.1)假设(0,,L(左)1)是一个长单词L(左)在以下消息中观察到的(f)显然,(0,,L(左)1)是一个长单词L(左)可以从以下信息中观察到因此,N个((f),L(左))N个(,L(左))因此,我们得到

小时t吨第页((f))=酸橙酱L(左)1L(左)日志N个((f),L(左))小时t吨第页()=酸橙酱L(左)1L(左)日志N个(,L(左)).

如果(f)是一张地形图,并且0L(左)1=(0,,L(左)1)是一个长单词L(左)可以在以下消息中观察到,然后有一个ωΩ这样的话0(ω)=0,,L(左)1(ω)=L(左)1、和ω=(f)(ω1)对于ω1Ω。因此,

0=0((f)(ω1)),,L(左)1=L(左)1((f)(ω1)).

因此,(0,,L(左)1)是一个长单词L(左)可以在的消息中观察到(f)因此,我们有N个(,L(左))N个((f),L(左))、和

小时t吨第页()=酸橙酱L(左)1L(左)日志N个(,L(左))小时t吨第页((f))=酸橙酱L(左)1L(左)日志N个((f),L(左)).

因此,小时t吨第页()=小时t吨第页((f)).

定义3.2

(f):ΩΩ成为一张保存度量的地图。我们说信息来源保存(f)或者它是(f)-保留if满足以下属性:

(x个)j个(x个)((f)(x个))j个((f)(x个))=0,1,2,.
(1)

备注3.3

如果是递增序列还是递减序列,那么(f)-每一个保测度映射的保测度(f).

定理3.4

如果(f):ΩΩ是一个保留度量值的映射,并且是一个(f)-保存信息源,然后小时t吨第页((f))=小时t吨第页()小时((f))=小时().

证明。

R(右)n个:Ω{1,,n个+1}、和R(右)n个(f):Ω{1,,n个+1}是信息源的秩变量(f)分别为。(f)-保存,我们得到

R(右)n个(ω)==0n个δ((ω)n个(ω))==0n个δ((f)(ω)n个(f)(ω))=R(右)n个(f)(ω).

因此,对于每个L(左),R(右)n个=R(右)n个(f),N个(R(右),L(左))=N个(R(右)(f),L(左))、和

H(H)t吨第页(0L(左)1)=1L(左)1×日志N个(R(右),L(左))=1L(左)1×日志N个(R(右)(f),L(左))=H(H)t吨第页((f)0L(左)1).

因此,

小时t吨第页()=L(左)1L(左)1日志N个(R(右),L(左))=L(左)1L(左)1日志N个(R(右)(f),L(左))=小时t吨第页((f)).

同样,对于每个L(左),我们有

H(H)(0(f)L(左)1)=1L(左)第页0,,第页L(左)1(第页0,,第页L(左)1)日志(第页0,,第页L(左)1)=H(H)(0L(左)1).

因此,我们得到

小时((f))=L(左)H(H)(0(f)L(左)1)=L(左)1L(左)第页0,,第页L(左)1(第页0,,第页L(左)1)日志(第页0,,第页L(左)1)=L(左)H(H)(0L(左)1)=小时().

对于函数:A类A类和信息源,我们定义信息源通过n个=n个.

定理3.5

如果:A类A类是一个双射函数

  1. 小时t吨第页()=小时t吨第页(),
  2. 小时()=小时().

证明。

Ω(0,,L(左)1)={ωΩ:0(ω)=0,,L(左)1(ω)=L(左)1}.

我们有

ωΩ((0),,(L(左)1))0(ω)=(0),,L(左)1(ω)=(L(左)1)ω01((0))(L(左)1)1((L(左)1))ωΩ(0,,L(左)1)0(ω)=0,,L(左)1(ω)=L(左)1.

因此,

ω01(0)L(左)11(L(左)1)ω01((0))(L(左)1)1((L(左)1)).

因此,我们得到

Ω(0,,L(左)1)=Ω((0),,(L(左)1)).

因此N个(,L(左))单词的长度L(左)可以是信息源的输出等于这个数字N个(,L(左))单词的长度L(左)可以是信息源的输出因此,对于每个L(左),我们有

1L(左)日志(N个(,L(左)))=1L(左)(N个(),L(左))).

因此,

小时t吨第页()=L(左)1L(左)日志(N个(),L(左)))=L(左)1L(左)日志(N个(,L(左)))=小时t吨第页().

同样,我们有

小时()=1L(左)0,,L(左)1A类((0,,L(左)1)日志(0,,L(左)1))=小时().

持有最后一个等式的原因是0,,L(左)1可以在信息源的消息中观察到当且仅当0,,L(左)1可以在信息源的消息中观察到.

备注3.6

如果A类是无限的,并且:A类A类是一对一递增的,那么我们可以证明小时t吨第页()=小时t吨第页()、和小时()=小时().

对于一系列函数:A类A类,=1,2,和信息源,我们定义信息源G公司通过G公司n个=n个n个,其中G公司=(1,2,).

定理3.7

如果:A类A类,=1,2,,是一个双射函数族,那么

  1. 小时t吨第页(G公司)=小时t吨第页(),
  2. 小时(G公司)=小时().

证明。

我们有

ωΩ(0(0),,L(左)1(L(左)1))G公司G公司0(ω)=0(0),,G公司L(左)1(ω)=L(左)1(L(左)1)ωG公司01(0(0))G公司(L(左)1)1(L(左)1(L(左)1))ωΩ(0,,L(左)1)0(ω)=0,,L(左)1(ω)=L(左)1.

因此,我们得到

Ω(0,,L(左)1)=Ω(0(0),,L(左)1(L(左)1))G公司.

因此,数字N个(,L(左))单词的长度L(左)可以是信息源的输出等于这个数字N个(G公司,L(左))单词的长度L(左)可以是信息源的输出G公司、和

1L(左)(N个(G公司),L(左)))=1L(左)日志(N个(,L(左))),

对于每个L(左)因此,我们得到

小时t吨第页(G公司)=L(左)1L(左)日志(N个(G公司),L(左)))=L(左)1L(左)日志(N个(,L(左)))=小时t吨第页().

同样,我们有

小时(G公司)=1L(左)0,,L(左)1A类((0,,L(左)1)日志(0,,L(左)1))=小时().

明确地,0,,L(左)1可以在信息源的消息中观察到当且仅当0,,L(左)1可以在信息源的消息中观察到G公司。因此,小时t吨第页(G公司)=小时t吨第页()、和小时(G公司)=小时().

备注3.8

:A类A类是一个双射函数,让G公司=(,2,,).然后小时t吨第页(G公司)=小时t吨第页()、和小时(G公司)=小时().

4.源产品的熵

如果(Ω1,F类1,μ1)(Ω2,F类2,μ2)是两个概率测度空间,那么(Ω1×Ω2,F类1×F类2,μ1×μ2)与乘积测度是一个概率测度空间。如果T型是两个具有有限字母的信息源A类1A类2,然后×T型是有限字母表的信息源A类1×A类2.

定理4.1

(Ω1,F类1,μ1)(Ω2,F类2,μ2)是两个概率测度空间,假设T型是两个具有有限字母的信息源A类1A类2分别是。然后小时t吨第页(×T型)=小时t吨第页()+小时t吨第页(T型).

证明。

我们有

(ω1,ω2)(×T型)01(0,t吨0)(×T型)L(左)11(L(左)1,t吨L(左)1)(×T型)0(ω1,ω2)=(0,t吨0),,(×T型)L(左)1(ω1,ω2)=(L(左)1,t吨L(左)1)(ω1)=,T型(ω2)=t吨对于每一个0L(左)1ω101(0).L(左)11(L(左)1)ω2T型01(t吨0).T型L(左)11(t吨L(左)1).

这意味着((0,t吨0),,(L(左)1,t吨L(左)1))是一个长单词L(左)在源消息中观察到的×T型当且仅当(0,,L(左)1)是一个长单词L(左)在源消息中观察到的、和(t吨0,,t吨L(左)1)是一个长单词L(左)在源消息中观察到的T型因此,我们有

N个(×T型,L(左))=N个(,L(左))×N个(T型,L(左)),

为所有人L(左)1因此,我们得到

日志(N个(×T型,L(左)))=日志(N个(,L(左))×N个(T型,L(左)))=日志(N个(,L(左)))+日志(N个(T型,L(左))),

为所有人L(左)1因此,小时t吨第页(×T型)=小时t吨第页()+小时t吨第页(T型).

备注4.2

(Ω,F类,μ),=1,2,,k个是测度空间的有限族。假设是有限字母的信息源吗A类.然后

小时t吨第页(1××k个)==1k个(小时t吨第页()).

R(右)n个,R(右)n个T型R(右)n个×T型是信息源的秩变量,T型×T型分别,其中A类1×A类2是词典编纂顺序,即。(,b条)(c(c),d日)(<c(c)或( = c(c)b条d日)). 则定理4.3成立。

定理4.3

根据前面的注释,我们有

R(右)n个(ω1)+R(右)n个T型(ω2)n个1R(右)n个×T型(ω1,ω2)R(右)n个(ω1).

证明。

A类={:0n个,(ω1)>n个(ω1)},B类={:0n个,(ω1)=n个(ω1),T型(ω2)>T型n个(ω2)},

C类={:0n个,((ω1),T型(ω2))>(n个(ω1),T型n个(ω2))}.

然后C类=A类B类、和集合A类B类是不相交的。因此,|C类|=|A类|+|B类|另一方面,我们有|A类|=n个+1R(右)n个(ω1),|C类|=n个+1R(右)n个×T型(ω1,ω2)|B类|n个+1R(右)n个T型(ω2)因此,我们得到

n个+1R(右)n个×T型(ω1,ω2){n个+1R(右)n个(ω1)}n个+1R(右)n个T型(ω2).

因此,我们

R(右)n个(ω1)+R(右)n个T型(ω2)n个1R(右)n个×T型(ω1,ω2).

第二个不等式显而易见,因为如果((ω1),T型(ω2))(n个(ω1),T型n个(ω2)),然后(ω1)n个(ω1).

5.信息理论和统计学的应用

本节分为两部分。在第一部分中,提供了一些信息和置换熵的计算示例。下一部分给出了一个数值例子,其中条件信息熵被应用于研究语言模型中的不对称问题。

5.1. 信息论示例

随机过程是随着时间的推移随机现象发生的数学模型,被广泛用作以随机方式变化的系统和现象的数学模型。例如,当一个随机实验被反复重复时,情况就是这样。T型:=R(右)(T型:=ZT型:=R(右)0T型:=Z0). 从形式上讲,随机过程是一系列随机变量={t吨}t吨T型关于公共概率空间(Ω,F类,μ)称为样本空间,在可测量空间中取值(A类,τ)称为状态空间。从技术上讲,这意味着t吨:ΩA类是一张可测量的地图t吨T型,即。t吨1(B类)F类为所有人B类τ.地图t吨t吨(ω)是过程的轨迹X(X)与固定采样点关联ωΩ.正如概率论和统计学中常见的那样,随机变量的实现将用相同的字母以小写表示,即。(ω)=x个.

例5.1

Ω=[0,1].我们配备[0,1]用Borel测度sigma-代数(由R(右)具有[0,1]),我们定义

H(H)n个1=k个=02n个11[2k个2n个,2k个+12n个),

对于n个=1,2,假设字母表A类是离散集{0,1},我们定义地图n个:[0,1]{0.1}通过

n个(x个)={1;x个H(H)n个0;x个H(H)n个,

对于n个=0,1,2,.然后针对每个L(左)=1,2,,我们有N个(,L(左))=2L(左)因此,我们得到

小时t吨第页()=L(左)1L(左)日志2L(左)=日志2

上述计算由Amig完成[4]. 现在,我们将此示例扩展为(f).

考虑对称满射测度保持帐篷映射(f):[0,1][0,1]由定义

(f)(x个)=1|12x个|={2x个;0x个122(1x个);12x个1.

那么,我们有

小时t吨第页((f))=小时t吨第页()=日志2小时((f))=小时().

例5.2

我们假设Ω是区间[0,1]配备Borel度量sigma-代数,我们定义

H(H)0=(12,1),H(H)n个=H(H)0{1,12,,1n个},

对于n个=1,2,假设字母表A类是离散集{0,1},然后定义映射n个:[0,1]{0.1}通过

n个(x个)={1;x个H(H)n个0;x个H(H)n个,

对于n个=0,1,2,.然后小时t吨第页()=2。对于0<c(c)<1,我们定义了测度保持Λ转型Λc(c):[0,1][0,1]通过

Λc(c)(x个)={1c(c)x个;0x个c(c)11c(c)x个+11c(c);c(c)<x个1.

n个是一个递增序列,它保留了度量保持映射Λc(c)因此,我们有

小时t吨第页(Λc(c))=小时t吨第页()=2小时(Λc(c))=小时().

示例5.3

与示例5.2类似,我们假设Ω=[0,1]配备了Borel sigma-代数,我们定义

H(H)0=(12,1),H(H)n个=H(H)0{1,12,,1n个},

对于n个=1,2,.让字母表成为集合A类={0,1}。我们定义映射n个:[0,1]{0.1}通过

n个(x个)={1;x个H(H)n个0;x个H(H)n个,

对于n个=0,1,2,因此,小时t吨第页()=2.我们还考虑了保测度映射(f):[0,1][0,1]由定义

(f)(x个)={2x个;0x个<122x个1;12x个1.

n个是一个递增序列,它保留了度量保持映射(f)因此,我们得到

小时t吨第页((f))=小时t吨第页()=2小时((f))=小时().

示例5.4

定义地图:{0,1}{0,1},=1,2,,由

(x个)={x个;=2k个1x个;=2k个+1.

G公司={1,2,}假设是这样是备注3.3中给出的来源。然后小时t吨第页(G公司)=小时t吨第页()、和小时(G公司)=小时().

示例5.5

定义地图:{0,1}{0,1},=1,2,,由

(x个)={x个;=2k个1x个;=2k个+1.

G公司={1,2,}并假设是备注3.3中给出的来源。然后小时t吨第页(G公司)=小时t吨第页()、和小时(G公司)=小时().

5.2. 一个数值示例

我们考虑了第14.3.2节中提供的数据[12]它对应于从历史文本语料库中提取的单词序列。这些数据包括源文本特定部分的字母频率,并分为两组,语料库I和语料库II。X(X)Y(Y)是分别对应于语料库I和语料库II的两个信息源。可以证明,对于每个度量保持映射(f),信息源的条件信息熵X(X)(f)给出了来源Y(Y)(f)等于的条件信息熵X(X)鉴于Y(Y)具体来说,我们有

H(H)(X(X)(f)Y(Y)(f))=H(H)(X(X)Y(Y)),
(2)

哪里

H(H)(X(X)Y(Y))=H(H)(X(X),Y(Y))H(H)(Y(Y)).
(3)

因此,为了研究与X(X)(f)Y(Y)(f),只需使用H(H)X(X)H(H)Y(Y).

1给出了概率密度函数P(P)X(X)P(P)Y(Y)和熵X(X)Y(Y)使用以下联合概率计算X(X)Y(Y)其定义为P(P)X(X)Y(Y)=P(P)X(X)P(P)Y(Y)计算表明H(H)(X(X)Y(Y))=2.62519H(H)(Y(Y)X(X))=2.64793这些值表示语言模型中通常出现的不对称。

表1。

信息源的概率密度和熵的值X(X)Y(Y)对应于语料库I和语料库II文本数据。

信件 P(P)X(X)(x个) P(P)Y(Y)() H(H)(X(X)) H(H)(Y(Y))
0.0964964960.110010010.2256330.242812
b条0.0010010010.0010010010.2325460.249726
c(c)0.1014014010.0985985990.4646210.478149
d日0.0010010010.0010010010.4715340.485063
e(电子)0.039939940.0421421420.6001560.618515
(f)0000
0.0010010010.0010010010.607070.625428
小时0.0487487490.0459459460.7543430.766955
0.1676676680.1664664661.053761.06542
j个0.0010010010.0010010011.060671.07234
k个0000
0.0643643640.0621621621.237241.24502
0.0506506510.049749751.388321.39431
n个0.0993993990.0975975981.617791.62141
0.0837837840.0841841841.825541.82975
第页0.020420420.020120121.9051.90834
q个0.020420420.0291291291.984462.01134
第页0000
0000
t吨0.0740740740.0736736742.177252.20349
u个0.0652652650.0621621622.355382.37617
v(v)0000
w个0000
x个0.019519520.0191191192.432212.45183
0.0185185190.0191191192.506082.52748
z(z)0.0253253250.0258258262.599182.62191a美元

6.结论

介绍了相位空间具有动态特性的三类特定信息源。具体来说,对于配备映射的相空间Ω(f):ΩΩ,约束动力学的条件(f)给出了保持置换熵的相空间。给出了计算信息熵和置换熵的一些例子。这些源的熵的条件版本应用于文本数据。

本文讨论的Kullback-Leibler发散和熵之间的联系是一个值得进一步研究的问题。此外,研究拓扑聚合[24]对应于拓扑熵是进一步研究的潜在方向。

披露声明

提交人没有报告任何潜在的利益冲突。

工具书类

1Amigo J.M。,动力系统中的置换复杂性“有序模式、置换熵和所有这些”2010年,柏林,施普林格-弗拉格出版社。[谷歌学者]
2Amigo J.M.和犬舍M.B。,拓扑置换熵,物理D.231(2007),第137-142页。[谷歌学者]
三。Ashtari Nezhad E.、Waghei Y.、Mohtashami Borzadaran G.R.、Nilli Sani H.R.和Alizadeh Noughabi H。,基于修正置换熵的时间序列独立性检验,Commun公司。统计–模拟。计算。 48(2019年),第2877–2897页。doi:10.1080/03610918.2018.1469761。[交叉参考][谷歌学者]
4Bahnmuller J.和Bogenschutz T。,随机动力系统的Margulis–Ruelle不等式,数学档案馆.64(1995年),第246-253页。[谷歌学者]
5Bandt C.、Keller G.和Pompe B。,基于置换的区间映射熵,非线性.15(2002),第1595-1602页。[谷歌学者]
6Bandt C.和Pompe B。,置换熵:时间序列的自然复杂性度量,物理学。修订稿。 88(2002年),第102–174页。[公共医学][谷歌学者]
7Corda C.、FatehiNia M.、Molaei M.R.和Sayyari Y。,迭代函数系统的熵及其与黑洞和类玻尔黑洞熵的关系,.20(2018),第56页。[PMC免费文章][公共医学][谷歌学者]
8迪纳堡E.I。,拓扑熵与度量熵的关系,俄罗斯科学院。科学。 190(1970年),第19-22页。[谷歌学者]
9.Diósi L。,量子信息理论短期课程2011年,柏林,施普林格-弗拉格出版社。[谷歌学者]
10Ebrahimi M.和Mehrpooya A。,几何在代数中的应用:超MV-代数的不确定性《第七届几何与拓扑研讨会论文集》,德黑兰,2014年,第529-534页。
11埃文斯·L.G。,随机微分方程简介,卷。82,美国数学学会,2013年。[谷歌学者]
12Fan J.和Pan J。,当代实验设计、多元分析和数据挖掘,施普林格国际出版社,商会,2020。[谷歌学者]
13灰色R.M。,熵与信息论,施普林格-弗拉格出版社,纽约,1990年。[谷歌学者]
14Mehrpooya A.、Ebrahimi M.和Davvaz B,半独立超MV-代数动力系统的熵,柔软。输出。 20(2016),第1263-1276页。doi:10.1007/s00500-015-1850-y[交叉参考][谷歌学者]
15Mehrpooya A.、Ebrahimi M.和Davvaz B。,超MV-代数上动力系统的两种不同方法及其信息熵,欧洲物理学会。J.Plus公司.132(2017),第1-27页。[谷歌学者]
16Mehrpooya A.、Sayyari Y.和Molaei M.R。,交换超群的代数熵和Shannon熵及其与信息熵、置换熵和化学代数熵计算的联系,柔软。计算。 24(2019年),第13035–13053页。[谷歌学者]
17Najmizadeh S.、Toomanian M.、Molaei M.R.和Nasirzade T。,场地离散动力系统的Bekenstein-Hawking熵,国防部。物理学。莱特。A类,34(32) (2019), 1950265.[谷歌学者]
18Patrao M。,非紧度量空间的熵及其变分原理,埃尔戈德。西奥。动态。系统。 30(2010),第1529–1542页。[谷歌学者]
19Sayyari Y。,信息源熵上界的改进,数学杂志。提取。 15(2021年),第1-12页。[谷歌学者]
20Sayyari Y。,信息源熵的新界,小波与线性代数.7(2020年),第1-9页。[谷歌学者]
21Sayyari Y。,一致凸函数的新熵界,混沌、孤子和分形.141(2020年),第110360页。doi:10.1016/j.chaos.2020.110360。[交叉参考][谷歌学者]
22.Sayyari Y。,信息源熵上界的一种改进,数学杂志。提取。 15(2021年),第1-12页。[谷歌学者]
23.Sayyari Y。,Jensen–Simic–Mercer不等式的改进及其对熵的应用,韩国社会数学杂志。教育部。序列号。B-纯应用。数学。 29(2022年),第51-57页。[谷歌学者]
24斯特利克·M·。,拓扑聚合函数的收敛性,模糊集系统。 287(2016),第48-56页。[谷歌学者]
25.Waezizadeh T.、Mehrpooya A.、Rezaeizadeh M.和Yarahmadian S。,高血压和应激对肾脏影响的数学模型及其不确定性,数学。Biosci公司。 305(2018),第77-95页。[公共医学][谷歌学者]
26沃尔特斯·P。,遍历理论导论《施普林格-弗拉格》,纽约,2000年。[谷歌学者]

文章来自应用统计学杂志由以下人员提供泰勒和弗朗西斯