跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
J应用统计。2022年;49(7): 1615–1635.
2021年1月20日在线发布。 数字对象标识:10.1080/02664763.2021.1874891
预防性维修识别码:PMC9041776型
PMID:35707557

构造多个分布族的一种新的柔性广义族

关联数据

补充资料

摘要

我们建议新的柔性广义族(NFGF),用于构建许多分布族。NFGF的重要性在于,可以选择任何基线分布,并且它不涉及任何其他参数。确定了NFGF的一些有用的统计特性,如族密度的线性表示、密度和危险率的分析形状、随机变量生成、矩和生成函数。此外,名为新型柔性Kumaraswamy研究了(NFKw)分布,并用极大似然法估计了模型参数。进行了模拟研究,以评估评估的性能。通过三个实际数据集,实证证明了NFKw模型的有效性。事实上,双参数NFKw模型的性能优于三参数传输Kumaraswamy、三参数指数Kumarasawmy和著名的双参数Kumaraswarmy模型。

关键词:柔性G-族,广义族,Kumaraswamy分布,极大似然法,新柔性族,T-X族
2010年数学学科分类:60E05、60E10、62E10和62P12

1.简介

数据和模型在应用研究中同等重要。一类研究人员倾向于首先了解一种现象,另一类研究者则对通过拟合真实数据来测试模型感兴趣。我们无法进入这场无休止的辩论,而是倾向于遵循最后一个选项,以检查拟议系列、衍生子系列和来自生成器的特殊模型的适用性。这实际上是现代分布理论的主要目标之一,在现代分布理论中,人们提出了新的族和模型,然后通过或测试来解决不同领域中遇到的问题,例如可靠性和生存研究、工程、精算师、体育科学、农业等。这场革命使数据分析师能够处理来自不同现象的数据集。这样:(i)通过添加形状参数来扩展已建立的父模型;(ii)修改了母模型的功能形式;(iii)采用倒置和加权形式;(iv)通过变换、混合、合成、copula、卷积和复合方法提出了广义(G)类;(v) 除其他方法外,还研究了广义类的特殊模型。所有这些建议及其日益增长的兴趣导致了解决问题的新的替代方法,从而使人们能够得出一个清晰和结论性的结果,从而使研究活动保持温暖和活力。如需详细研究和讨论,请联系读者[9,13,15].

阿尔扎特雷. [2]介绍了使用变压器(T–X)方法。第页(t吨)是概率密度函数(pdf)和R(右)(t吨)是随机变量(rv)的累积分布函数(cdf)T型[,b条]对于<<b条<然后让W公司[G公司(x个)]是cdf的函数G公司(x个)或生存功能(sf)G公司¯(x个)=1G公司(x个)任何基线rv的(W公司(·)称为发电机),以便W公司[G公司(x个)]满足三个条件:

  1. W公司[G公司(x个)][,b条],
  2. W公司[G公司(x个)]可微且单调不递减,并且
  3. x个W公司[G公司(x个)]=x个W公司[G公司(x个)]=b条.

T–X家族的cdf是

F类T型X(X)(x个)=W公司[G公司(x个)]第页(t吨)d日t吨=R(右)(W公司[G公司(x个)]),
(1)

哪里W公司[G公司(x个)]满足条件(i)-(iii)。

方程式对应的pdf(1)是

(f)T型X(X)(x个)=第页(W公司[G公司(x个)])d日d日x个W公司[G公司(x个)].
(2)

在表中1,我们更新了先锋发电机W公司[G公司(x个)]它们是T–X家族的自然模型。在这里T型可以是=(0,1),R(右)+=(0,),R(右)=(,)。据我们所知,我们无法找到表中包含的任何其他发电机1.

表1。

先锋发电机的功能G公司(x个)(W[G(x)])。

T的范围 W公司[G公司(x个)]T–X系列的型号
G公司(x个)贝塔-G[4]
R(右)+ 日志G公司¯(x个)ZBgamma-G公司[17]
R(右)+ G公司(x个)/G公司¯(x个)奇数对数逻辑G[5]
R(右)+ [日志G公司¯(x个)]/G公司¯(x个)威布尔-G[1]
R(右) 日志[G公司(x个)/G公司¯(x个)]对数奇数逻辑-G[16]
R(右) 日志[日志G公司¯(x个)]物流-X[14]

存在一些G类,如Marshall-Olkin-G(MO-G)[11]指数G(exp-G),包括1型莱曼替代方案(LA1)和2型莱曼备选方案(LA2)[7],变速-G(Tr-G)[12],立方秩转换-G(CRTr-G)[6]和指数广义-G(EG-G)[]. 这六个G类(MO-G、LA1、LA2、Tr-G、CRTr-G和EG-G)尚未从任何现有的父模型中开发出来。

主要动机新的柔性广义族(简称NFGF)的分布为:

  • NFGF不是从任何类似于MO-G、LA1、LA2、Tr-G、CRTr和EG-G类的已知父模型开发的;
  • NFGF不包括任何额外参数;
  • 可以为NFGF选择任何基线模型;
  • NFGF生成的特殊模型不存在不可识别性问题。您可以选择指数模型或反转模型;
  • 基于NFGF的新特殊模型具有与现有母公司或其他竞争模型竞争的能力;
  • 与现有的母模型相比,基于NFGF的新的特殊模型可以生成密度和危险率(在某些情况下)的灵活形状;
  • NFGF的新的特殊模型可以提供比其他相应模型持续更好的拟合。

我们将论文展开如下。在节中2,我们提出了一种新的生成器,称为NFGF。在节中得到了它的一些数学性质,如族密度的线性表示、密度和危险率的解析形状、随机变量的生成、矩和生成函数。在节中4,我们定义了一个新型柔性Kumaraswamy(NFKw)分布并研究一些结构特性。模型参数采用极大似然法进行估计。在节中5进行了仿真研究,以检查NFKw分布估计的精度。在节中6,通过三个真实的数据集说明了该模型的潜力。我们表明,它的性能优于一些著名的模型。最后一节给出了一些结论。

2.拟议的灵活G族

T型是有cdf的基线rvG公司(x个;ξ),平方英尺G公司¯(x个;ξ)和pdf(x个;ξ),其中ξ是基线参数向量。我们通过以下方式定义NFGF的cdf和pdf

F类(x个)=F类(x个;ξ)=1G公司¯(x个;ξ)G公司(x个;ξ)
(3)

(f)(x个)=(f)(x个;ξ)=(x个;ξ)G公司¯(x个;ξ)G公司(x个;ξ)[G公司(x个;ξ)G公司¯(x个;ξ)日志G公司¯(x个;ξ)],
(4)

分别。

从今往后,让我们X(X)是具有密度的rv(4). sf公司S公司(x个)和危险率函数(hrf)小时(x个)属于X(X)分别是,

S公司(x个)=S公司(x个;ξ)=G公司¯(x个;ξ)G公司(x个;ξ)

τ(x个)=τ(x个;ξ)=(x个;ξ)[G公司(x个;ξ)G公司¯(x个;ξ)日志G公司¯(x个;ξ)].
(5)

下面我们考虑rvs不同支撑的一些特殊分布{(0,1),(0,),(,),(0,θ),(μ,0)}即对于Kumaraswamy(Kw)、beta、Weibull(W)、Burr XII(Br)、Gumbel(Gu)、logistic(Lo)、幂函数(或广义一致)(PF)和Pareto(Pa)模型:

  1. 如果T型千瓦(,b条)有cdfG公司(x个)=1(1x个)b条,x个和pdf(x个)=b条x个1(1x个)b条1,则NFKw模型的cdf和pdf分别由下式给出
    F类净飞行千瓦(x个)=1[(1x个)b条]1(1x个)b条,x个,,b条>0,
    (6)
    (f)净飞行千瓦(x个)=b条x个1(1x个)b条1[(1x个)b条]1(1x个)b条×{[(1x个)b条1]b条日志(1x个)}.
    (7)
  2. 如果T型贝塔(,b条)有cdfG公司(x个)=x个(,b条),x个和pdf(x个)=[B类(,b条)]1x个1(1x个)b条1,然后是新的灵活测试版(NFB)模型分别由下式给出
    F类无核武器(x个)=1[1x个(,b条)]x个(,b条),x个,,b条>0,
    (f)非金融机构(x个)=[B类(,b条)]1x个1(1x个)b条1[1x个(,b条)]x个(,b条)×[x个(,b条)1x个(,b条)日志{1x个(,b条)}],
    哪里B类(,b条)=01t吨1(1t吨)b条1d日t吨,B类x个(,b条)=0x个t吨1(1t吨)b条1d日t吨t吨(,b条)=B类x个(,b条)B类(,b条)=[B类(,b条)]10x个t吨1(1t吨)b条1d日t吨分别是beta函数、不完全beta函数和不完整beta函数比。
  3. 如果T型W公司(α,β)有cdfG公司(x个)=1经验(αx个β),x个R(右)+和pdf(x个)=αβx个β1经验(αx个β),则新的柔性Weibull(NFW)模型的cdf和pdf分别由下式给出
    F类N个F类W公司(x个)=1[经验(αx个β)]1经验(αx个β),x个R(右)+,α,β>0,
    (f)N个F类W公司(x个)=αβx个β1经验(αx个β)[经验(αx个β)]1经验(αx个β)×{[经验(αx个β)1]+αx个β}.
  4. 如果T型英国(c,k个)有cdfG公司(x个)=1(1+x个c)k个,x个R(右)+和pdf(x个)=ck个x个c1(1+x个c)(k个+1),则新的灵活Burr XII(NFBr)模型的cdf和pdf分别由下式给出
    F类NFBr公司(x个)=1[(1+x个c)k个]1(1+x个c)k个,x个R(右)+,c,k个>0,
    (f)NFBr公司(x个)=ck个x个c1(1+x个c)(k个+1)[(1+x个c)k个]1(1+x个c)k个×{[(1+x个c)k个1]+k个日志(1+x个c)}.
  5. 如果T型(μ,σ)有cdfG公司(x个)=经验[经验{(x个μ)/σ}],x个R(右)和pdf(x个)=σ1经验{(x个μ)/σ}经验[经验{(x个μ)/σ}],则新的灵活Gumbel(NFGu)模型的cdf和pdf分别由下式给出
    F类NFGu公司(x个)=1[1经验(e(电子)(x个μ)/σ)]经验(e(电子)(x个μ)/σ),x个R(右),μ,σ>0,
    (f)NFGu公司(x个)=1σe(电子)(x个μ)/σ经验(e(电子)(x个μ)/σ)×[1经验(e(电子)(x个μ)/σ)]经验(e(电子)(x个μ)/σ)×{经验(e(电子)(x个μ)/σ)1经验(e(电子)(x个μ)/σ)日志[1经验(e(电子)(x个μ)/σ)]}.
  6. 如果T型Lo(低)(μ,σ)有cdfG公司(x个)=[1+经验{(x个μ)/σ}]1,x个R(右)+和pdf(x个)=σ1经验{(x个μ)/σ}[1+经验{(x个μ)/σ}]2,则新的柔性物流(NFLo)模型的cdf和pdf分别由下式给出
    F类NFLo公司(x个)=1{1[1+经验{(x个μ)/σ}]1}[1+经验{(x个μ)/σ}]1,x个R(右)+,μ,σ>0,
    (f)NFLo公司(x个)=经验{(x个μ)/σ}σ[1+经验{(x个μ)/σ}]2×{1[1+经验{(x个μ)/σ}]1}[1+经验{(x个μ)/σ}]1×{[1+经验{(x个μ)/σ}]11[1+经验{(x个μ)/σ}]1[1+经验{(x个μ)/σ}]11[1+经验{(x个μ)/σ}]1日志[1[1+经验{(x个μ)/σ}]1]}.
  7. 如果T型PF公司(β,θ)有cdfG公司(x个)=(x个θ)β,0<x个<θ和pdf(x个)=βθβx个β1,则新的灵活功率函数(NFPF)模型的cdf和pdf分别由下式给出
    F类NFPF公司(x个)=1[1(x个θ)β](x个θ)β,0<x个<θ,β,θ>0,
    (f)NFPF公司(x个)=βθβx个β1[1(x个θ)β](x个θ)β{(x个θ)β1(x个θ)β日志[1(x个θ)β]}.
  8. 如果T型(β,α)有cdfG公司(x个)=1(βx个)α,x个β和pdf(x个)=αβαx个α+1,则新的灵活Pareto(NFPa)模型的cdf和pdf分别由下式给出
    F类NFPa公司(x个)=1[(βx个)α]1(βx个)α,x个β,β,α>0,
    (f)NFPa公司(x个)=αβαx个α+1[(βx个)α]1(βx个)α{[(βx个)α1]α日志(βx个)}.
    特殊模型NFKw、NFBeta、NFW、NFBr、NFGu、NFLo、NFPF和NFPa的密度和危险率行为如图所示18.
    保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0001_c.jpg

    为NFKw模型绘制一些参数值:(a)密度和(b)危害率。

    保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0008_OC.jpg

    为NFPa模型绘制一些参数值:(a)密度和(b)危险率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0002_OC.jpg

绘制一些参数值的NFBeta模型图:(a)密度和(b)危险率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0003_OC.jpg

为NFW模型绘制一些参数值:(a)密度和(b)危险率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0004_OC.jpg

一些参数值的NFBr模型图:(a)密度和(b)危险率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0005_OC.jpg

为NFGu模型绘制一些参数值:(a)密度和(b)危害率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0006_OC.jpg

一些参数值的NFLo模型图:(a)密度和(b)危险率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0007_OC.jpg

为NFPF模型绘制一些参数值:(a)密度和(b)危险率。

我们建议的发电机由定义()可以扩展几个著名的G类可通过补充数据ANFGF.pdf访问的分发版本。其次,关于新的灵活G族可以通过补充数据BNFGF.pdf访问从这些G类派生的。

3.NFGF的特性

3.1. 线性表示法

对于任意基线cdfG公司(x个),带参数的指数G(exp-G)分布>0,表单中有cdf和pdfH(H)(x个)=G公司(x个)小时(x个)=(x个)G公司(x个)1分别是。重新调用()然后使用Mathematica,幂级数成立

F类(x个)==2ηG公司(x个),
(8)

哪里η2=1,η=1/2,η4=1/6η5=1/4,,可以表示为

F类(x个)==2ηH(H)(x个;ξ),
(9)

哪里H(H)(x个;ξ)=G公司(x个;ξ)(用于2).

通过差异化(9),密度X(X)采取形式

(f)(x个)==1η+1小时+1(x个;ξ),
(10)

哪里小时+1是带功率参数的exp-G密度+1.方程式(10)揭示了NKwG密度函数是exp-G密度的线性组合。因此,NFGF的一些数学性质可以直接从exp-G分布的数学性质中确定,这些分布是已知的几个基线分布。

3.2. 分析形状

密度和hrf的形状X(X)可以分析地描述。密度的临界点X(X)是方程式的根:

(x个)(x个)+(x个)[日志2(1G公司(x个))+G公司(x个)(日志(1G公司(x个))+1)2+2]G公司(x个)(1G公司(x个))日志(1G公司(x个))=0

hrf的临界点X(X)从方程中获得:

(x个)(x个)+(x个)(2G公司(x个))(1G公司(x个))(G公司(x个)(1G公司(x个))日志(1G公司(x个)))=0

3.3. 分位数函数

生成rvs的最简单方法是基于逆cdf。对于任意cdf,分位数函数(qf)定义为(u个)=F类1(u个)=最小值{x个;F类(x个)u个}NFGF的qf可以通过反转来确定()数值求解两个非线性方程。我们可以使用以下程序:

  1. 设置z(z)=z(z)(u个)=1u个;
  2. 查找w个=w个(u个)数字单位为w个日志(1w个)=日志(z(z))使用任何Newton-Raphson算法;
  3. 数值求解x个在里面G公司(x个;ξ)=w个给出了qfx个=(u个;ξ)属于X(X).

3.4. 矩和生成函数

这个n个第个普通时刻X(X),说吧E类(X(X)n个),可通过方程式表示(10)作为

E类(X(X)n个)==1η+1E类(Y(Y)+1n个)==1(+1)η+1τn个,,
(11)

哪里τn个,=x个n个G公司(x个;ξ)(x个;ξ)d日x个=01G公司(u个;ξ)n个u个d日u个,以及G公司(u个;ξ)是基线G的qf。

前四个矩可以用来描述分布的一些特征。显然X(X)可以通过方程式确定(11)使用众所周知的结果。

这个n个次不完全力矩X(X),说吧n个()=x个n个(f)(x个)d日x个,是

n个()==1η+1x个n个小时+1(x个)d日x个==1(+1)η+10G公司(;ξ)G公司(u个;ξ)n个u个d日u个.
(12)

对于大多数G分布,最后两个积分可以进行数值计算。

平均值和中位数的总偏差为δ1=2μ1F类(μ1)21(μ1)δ2=μ121(M(M)),其中F类(μ1)来自方程式().

力矩生成函数(mgf)M(M)(t吨)=E类(e(电子)t吨X(X))属于X(X)遵循方程式(10)作为

M(M)(t吨)==1η+1M(M)+1(t吨)==0(+1)η+1ρ(t吨),
(13)

哪里M(M)+1(t吨)是的mgfY(Y)+1ρ(t吨)=01经验[t吨G公司(u个;ξ)]u个d日u个因此,M(M)(t吨)可以从exp-G生成函数中获得。

3.5. 估算

在这里,我们考虑用最大似然法估计NFGF家族的未知参数。最大似然估计(MLE)具有理想的特性,可用于构建置信区间,并提供在有限样本中有效的简单近似。分布理论中最大似然估计的正规近似可以很容易地用解析或数值方法处理。

对数似然函数(θ)参数向量θ=(,b条,ξ)n个观察x个1,,x个n个有表单

=(θ)==1n个日志(x个;ξ)+=1n个G公司(x个;ξ)日志[1G公司(x个;ξ)]+=1n个日志(G公司(x个;ξ)1G公司(x个;ξ)日志[1G公司(x个;ξ)]).
(14)

MLE公司θ^属于θ可以通过最大化(θ)。有几个例程用于数值最大化(θ)在中R(右)程序(最佳功能),SAS公司(程序NLMIXED),公牛(子例程最大BFGS)等等。NFGF中的所有分布也可以使用充分性模型包装入R(右)(参见https://www.r-project.org/). 该软件包的一个重要优点是不需要定义对数似然函数,它可以计算MLE、其标准误差(SE)和一些goodness-of-fit(GoF)统计数据。我们只需要提供分布的pdf和cdf,以适应数据集。

或者,我们可以区分对数似然,并求解得到的非线性似然方程。然后,关于ξ

ξ==1n个ξ(x个;ξ)=1n个{G公司(x个;ξ)1G公司(x个;ξ)日志(1G公司(x个;ξ))}G公司ξ=1n个G公司ξ[G公司(x个;ξ)2](1G公司(x个;ξ))[日志{1G公司(x个;ξ)}+G公司(x个;ξ){1+日志(1G公司(x个;ξ))}],

哪里ξ=(x个;ξ)ξG公司ξ=G公司(x个;ξ)ξ是维度相同的列向量ξ.

将分数分量设置为零,并同时求解它们,得到NFGF参数的MLE。所得方程无法解析求解,但可以使用一些统计软件通过迭代牛顿-拉夫逊型算法进行数值求解。

我们可以获得第页×第页观测信息矩阵J型(θ)(第页是的尺寸ξ)通过数值积分。此外,近似多元正态分布N个第页+2(0,J型(θ^)1)分配θ^,其中观察到的信息矩阵J型(θ)评估时间为θ^,可用于构建NFGF家族参数的置信区间。

4.NFKw模型及其性质

NFKw rv的sf和hrf分别由下式给出

S公司净飞行千瓦(x个;,b条)=[(1x个)b条]1(1x个)b条

τ净飞行千瓦(x个;,b条)=b条x个1(1x个)b条1{[(1x个)b条1]b条日志(1x个)}.

4.1. 分位数函数

无法明确获得NFKw分布的qf。然而,我们可以使用Newton–Raphson算法生成NFKw变量,如下所示:

  • 步骤1:设置n个,,b条和初始值x个0.
  • 步骤2:生成U~Uniform(0,1).
  • 步骤3:更新x个0使用牛顿公式
    x个=x个0R(右)(x个0;,b条),
    哪里R(右)(x个0;,b条)=F类净飞行千瓦(x个0;,b条)(f)净飞行千瓦(x个0;,b条),以及F类净飞行千瓦(f)净飞行千瓦从方程式中获得(6)和(7)分别是。
  • 步骤4:如果|x个0x个|ϵ, (ϵ>0,非常小的公差限制),然后存储x个0=x个作为NFKw(a,b)分布的变量。
  • 步骤5:如果|x个0x个|>ϵ,然后,设置x个0=x个并转至步骤3。
  • 步骤6:重复步骤(2)-(5)n个生成时间x个1,x个n个.

4.2. 属性

首先,NFKw模型的cdf的线性表示如下所示()作为

F类净飞行千瓦(x个;,b条)==2η[1(1x个)b条].
(15)

通过展开二项式级数并注意=2η=1,我们可以写

F类净飞行千瓦(x个;,b条)=1+=2ηk个=1(1)k个(k个)(1x个)b条k个

然后通过改变k个通过k个 + 1

F类净飞行千瓦(x个;,b条)=1+=2ηk个=0(1)k个+1(k个+1)(1x个)b条(k个+1).

δk个=2对于k=0,1,2和δk个=k个对于k≥3。我们可以很方便地改变双重总和

F类净飞行千瓦(x个;,b条)=1+=δk个ηk个=0(1)k个+1(k个+1)(1x个)b条(k个+1).

最后一个表达式可以写成

F类净飞行千瓦(x个;,b条)=1+k个=0(ωk个)(1x个)b条(k个+1),

哪里ωk个=(1)k个=δk个(k个+1)η.

通过微分最后一个表达式,NFKw密度可以写为

(f)净飞行千瓦(x个;,b条)=k个=0ωk个π(x个;,b条(k个+1)),
(16)

哪里π(x个;,(k个+1)b条)表示库马拉斯瓦米密度和形状参数(k个+1)b条.

从方程式中可以清楚地看出(16)NFKw密度是库马拉斯瓦米密度的线性组合。因此,可以从Kumaraswamy分布中获得几个NFKw特性。

Z轴k个是有密度的rvπ(x个;,(k个+1)b条)。然后X(X)可以继承Z轴k个首先n个第个普通时刻X(X)采取形式

μn个=k个=0ωk个b条(k个+1)B类(n个+1,b条(k个+1)).
(17)

累积量(κn个)第页,共页X(X)可以从中递归确定(17)作为κ=μk个=11(1k个1)κk个μk个,其中κ1=μ1.

NFKw分布的偏度和峰度图如图所示9这些图显示了参数b条在建模X(X).

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0009_OC.jpg

NFKw模型图:(a)偏度(b)峰度。

这个n个第个不完整力矩X(X)n个()=E类(X(X)n个X(X))=0x个n个(f)NFKw公司(x个;,b条)d日x个,通过改变较低不完全β函数的变量很容易找到B类t吨(u个,v(v))=0t吨t吨u个1(1t吨)v(v)1d日t吨计算相应力矩时Z轴k个。然后,我们获得

n个(z(z))=k个=0ωk个b条(k个+1)B类x个(n个+1,(k个+1)b条).
(18)

与平均值的总偏差μ1和中位数M(M)属于X(X)有表格δ1=2μ1F类净飞行千瓦(μ1)21(μ1)δ2=μ121(M(M)),其中M(M)可以根据F类N个K(K)w个W公司(M(M))=0.5.

第一个不完整的时刻1()还用于构建Bonferroni和Lorenz曲线(经济学、可靠性、人口统计学、保险和医学中的常用度量)。Bonferroni和Lorenz曲线X(X)对于给定的概率π由提供B类(π)=1(q个)/(πu个1)L(左)(π)=πB类(π),其中q个=(π)是的qfX(X)在第节中讨论4.2.

4.3. 估算

x个1,,x个n个是大小的样本n个根据方程式中给出的NFKw分布(7). 参数向量的对数似然函数θ=(,b条)减少到

(θ)=n个日志(b条)+(1)=1n个日志(x个)+(b条1)=1n个日志(1x个)+=1n个[1(1x个)b条]×日志[(1x个)b条]+=1n个日志[1(1x个)b条(1x个)b条日志((1x个)b条)].

得分向量的组件U型(θ)

U型=n个+=1n个日志(x个)(b条1)=1n个x个日志(x个)1x个+=1n个[b条x个日志(x个)(1x个)b条1日志((1x个)b条)b条x个日志(x个){1(1x个)b条}1x个]+=1n个b条x个日志(x个){1(1x个)b条}(1x个)[(1x个)b条{1+日志((1x个)b条)}1].U型b条=n个b条+=1n个日志(1x个)+=1n个日志(1x个)×[{1(1x个)b条}(1x个)b条日志((1x个)b条)]+=1n个{1(1x个)b条}(1x个)b条(日志(1x个))2日志(1x个)(1x个)b条{1(1x个)b条}日志((1x个)b条).

将这些方程设置为零,并同时求解它们,得到模型参数的最大似然估计。

5.仿真研究

在本节中,我们使用蒙特卡罗模拟评估了NFKw参数MLE的准确性。重复进行模拟研究N个=给定样本量的1000倍n个=50、100、200、300、400和参数场景:I: = 0.5,和b条 = 1.5,二: = 1.1和b条 = 3.5和III:=2.5,以及b条 = 1.5. 根据偏差和均方误差(MSE)研究MLE的精度,即:

B类(θ^)==1N个θ^N个θM(M)S公司E类(θ^)==1N个(θ^θ)2N个.

我们显示了NFKw参数估计值的偏差和MSE图b条以数字表示1011这些曲线图表明,偏差值和平均误差随着样本量的增加而减小n个增加。因此,MLE在估计NFKw分布参数方面表现良好。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0010_OC.jpg

NFKw参数估计值的偏差图。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0011_OC.jpg

NFKw参数估计值的MSE图。

6.NFKw模型的实证说明

我们将所提出的两参数NFKw模型(NFGF的一种特殊模型)与三参数转换Kumaraswamy(TrKw)进行了比较[8],三参数指数Kumaraswamy(EKw)[10]以及两参数Kumaraswamy(Kw)模型到三个真实数据集(洪水数据、树叶数据、玻璃纤维数据),可从补充数据CNFGF.pdf访问。这些模型的pdf分别由以下公式给出:

(f)K(K)w个(x个;,b条)=b条x个1(1x个)b条1,x个,,b条>0(f)T型第页K(K)w个(x个;λ,,b条)=b条x个1(1x个)b条1[1λ+2λ(1x个)b条],x个,λ,,b条>0

(f)E类K(K)w个(x个;α,,b条)=αb条x个1(1x个)b条1(1(1x个)b条)α1,x个,,b条,α>0

模型的参数用极大似然法估计,对数似然函数用最大似然估计(^). 著名的GoF统计,如Akaike信息准则(AIC)、Bayesian信息准则(BIC)、Hannan-Quinn信息准则(HQIC)、Anderson-Darling(A类),克拉梅·冯·米塞斯(W公司)和Kolmogrov-Smirnov(K-S)用于模型比较。GoF统计值越低,越高第页-K-S值表示拟合良好。

表格246给出了NFKw模型和这些数据集的其他竞争模型TrKw、EKw和Kw的MLE及其标准误差。表中GoF统计值57表明NFKw模型显示GoF统计值较小,因此与其他模型相比,该模型提供了最佳拟合。这些阴谋也支持我们的主张。

表2。

数据集1的MLE及其SE(括号内)。

分发b条αλ
净飞行千瓦2.34557.7175
 (0.4556)(3.2113)
千兆瓦3.725910.96450.6141
 (0.6490)(6.0368)(0.3752)
EKw公司3.363345.88050.2570
 (0.6021)(9.4457)(0.1269)
千瓦3.363111.7886
 (0.6033)(5.3594)

表3。

统计数据AIC、BIC、HQIC、,A类,W公司、K-S和第页-数据集1的值。

        K-S公司
分发 ^AIC公司银行识别码HQIC公司 A类 W公司K-S公司第页-价值
净飞行千瓦 14.2378 24.4757 22.4842 24.08690.69660.11470.17970.5380
千兆瓦 13.5209 21.0419 18.0547 20.45880.84090.14090.19300.4455
EKw公司 12.8662 19.7324 16.7452 19.14931.48300.26260.79601.972e−11
千瓦 12.8662 21.7324 19.7409 21.34360.97220.16580.21090.3360

表4。

数据集2的MLE及其标准错误(括号中)。

分发b条αλ
净飞行千瓦1.858543.1739
 (0.1319)(11.0563)
TrKw型2.9292177.17900.3571
 (0.2128)(62.1210)(0.3535)
EKw公司2.809985.95582.0498
 (0.1940)(509.7923)(12.1569)
千瓦2.8104176.3490
 (0.1941)(59.9656)

表5。

统计数据AIC、BIC、HQIC、,A类,W公司、K-S和第页-数据集2的值。

        K-S公司
分发 ^AIC公司银行识别码HQIC公司 A类 W公司K-S公司第页-价值
净飞行千瓦 195.7365 387.4730 381.7689 385.15540.92810.16570.10050.1509
千兆瓦 195.3060 384.6120 376.0559 381.13561.05780.19060.10980.0913
EKw公司 194.8007 383.6015 375.0454 380.12510.92070.16700.53412.2e−16
千瓦 194.8007 385.6015 379.8974 383.28391.16120.20780.11810.0563

表6。

数据集3的MLE及其标准错误(括号中)。

分发b条αλ
净飞行千瓦1.726319.4685
 (0.2661)(8.7742)
TrKw型2.703745.81290.4748
 (0.3944)(27.9858)(0.3956)
EKw公司2.4966105.25230.4157
 (0.3691)(4066.8131)(16.0628)
千瓦2.499843.9672
 (0.3700)(23.6081)

表7。

统计数据AIC、BIC、HQIC、,A类,W公司、K-S和第页-数据集3的值。

        K-S公司
分发 ^AIC公司银行识别码HQIC公司 A类 W公司K-S公司第页-价值
净飞行千瓦 32.0281 60.0563 57.4646 59.28561.15180.18350.17550.3766
千兆瓦 31.1656 56.3312 52.4437 55.17531.34000.21870.18370.3222
埃克 30.6731 55.3462 51.4587 54.19021.77630.30180.61722.325电子-09
千瓦 30.6731 57.3461 54.7545 56.57551.44090.23790.19150.2756

首先,很明显,NFKw模型比其他测试模型提供了更好的拟合,因为它具有最小的值^、AIC、BIC、HQIC、,A类,W公司和K-S.图1214也支持我们关于NFKw模型的主张。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0013_OC.jpg

数据集2的估算图(a)密度(b)sf(c)危险率和(d)箱线图。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0012_OC.jpg

数据集1的估算图(a)密度(b)sf(c)危险率和(d)箱线图。

保存图片、插图等的外部文件。对象名称为CJAS_A_1874891_F0014_OC.jpg

数据集3的估算图(a)密度(b)sf(c)危险率和(d)箱线图。

7.结束语

我们引入了一种新的累积分布F类(x个;ξ)=1[1G公司(x个;ξ)]G公司(x个;ξ)没有从基线累积分布定义额外参数G公司(x个;ξ)它是广义分布类的灵活生成器。功能F类(x个;ξ)定义新的柔性广义族(NFGF)分配。我们介绍了NFGF的许多亚家族。我们得到了NFGF的一些数学性质,并研究了称为新型柔性Kumaraswamy(NFKw)分布。我们通过考虑六个流行的GoF统计数据,将这种分布与转化的Kumaraswamy、指数Kumaraswamy和Kumaraswamy模型进行比较。我们发现,新的分布提供了更好的估计值和最小GoF值。基于数值和图形分析,NFKw模型优于这三个模型。我们希望这个新的G族生成器能够吸引读者和应用统计学家。

补充材料

补充材料:
补充材料:
补充材料:

致谢

作者感谢两位匿名审稿人的评论和建议,这些评论和建议改进了原稿的早期版本。

披露声明

提交人没有报告任何潜在的利益冲突。

工具书类

1Ahmad Z.、Elgarhy M.和Hamedani G.G。,一个新的Weibull-X分布族:性质、特征和应用,J.Stat.分销申请。 5(2018年),第5条,第18页。[谷歌学者]
2Alzaatreh A.、Famoye F和Lee C。,一种生成连续分布族的新方法,Metron公司 71(2013),第63-79页。[谷歌学者]
三。Cordeiro G.M.、Ortega E.M.M.和Cunha D.C.C。,指数广义分布类,数据科学杂志。 11(2013),第1-27页。[谷歌学者]
4尤金·N·、李·C·和法莫耶·F·。,Beta-正态分布及其应用,Commun公司。统计理论方法 31(2002),第497–512页。[谷歌学者]
5Gleaton J.U.和Lynch J.D。,寿命分布广义对数族的性质,J.概率。统计科学。 4(2006),第51-64页。[谷歌学者]
6Granzotto D.C.T.、Louzada F.和Balakrishnan N。,三次秩变换分布:推论问题和应用,J.统计计算。模拟。 87(2016),第2760–2778页。[谷歌学者]
7古普塔共和国、古普塔P.L.和古普塔R.D。,雷曼替代方案的故障时间数据建模,Commun公司。统计理论方法 27(1999年),第887-904页。[谷歌学者]
8Khan M.S.、King R.和Hudson L.I。,转换Kumaraswamy分布,统计事务。 17(2016),第183-210页。[谷歌学者]
9Lee C.、Famoye F.和Alzaatreh A。,近几十年来单变量连续分布族的生成方法,电线计算。斯达。 5(2013),第219-238页。[谷歌学者]
10Lemonte A.J.、Barreto-Souza W.和Cordeiro G.M。,指数Kumaraswamy分布及其对数变换,钎焊。J.概率。斯达。 27(2013),第31-53页。[谷歌学者]
11Marshall A.W.和Olkin I。,一种向分布族添加参数的新方法及其在指数族和威布尔族中的应用,生物计量学 84(1997),第641-652页。[谷歌学者]
12Shaw W.T.和Buckley I.R。,概率分布的炼金术:超越Gram-Charlier展开和秩嬗变映射的偏kurtotic-normal分布,UCL发现存储库(2007)。可在http://discovery.ucl.ac.uk/id/eprint/643923.
13Tahir M.H.和Cordeiro G.M。,分布的复合:综述和新的广义类,J.Stat.分销申请。 (2016),第13页。[谷歌学者]
14Tahir M.H.、Cordeiro G.M.、Alizadeh M.、Mansoor M.和Zubair M。,logistic-X分布族及其应用,Commun公司。统计理论方法 45(2016),第7326–7349页。[谷歌学者]
15Tahir M.H.和Nadarajah S。,连续单变量分布中的参数归纳:成熟的G族,美国科学院。胸罩。词。 87(2015),第539-568页。[公共医学][谷歌学者]
16Torabi H.和Montazari N.H。,逻辑均匀分布及其应用,Commun公司。统计模拟。计算。 43(2014),第2551–2569页。[谷歌学者]
17Zografos K.和Balakrishnan N。,关于β-和广义伽马生成分布族及其相关推断,统计方法。 6(2009),第344-362页。[谷歌学者]

文章来自应用统计学杂志由以下人员提供泰勒和弗朗西斯