J应用统计。2022年;49(7): 1615–1635.
构造多个分布族的一种新的柔性广义族
,一 ,一和b条
M.H.塔希尔
一巴基斯坦巴哈瓦尔布尔伊斯兰大学统计系
M.Adnan Hussain先生
一巴基斯坦巴哈瓦尔布尔伊斯兰大学统计系
高斯·M·科尔代罗
b条巴西累西腓伯南布哥联邦大学统计系
一巴基斯坦巴哈瓦尔布尔伊斯兰大学统计系
b条巴西累西腓伯南布哥联邦大学统计系
版权©2021 Informa UK Limited,作为Taylor&Francis Group交易 - 补充资料
补充材料
GUID:4BF8634E-27BF-42ED-B4CC-77149EE96806
补充材料
GUID:4743BA08-EAE0-46E4-89B6-BDD1A26C2888
补充材料
GUID:D7B01602-5093-4FD4-ABAF-8F032C88AE7A
摘要
我们建议新的柔性广义族(NFGF),用于构建许多分布族。NFGF的重要性在于,可以选择任何基线分布,并且它不涉及任何其他参数。确定了NFGF的一些有用的统计特性,如族密度的线性表示、密度和危险率的分析形状、随机变量生成、矩和生成函数。此外,名为新型柔性Kumaraswamy研究了(NFKw)分布,并用极大似然法估计了模型参数。进行了模拟研究,以评估评估的性能。通过三个实际数据集,实证证明了NFKw模型的有效性。事实上,双参数NFKw模型的性能优于三参数传输Kumaraswamy、三参数指数Kumarasawmy和著名的双参数Kumaraswarmy模型。
关键词:柔性G-族,广义族,Kumaraswamy分布,极大似然法,新柔性族,T-X族
2010年数学学科分类:60E05、60E10、62E10和62P12
1.简介
数据和模型在应用研究中同等重要。一类研究人员倾向于首先了解一种现象,另一类研究者则对通过拟合真实数据来测试模型感兴趣。我们无法进入这场无休止的辩论,而是倾向于遵循最后一个选项,以检查拟议系列、衍生子系列和来自生成器的特殊模型的适用性。这实际上是现代分布理论的主要目标之一,在现代分布理论中,人们提出了新的族和模型,然后通过或测试来解决不同领域中遇到的问题,例如可靠性和生存研究、工程、精算师、体育科学、农业等。这场革命使数据分析师能够处理来自不同现象的数据集。这样:(i)通过添加形状参数来扩展已建立的父模型;(ii)修改了母模型的功能形式;(iii)采用倒置和加权形式;(iv)通过变换、混合、合成、copula、卷积和复合方法提出了广义(G)类;(v) 除其他方法外,还研究了广义类的特殊模型。所有这些建议及其日益增长的兴趣导致了解决问题的新的替代方法,从而使人们能够得出一个清晰和结论性的结果,从而使研究活动保持温暖和活力。如需详细研究和讨论,请联系读者[9,13,15].
阿尔扎特雷等. [2]介绍了使用变压器(T–X)方法。让是概率密度函数(pdf)和是随机变量(rv)的累积分布函数(cdf)对于然后让是cdf的函数或生存功能(sf)任何基线rv的(称为发电机),以便满足三个条件:
,
可微且单调不递减,并且
和.
T–X家族的cdf是
哪里满足条件(i)-(iii)。
方程式对应的pdf(1)是
在表中,我们更新了先锋发电机它们是T–X家族的自然模型。在这里T型可以是,,。据我们所知,我们无法找到表中包含的任何其他发电机.
表1。
先锋发电机的功能(W[G(x)])。
T的范围 |
| T–X系列的型号 |
---|
|
| 贝塔-G[4] |
|
| ZBgamma-G公司[17] |
|
| 奇数对数逻辑G[5] |
|
| 威布尔-G[1] |
|
| 对数奇数逻辑-G[16] |
|
| 物流-X[14] |
存在一些G类,如Marshall-Olkin-G(MO-G)[11]指数G(exp-G),包括1型莱曼替代方案(LA1)和2型莱曼备选方案(LA2)[7],变速-G(Tr-G)[12],立方秩转换-G(CRTr-G)[6]和指数广义-G(EG-G)[三]. 这六个G类(MO-G、LA1、LA2、Tr-G、CRTr-G和EG-G)尚未从任何现有的父模型中开发出来。
主要动机新的柔性广义族(简称NFGF)的分布为:
NFGF不是从任何类似于MO-G、LA1、LA2、Tr-G、CRTr和EG-G类的已知父模型开发的;
NFGF不包括任何额外参数;
可以为NFGF选择任何基线模型;
NFGF生成的特殊模型不存在不可识别性问题。您可以选择指数模型或反转模型;
基于NFGF的新特殊模型具有与现有母公司或其他竞争模型竞争的能力;
与现有的母模型相比,基于NFGF的新的特殊模型可以生成密度和危险率(在某些情况下)的灵活形状;
NFGF的新的特殊模型可以提供比其他相应模型持续更好的拟合。
我们将论文展开如下。在节中2,我们提出了一种新的生成器,称为NFGF。在节中三得到了它的一些数学性质,如族密度的线性表示、密度和危险率的解析形状、随机变量的生成、矩和生成函数。在节中4,我们定义了一个新型柔性Kumaraswamy(NFKw)分布并研究一些结构特性。模型参数采用极大似然法进行估计。在节中5进行了仿真研究,以检查NFKw分布估计的精度。在节中6,通过三个真实的数据集说明了该模型的潜力。我们表明,它的性能优于一些著名的模型。最后一节给出了一些结论。
2.拟议的灵活G族
让T型是有cdf的基线rv,平方英尺和pdf,其中ξ是基线参数向量。我们通过以下方式定义NFGF的cdf和pdf
和
分别。
从今往后,让我们X(X)是具有密度的rv(4). sf公司和危险率函数(hrf)属于X(X)分别是,
和
下面我们考虑rvs不同支撑的一些特殊分布即对于Kumaraswamy(Kw)、beta、Weibull(W)、Burr XII(Br)、Gumbel(Gu)、logistic(Lo)、幂函数(或广义一致)(PF)和Pareto(Pa)模型:
如果有cdf和pdf,则NFKw模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,然后是新的灵活测试版(NFB)模型分别由下式给出和哪里,和分别是beta函数、不完全beta函数和不完整beta函数比。 如果有cdf和pdf,则新的柔性Weibull(NFW)模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,则新的灵活Burr XII(NFBr)模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,则新的灵活Gumbel(NFGu)模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,则新的柔性物流(NFLo)模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,则新的灵活功率函数(NFPF)模型的cdf和pdf分别由下式给出和
如果有cdf和pdf,则新的灵活Pareto(NFPa)模型的cdf和pdf分别由下式给出和特殊模型NFKw、NFBeta、NFW、NFBr、NFGu、NFLo、NFPF和NFPa的密度和危险率行为如图所示–. 为NFKw模型绘制一些参数值:(a)密度和(b)危害率。
为NFPa模型绘制一些参数值:(a)密度和(b)危险率。
绘制一些参数值的NFBeta模型图:(a)密度和(b)危险率。
为NFW模型绘制一些参数值:(a)密度和(b)危险率。
一些参数值的NFBr模型图:(a)密度和(b)危险率。
为NFGu模型绘制一些参数值:(a)密度和(b)危害率。
一些参数值的NFLo模型图:(a)密度和(b)危险率。
为NFPF模型绘制一些参数值:(a)密度和(b)危险率。
我们建议的发电机由定义(三)可以扩展几个著名的G类可通过补充数据ANFGF.pdf访问的分发版本。其次,关于新的灵活G族可以通过补充数据BNFGF.pdf访问从这些G类派生的。
3.NFGF的特性
3.1. 线性表示法
对于任意基线cdf,带参数的指数G(exp-G)分布一>0,表单中有cdf和pdf和分别是。重新调用(三)然后使用Mathematica,幂级数成立
哪里,,和,可以表示为
哪里(用于).
通过差异化(9),密度X(X)采取形式
哪里是带功率参数的exp-G密度.方程式(10)揭示了NKwG密度函数是exp-G密度的线性组合。因此,NFGF的一些数学性质可以直接从exp-G分布的数学性质中确定,这些分布是已知的几个基线分布。
3.2. 分析形状
密度和hrf的形状X(X)可以分析地描述。密度的临界点X(X)是方程式的根:
hrf的临界点X(X)从方程中获得:
3.3. 分位数函数
生成rvs的最简单方法是基于逆cdf。对于任意cdf,分位数函数(qf)定义为NFGF的qf可以通过反转来确定(三)数值求解两个非线性方程。我们可以使用以下程序:
设置;
查找数字单位为使用任何Newton-Raphson算法;
数值求解x个在里面给出了qf属于X(X).
3.4. 矩和生成函数
这个n个第个普通时刻X(X),说吧,可通过方程式表示(10)作为
哪里,以及是基线G的qf。
前四个矩可以用来描述分布的一些特征。显然X(X)可以通过方程式确定(11)使用众所周知的结果。
这个n个次不完全力矩X(X),说吧,是
对于大多数G分布,最后两个积分可以进行数值计算。
平均值和中位数的总偏差为和,其中来自方程式(三).
力矩生成函数(mgf)属于X(X)遵循方程式(10)作为
哪里是的mgf和因此,可以从exp-G生成函数中获得。
3.5. 估算
在这里,我们考虑用最大似然法估计NFGF家族的未知参数。最大似然估计(MLE)具有理想的特性,可用于构建置信区间,并提供在有限样本中有效的简单近似。分布理论中最大似然估计的正规近似可以很容易地用解析或数值方法处理。
对数似然函数参数向量从n个观察有表单
MLE公司属于θ可以通过最大化。有几个例程用于数值最大化在中R(右)程序(最佳功能),SAS公司(程序NLMIXED),公牛(子例程最大BFGS)等等。NFGF中的所有分布也可以使用充分性模型包装入R(右)(参见https://www.r-project.org/). 该软件包的一个重要优点是不需要定义对数似然函数,它可以计算MLE、其标准误差(SE)和一些goodness-of-fit(GoF)统计数据。我们只需要提供分布的pdf和cdf,以适应数据集。
或者,我们可以区分对数似然,并求解得到的非线性似然方程。然后,关于是
哪里和是维度相同的列向量ξ.
将分数分量设置为零,并同时求解它们,得到NFGF参数的MLE。所得方程无法解析求解,但可以使用一些统计软件通过迭代牛顿-拉夫逊型算法进行数值求解。
我们可以获得观测信息矩阵(第页是的尺寸ξ)通过数值积分。此外,近似多元正态分布分配,其中观察到的信息矩阵评估时间为,可用于构建NFGF家族参数的置信区间。
4.NFKw模型及其性质
NFKw rv的sf和hrf分别由下式给出
和
4.1. 分位数函数
无法明确获得NFKw分布的qf。然而,我们可以使用Newton–Raphson算法生成NFKw变量,如下所示:
- 步骤1:设置n个,一,b条和初始值.
- 步骤2:生成U~Uniform.
- 步骤3:更新使用牛顿公式哪里,以及和从方程式中获得(6)和(7)分别是。
- 步骤4:如果, (,非常小的公差限制),然后存储作为NFKw(a,b)分布的变量。
- 步骤5:如果,然后,设置并转至步骤3。
- 步骤6:重复步骤(2)-(5)n个生成时间.
4.2. 属性
首先,NFKw模型的cdf的线性表示如下所示(三)作为
通过展开二项式级数并注意,我们可以写
然后通过改变k个通过k个 + 1
让对于k=0,1,2和对于k≥3。我们可以很方便地改变双重总和
最后一个表达式可以写成
哪里.
通过微分最后一个表达式,NFKw密度可以写为
哪里表示库马拉斯瓦米密度和形状参数一和.
从方程式中可以清楚地看出(16)NFKw密度是库马拉斯瓦米密度的线性组合。因此,可以从Kumaraswamy分布中获得几个NFKw特性。
让是有密度的rv。然后X(X)可以继承首先n个第个普通时刻X(X)采取形式
累积量()第页,共页X(X)可以从中递归确定(17)作为,其中.
NFKw分布的偏度和峰度图如图所示这些图显示了参数一和b条在建模X(X).
这个n个第个不完整力矩X(X)是,通过改变较低不完全β函数的变量很容易找到计算相应力矩时。然后,我们获得
与平均值的总偏差和中位数M(M)属于X(X)有表格和,其中M(M)可以根据.
第一个不完整的时刻还用于构建Bonferroni和Lorenz曲线(经济学、可靠性、人口统计学、保险和医学中的常用度量)。Bonferroni和Lorenz曲线X(X)对于给定的概率π由提供和,其中是的qfX(X)在第节中讨论4.2.
4.3. 估算
让是大小的样本n个根据方程式中给出的NFKw分布(7). 参数向量的对数似然函数减少到
得分向量的组件是
将这些方程设置为零,并同时求解它们,得到模型参数的最大似然估计。
5.仿真研究
在本节中,我们使用蒙特卡罗模拟评估了NFKw参数MLE的准确性。重复进行模拟研究N个=给定样本量的1000倍n个=50、100、200、300、400和参数场景:I:一 = 0.5,和b条 = 1.5,二:一 = 1.1和b条 = 3.5和III:,以及b条 = 1.5. 根据偏差和均方误差(MSE)研究MLE的精度,即:
我们显示了NFKw参数估计值的偏差和MSE图一和b条以数字表示和这些曲线图表明,偏差值和平均误差随着样本量的增加而减小n个增加。因此,MLE在估计NFKw分布参数方面表现良好。
6.NFKw模型的实证说明
我们将所提出的两参数NFKw模型(NFGF的一种特殊模型)与三参数转换Kumaraswamy(TrKw)进行了比较[8],三参数指数Kumaraswamy(EKw)[10]以及两参数Kumaraswamy(Kw)模型到三个真实数据集(洪水数据、树叶数据、玻璃纤维数据),可从补充数据CNFGF.pdf访问。这些模型的pdf分别由以下公式给出:
和
模型的参数用极大似然法估计,对数似然函数用最大似然估计(). 著名的GoF统计,如Akaike信息准则(AIC)、Bayesian信息准则(BIC)、Hannan-Quinn信息准则(HQIC)、Anderson-Darling(),克拉梅·冯·米塞斯()和Kolmogrov-Smirnov(K-S)用于模型比较。GoF统计值越低,越高第页-K-S值表示拟合良好。
表格, 和给出了NFKw模型和这些数据集的其他竞争模型TrKw、EKw和Kw的MLE及其标准误差。表中GoF统计值, 和表明NFKw模型显示GoF统计值较小,因此与其他模型相比,该模型提供了最佳拟合。这些阴谋也支持我们的主张。
表2。
分发 | 一 | b条 | α | λ |
---|
净飞行千瓦 | 2.3455 | 7.7175 | – | – |
| (0.4556) | (3.2113) | – | – |
千兆瓦 | 3.7259 | 10.9645 | – | 0.6141 |
| (0.6490) | (6.0368) | – | (0.3752) |
EKw公司 | 3.3633 | 45.8805 | 0.2570 | – |
| (0.6021) | (9.4457) | (0.1269) | – |
千瓦 | 3.3631 | 11.7886 | – | – |
| (0.6033) | (5.3594) | – | – |
表3。
统计数据AIC、BIC、HQIC、,,、K-S和第页-数据集1的值。
| | | | | | | | K-S公司 |
---|
分发 |
| AIC公司 | 银行识别码 | HQIC公司 |
|
| K-S公司 | 第页-价值 |
---|
净飞行千瓦 |
|
|
|
| 0.6966 | 0.1147 | 0.1797 | 0.5380 |
千兆瓦 |
|
|
|
| 0.8409 | 0.1409 | 0.1930 | 0.4455 |
EKw公司 |
|
|
|
| 1.4830 | 0.2626 | 0.7960 | 1.972e−11 |
千瓦 |
|
|
|
| 0.9722 | 0.1658 | 0.2109 | 0.3360 |
表4。
分发 | 一 | b条 | α | λ |
---|
净飞行千瓦 | 1.8585 | 43.1739 | – | – |
| (0.1319) | (11.0563) | – | – |
TrKw型 | 2.9292 | 177.1790 | – | 0.3571 |
| (0.2128) | (62.1210) | – | (0.3535) |
EKw公司 | 2.8099 | 85.9558 | 2.0498 | – |
| (0.1940) | (509.7923) | (12.1569) | – |
千瓦 | 2.8104 | 176.3490 | – | – |
| (0.1941) | (59.9656) | – | – |
表5。
统计数据AIC、BIC、HQIC、,,、K-S和第页-数据集2的值。
| | | | | | | | K-S公司 |
---|
分发 |
| AIC公司 | 银行识别码 | HQIC公司 |
|
| K-S公司 | 第页-价值 |
---|
净飞行千瓦 |
|
|
|
| 0.9281 | 0.1657 | 0.1005 | 0.1509 |
千兆瓦 |
|
|
|
| 1.0578 | 0.1906 | 0.1098 | 0.0913 |
EKw公司 |
|
|
|
| 0.9207 | 0.1670 | 0.5341 | 2.2e−16 |
千瓦 |
|
|
|
| 1.1612 | 0.2078 | 0.1181 | 0.0563 |
表6。
分发 | 一 | b条 | α | λ |
---|
净飞行千瓦 | 1.7263 | 19.4685 | – | – |
| (0.2661) | (8.7742) | – | – |
TrKw型 | 2.7037 | 45.8129 | – | 0.4748 |
| (0.3944) | (27.9858) | – | (0.3956) |
EKw公司 | 2.4966 | 105.2523 | 0.4157 | – |
| (0.3691) | (4066.8131) | (16.0628) | – |
千瓦 | 2.4998 | 43.9672 | – | – |
| (0.3700) | (23.6081) | – | – |
表7。
统计数据AIC、BIC、HQIC、,,、K-S和第页-数据集3的值。
| | | | | | | | K-S公司 |
---|
分发 |
| AIC公司 | 银行识别码 | HQIC公司 |
|
| K-S公司 | 第页-价值 |
---|
净飞行千瓦 |
|
|
|
| 1.1518 | 0.1835 | 0.1755 | 0.3766 |
千兆瓦 |
|
|
|
| 1.3400 | 0.2187 | 0.1837 | 0.3222 |
埃克 |
|
|
|
| 1.7763 | 0.3018 | 0.6172 | 2.325电子-09 |
千瓦 |
|
|
|
| 1.4409 | 0.2379 | 0.1915 | 0.2756 |
首先,很明显,NFKw模型比其他测试模型提供了更好的拟合,因为它具有最小的值、AIC、BIC、HQIC、,,和K-S.图–也支持我们关于NFKw模型的主张。
数据集2的估算图(a)密度(b)sf(c)危险率和(d)箱线图。
数据集1的估算图(a)密度(b)sf(c)危险率和(d)箱线图。
数据集3的估算图(a)密度(b)sf(c)危险率和(d)箱线图。
7.结束语
我们引入了一种新的累积分布没有从基线累积分布定义额外参数它是广义分布类的灵活生成器。功能定义新的柔性广义族(NFGF)分配。我们介绍了NFGF的许多亚家族。我们得到了NFGF的一些数学性质,并研究了称为新型柔性Kumaraswamy(NFKw)分布。我们通过考虑六个流行的GoF统计数据,将这种分布与转化的Kumaraswamy、指数Kumaraswamy和Kumaraswamy模型进行比较。我们发现,新的分布提供了更好的估计值和最小GoF值。基于数值和图形分析,NFKw模型优于这三个模型。我们希望这个新的G族生成器能够吸引读者和应用统计学家。
致谢
作者感谢两位匿名审稿人的评论和建议,这些评论和建议改进了原稿的早期版本。
工具书类
1Ahmad Z.、Elgarhy M.和Hamedani G.G。,一个新的Weibull-X分布族:性质、特征和应用,J.Stat.分销申请。
5(2018年),第5条,第18页。[谷歌学者] 2Alzaatreh A.、Famoye F和Lee C。,一种生成连续分布族的新方法,Metron公司
71(2013),第63-79页。[谷歌学者] 三。Cordeiro G.M.、Ortega E.M.M.和Cunha D.C.C。,指数广义分布类,数据科学杂志。
11(2013),第1-27页。[谷歌学者] 4尤金·N·、李·C·和法莫耶·F·。,Beta-正态分布及其应用,Commun公司。统计理论方法
31(2002),第497–512页。[谷歌学者] 5Gleaton J.U.和Lynch J.D。,寿命分布广义对数族的性质,J.概率。统计科学。
4(2006),第51-64页。[谷歌学者] 6Granzotto D.C.T.、Louzada F.和Balakrishnan N。,三次秩变换分布:推论问题和应用,J.统计计算。模拟。
87(2016),第2760–2778页。[谷歌学者] 7古普塔共和国、古普塔P.L.和古普塔R.D。,雷曼替代方案的故障时间数据建模,Commun公司。统计理论方法
27(1999年),第887-904页。[谷歌学者] 8Khan M.S.、King R.和Hudson L.I。,转换Kumaraswamy分布,统计事务。
17(2016),第183-210页。[谷歌学者] 9Lee C.、Famoye F.和Alzaatreh A。,近几十年来单变量连续分布族的生成方法,电线计算。斯达。
5(2013),第219-238页。[谷歌学者] 10Lemonte A.J.、Barreto-Souza W.和Cordeiro G.M。,指数Kumaraswamy分布及其对数变换,钎焊。J.概率。斯达。
27(2013),第31-53页。[谷歌学者] 11Marshall A.W.和Olkin I。,一种向分布族添加参数的新方法及其在指数族和威布尔族中的应用,生物计量学
84(1997),第641-652页。[谷歌学者] 13Tahir M.H.和Cordeiro G.M。,分布的复合:综述和新的广义类,J.Stat.分销申请。
三(2016),第13页。[谷歌学者] 14Tahir M.H.、Cordeiro G.M.、Alizadeh M.、Mansoor M.和Zubair M。,logistic-X分布族及其应用,Commun公司。统计理论方法
45(2016),第7326–7349页。[谷歌学者] 15Tahir M.H.和Nadarajah S。,连续单变量分布中的参数归纳:成熟的G族,美国科学院。胸罩。词。
87(2015),第539-568页。[公共医学][谷歌学者] 16Torabi H.和Montazari N.H。,逻辑均匀分布及其应用,Commun公司。统计模拟。计算。
43(2014),第2551–2569页。[谷歌学者] 17Zografos K.和Balakrishnan N。,关于β-和广义伽马生成分布族及其相关推断,统计方法。
6(2009),第344-362页。[谷歌学者]