杂志的下一篇文章
基于Householder双对角化算法求解总最小二乘问题的舍入误差分析
下一篇特刊文章
利用Higuchi分形维数和Hurst指数对巴西-圣胡安盆地(墨西哥)雨量站进行气候-数学聚类
期刊上的上一篇文章
基于聚类分析的老化涵洞养护管理多准则决策
特刊上一篇文章
机器学习在地中海氧-18同位素组成、盐度和温度/位温研究中的应用
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

基于Lorenz曲线保形三次Hermite插值的分组数据基尼系数估计

1
华北水利电力大学数学与统计学院,郑州450045
2
清华大学水利科学与工程国家重点实验室,北京100084
*
信件应寄给的作者。
数学 2021,9(20), 2551;https://doi.org/10.3390/math9202551
收到的提交文件:2021年9月6日/修订日期:2021年10月2日/接受日期:2021年10月8日/发布日期:2021年10月12日
(本文属于特刊数值分析与科学计算)

摘要

以下为:
洛伦兹曲线和基尼系数在许多领域被广泛用于描述不等式,但对于分组较少的数据,基尼系数的准确估计仍然很困难。我们提出了一种保形三次Hermite插值方法,通过最大化或最小化插值曲线的应变能或曲率变化能来近似洛伦茨曲线,并提出了一种直接从插值曲线的系数估计基尼系数的方法。这种插值方法可以保持洛伦兹曲线的基本要求,即非负性、单调性和凸性,并且可以同时估计中间点和端点的导数。这些方法用16个分组五分位数或不等间距的数据集进行了测试,并将结果与用所有人口普查数据计算的真实基尼系数以及用其他方法估计的结果进行了比较。结果表明,最大应变能插值法在不同的方法中表现最好,它适用于等间距和不等间距分组数据集,具有较高的精度,尤其适用于分组数据较少的情况。

1.简介

科拉多·基尼于1912年首次提出[1]基尼系数或基尼指数被广泛用于描述收入/财富等各个领域的不平等[2]、气象学[],生态学[4],水文[5]、水资源[6]和环境[7]. 然而,基尼系数的准确估计一直是一个持续的研究课题,特别是对于分组数据[2,8,9,10].
基尼系数是与洛伦兹曲线相关的一个重要指标(图1)由洛伦茨于1905年开发[11]并显示收入的累计份额或考虑中的其他变量( [0,1])来自不同人群或其他变量(第页 [0, 1]). 洛伦兹曲线是一条非负的、单调递增的凸曲线[12,13]. 图1,直线对角线=第页代表收入或其他分配的完全平等,而洛伦兹曲线=L(左)(第页)通常位于完全平等线之下。线条之间的区域=第页和曲线=L(左)(第页),S公司A类代表收入或其他分配的不平等。越大S公司A类分布的不均匀性越大。线段=0和第页= 1 (第页, [0,1])与最大S公司A类=1/2代表另一种极端分布,即绝对不平等线。基尼系数是不等式的标量度量,定义为2S公司A类对于Lorenz曲线=L(左)(第页),从0(表示完全相等)到1(表示绝对不相等)不等。
除了直接从统计数据或其概率分布中估计基尼系数的方法外,许多估计方法都是基于使用曲线拟合或插值方法对相应洛伦兹曲线的近似,尤其是对于分组数据。
曲线拟合方法使用满足Lorenz曲线要求的函数来拟合数据,即非负性、单调性和凸性[12,13]. 然而,通常从指定数据的一组可能函数中选择适当的函数,所选函数通常不够灵活,无法在全球范围内描述实际数据的复杂变化[13]. 此外,拟合的洛伦兹曲线只能代表全球趋势,一般不会通过所有数据点,这是曲线拟合方法的一个共同特点。
与曲线拟合方法相反,插值方法构造了一条通过所有数据点的插值曲线。对于分组数据,估计基尼系数的最简单方法是梯形规则,它用分段线性插值逼近洛伦兹曲线。然而,梯形法则总是低估了基尼系数,通常被视为基尼系数的下限[14]. 为了提高基尼系数的估计精度,可以使用用分段多项式插值逼近洛伦茨曲线的高阶数值积分方法,如Simpson和Romberg规则[14]. 然而,这些数值积分方法通常适用于等距数据,梯形法则除外。此外,广泛使用的拉格朗日、埃尔米特和其他插值曲线不一定保持洛伦兹曲线的非负性、单调性和凸性[8]. 因此,在插值洛伦兹曲线时应考虑单调性和凸性。
用Hermite或其他类似插值器插值Lorenz曲线的另一个问题是估计中间点和端点的导数[9],这对估计的基尼系数有重大影响,在插值时应谨慎考虑。
本研究的主要目标是开发一种形状保持的三次Hermite插值方法,以近似Lorenz曲线,从而直接从插值系数估计基尼系数,其中,在非负性、单调性和凸性条件下,通过最大化或最小化插值曲线的应变能或曲率变化能,优化洛伦兹曲线在中间点和端点的导数。用16个分组数据集测试了该方法的适用性。

2.材料和方法

2.1. Lorenz曲线保形三次Hermite插值的条件

假设我们有n个+洛伦兹曲线上的1个点(第页,),= 0, 1, …,n个,其中0=第页0<第页1<…<第页n个=1是总体或其他相关变量的累积分数,0=0<1<…<n个=1是收入或其他变量的累计分数(图2). 间隔的长度= [第页,第页+1],小时,以及穿过线路的坡度(第页,)和(第页+1,+1),δ,表示为:
小时 = 第页 + 1 第页 ,   δ = ( + 1 ) / 小时 ,   = 0 ,   1 ,   ,   n个 1
由于洛伦兹曲线通常是凸曲线,因此数据点(第页,),= 0, 1, …,n个,形成严格凸集,即。,
0 < δ 0 < δ 1 < < δ n个 1
一个连续可微函数,L(左)(第页),为了近似洛伦兹曲线,应通过所有插值点(第页,),= 0, 1, …,n个,并且在每个插值点具有与洛伦兹曲线相同的导数(图2). 这些条件可以表示为:
L(左) ( 第页 ) = ,   = 0 ,   1 ,   ,   n个
L(左) ( 1 ) ( 第页 ) = d日 ,   = 0 ,   1 ,   ,   n个
哪里d日是洛伦兹曲线的导数第页,= 0, 1, …,n个一般来说,d日,= 0, 1, …,n个从统计数据来看,它们的估计对于插值是至关重要的,稍后将进行讨论。插值曲线应具有与Lorenz曲线相同的属性,包括非负性、单调性和凸性。
满足条件(3)和(4)的分段三次Hermite插值曲线为[15,16]:
= L(左) ( 第页 ) = L(左) ( ) ,   = 第页 负极 第页 ,   第页 第页 第页 + 1 ,     = 0 ,   1 ,   ,   n个 1
L(左) ( ) = + 1 小时 2 2 小时 + 小时 小时 2 + 2 小时 + d日 + 1 2 ( 小时 ) 小时 2 + d日 ( 小时 ) 2 小时 2 ,   =   0 ,   1 ,   ,   n个 1
插值曲线的一阶导数和二阶导数L(左)(第页)是
L(左) ( 1 ) ( ) = + 1 6 小时 6 2 小时 + 6 小时 + 6 2 小时 + d日 + 1 2 2 小时 小时 2 + d日 2 4 小时 + 小时 2 小时 2 ,   =   0 ,   1 ,   ,   n个 1
L(左) ( 2 ) ( ) = 2 小时 ( δ d日 + 1 2 d日 ) + 6 小时 2 ( 2 δ + d日 + 1 + d日 ) ,   =   0 ,   1 ,   ,   n个 1
以下[17]从而确定了插值Lorenz曲线凸性的充要条件。洛伦兹曲线的凸性要求 L(左) ( 2 ) ( ) > 0 ,= 0, 1, …,n个−1,相当于 L(左) ( 2 ) ( 0 ) > 0 L(左) ( 2 ) ( 小时 ) > 0 ,= 0, 1, …,n个-1,因为 L(左) ( 2 ) ( ) 是的线性函数从方程(8)可知,插值曲线的凸性可以保持当且仅当
δ 2 d日 d日 + 1 > 0 , - δ + d日 + 2 d日 + 1 > 0 ,   =   0 ,   1 ,   ,   n个 1
( δ 负极 d日 ) / 2 < d日 + 1 < δ 负极 2 d日 ,   =   0 ,   1 ,   ,   n个 1
如果满足凸性条件(9), L(左) ( 1 ) ( 第页 ) 是一个严格单调的递增函数。因此L(左)(第页), L(左) ( 1 ) ( 第页 ) > 0 ,相当于
L(左) 0 ( 1 ) ( 0 ) = d日 0 > 0
在这种情况下L(左)(第页)感到满意。同时L(左)(第页)也是有效的,因为L(左)(0) = 0.
总之,如果满足凸性条件(9)和单调性条件(10),L(左)(第页)具有非负性、单调性和凸性,可用作洛伦兹曲线的近似。

2.2. Lorenz曲线保形三次Hermite插值的构造

三次样条,S公司(第页),是使用最广泛的三次Hermite插值函数,它具有二阶连续导数,并最小化了一些能量函数,例如广泛使用的应变能[18]和曲率变化能量[19]. 这两个能量函数可以近似为[20]
E类 = 0 1 [ S公司 ( 2 ) ( 第页 ) ] 2 d日 第页
E类 c(c) = 0 1 [ S公司 ( ) ( 第页 ) ] 2 d日 第页
哪里E类E类c(c)分别是应变能和曲率变化能的近似形式。
然而,S公司(第页)基于能量最小化的构造不一定保持非负性、单调性或凸性。为了构造Lorenz曲线的保形三次Hermite插值,我们确定了导数d日,= 0, 1, …,n个根据条件(9)和(10)最小化能量函数(11)或(12)。
对于L(左)(第页),近似应变能为
E类 = 0 1 [ L(左) ( 2 ) ( 第页 ) ] 2 d日 第页 = = 0 n个 1 0 小时 [ L(左) ( 2 ) ( ) ] 2 d日 = = 0 n个 1 L(左) ( 2 ) ( ) L(左) ( 1 ) ( ) 0 小时 0 小时 L(左) ( ) ( ) L(左) ( 1 ) ( ) d日
因为 L(左) ( ) ( ) = 6 ( d日 + d日 + 1 2 δ ) / 小时 2 是间隔中的常量= [第页,第页+1],= 0, 1, …,n个−1,近似应变能可推导为
E类 = 0 1 [ L(左) ( 2 ) ( 第页 ) ] 2 d日 第页 = = 0 n个 1 4 小时 d日 2 + d日 d日 + 1 + d日 + 1 2 δ d日 δ d日 + 1 + δ 2
同时,近似曲率变化能量为
E类 c(c) = = 0 n个 负极 1 36 ( d日 + d日 + 1 负极 2 δ ) 2 / 小时 4
因此,衍生品d日,= 0, 1, …,n个,可通过以下二次规划模型确定:
最小值   E类 = = 0 n个 1 1 小时 d日 2 + d日 d日 + 1 + d日 + 1 2 δ d日 δ d日 + 1
最小值   E类 c(c) = = 0 n个 负极 1 ( d日 + d日 + 1 2 δ ) 2 / 小时 4
受线性约束(8)和(9)。与方程(14)和(15)相比,方程(16)和(17)中省略了对二次规划模型最优解没有影响的常数和项目。
通常,能量函数的最小化会产生一条直而光滑的样条曲线。然而,直线度和平滑度并不是洛伦兹曲线的固有特性。以下[21],我们还使用了另一个标准来定义约束Lorenz曲线,即在线性约束(9)和(10)下,使用方程(18)或(19)最大化应变能或曲率变化能量函数。
最大值   E类 = = 0 n个 1 1 小时 d日 2 + d日 d日 + 1 + d日 + 1 2 δ d日 δ d日 + 1
最大值   E类 c(c) = = 0 n个 1 ( d日 + d日 + 1 2 δ ) 2 / 小时 4
与由(16)或(17)产生的直而光滑的样条线相比,由(18)或(19)产生的样条曲线将包含相对尖锐的曲率或曲率变化。这两种类型的样条表示满足洛伦兹曲线要求的最光滑和最不光滑插值曲线,并将进行比较,找出哪种更适合于近似洛伦茨曲线。
现在我们有四个优化模型,目标函数为(16)–(19),受约束(9)和(10)。由于经验点的多样性(第页,),= 0, 1, …,n个,以及估计δ,= 0, 1, …,n个−1,使用非线性规划的Kuhn-Tucker条件很难解析地获得最优解[22]. 由于线性约束(9)和(10)所限定的可行性区域是一个凸集,目标函数(16)和(17)中的二阶项分别为正定和半正定,应变能和曲率变化能的最小化都是凸规划,具有唯一的最优解。
此外,根据不等式(2)、(9)和(10),我们得到
0 < d日 0 < δ 0 < d日 1 < δ 1 < < d日 n个 1 < δ n个 1 < d日 n个 < δ n个 1 2 d日 n个 1
因此,所有决策变量(d日,=0,1…,n个),并且相应的目标函数(18)和(19)是有限的,具有下限和上限。因此,目标函数(18)和(19)在可行性区域内具有最大值。
为了求解上述二次规划模型,可以使用几种算法和优化工具[22]其中,Microsoft Excel Solver因其广泛的可用性和易用性而被选中[23].

2.3. 从插值洛伦兹曲线估算基尼系数

基尼系数,G公司,可以直接从插值Lorenz曲线的系数估计(图2)使用以下公式。
G公司 = 1 2 0 1 L(左) ( 第页 ) d日 第页 = 1 2 = 0 n个 1 0 小时 L(左) ( ) d日 = 1 = 0 n个 1 小时 ( + + 1 ) 小时 2 ( d日 + 1 d日 ) / 6
使用梯形规则,通过分段线性插值逼近洛伦兹曲线,估计基尼系数,G公司T型,通常作为其下限,即
G公司 T型 = 1 = 0 n个 1 小时 ( + + 1 )
根据方程式(21)和(22),G公司可以根据
G公司 = G公司 T型 + = 0 n个 1 小时 2 ( d日 + 1 d日 ) / 6 = G公司 T型 + ( 小时 n个 1 2 d日 n个 小时 0 2 d日 0 ) / 6 + = 1 n个 1 d日 ( 小时 1 2 小时 2 ) / 6
由于插值Lorenz曲线的凸性,其一阶导数,d日(第页),是单调递增函数。因此,G公司用方程(23)估计的值总是大于其下限G公司T型同时,对于已知的分组数据集,= 0, 1, …,n个、和小时,= 0, 1, …,n个− 1,G公司仅取决于插值Lorenz曲线的估计导数,尤其是导数明显较大的曲线的右侧部分。因为左端点的导数很小,中间点导数的影响可以部分抵消(对于不等间距的数据),也可以完全抵消(对于等距的数据)方程式(23)中连续间隔的影响,精确估计中间点和端点的导数对于精确估计G公司,尤其是右端点处的导数。
当分组数据以相等的间隔长度等距分布时小时,式(23)可进一步简化为
G公司 = G公司 T型 + 小时 2 ( d日 n个 d日 0 ) / 6
该等式进一步说明了精确估计端点处导数的重要性,尤其是右端点处的导数。

2.4. 用于测试方法的数据

为了测试插值洛伦兹曲线在估计基尼系数中的适用性,并找出最小化或最大化应变能或曲率变化能是否更可取,我们使用了来自已发表参考文献的16个分组数据集来估计它们的基尼系数,并将结果与“真实”根据所有人口普查数据和使用其他方法估算的值。这些数据集包括五分位数[24,25],五分位数加上第95个百分位数[10],以及不等距的数据集[26].

3.结果

2000年美国收入普查数据分组五分位的内插洛伦兹曲线[24]通过最小化或最大化近似应变能,如下所示图3a、 这表明前者(最小Es)比后者(最大Es)平滑。同时,这两条插值曲线之间的负差异和正差异在相邻区间交替出现,且这些区间差异的最大绝对值随着累积人口分数的增加而增加(第页). 0.075的最大差值出现在第页=0.92,最后一个间隔[0.8,1]。基尼系数(G公司)用这两条插值洛伦兹曲线估计,分别为0.417和0.432;虽然G公司用插值洛伦兹曲线估算(未显示在图3a)通过最小化(最小Ec)和最大化(最大Ec),近似曲率变化能量分别为0.420和0.419。与使用0.422的五分位数规则的估计值相比[24],估计G公司对应于0.432的最大Es插值非常接近从所有人口普查数据计算出的“真”值0.433(图3b) ,优于其他方法。
使用1947年至2002年五年一次的美国五分之一收入[20]用该插值方法估计基尼系数,并与Z梯度法和梯形法进行比较[25] (图4). 为了进行比较,所有G公司值四舍五入为两位小数(或100G的整数),如[25]. 发件人图4,根据所有人口普查数据计算的100G实际值与使用Z梯度规则、梯形规则、最小Es插值和最大Es插值估计的100G之间的绝对误差范围分别为1–3、2–3、0–2和0–1,平均值分别为1.8、2.8、1.3和0.3。平均绝对误差G公司最大Es插值估计值仅为其他三种方法估计值的12%至27%。G公司通常被Z梯度和梯形规则以及最小Es插值方法低估,而G公司使用最大Es插值法的估计值最接近实际值。
分组五分位的洛伦兹插值曲线加上2010年美国收入普查数据的第95个百分位[10]如所示图5a.类似于图3a、,图5a还表明,最小Es插值的插值曲线比最大Es插值曲线平滑,且它们在连续区间中的最大差值随着第页对于第页<0.95,当第页= 0.89. 然而,对于第页>0.95,由于在第页=0.95,间隔更短。G公司用这两条插值洛伦兹曲线估计的值分别为0.470和0.469,与0.470的“真实”值相同或非常接近。G公司用最大Ec和最小Ec估算的结果也令人满意,分别为0.467和0.468,略低于G公司使用最大Es和最小Es进行估算[10],四种方法也很好G公司估计值为0.467至0.470,而与上述结果相比,其他两种方法的估计值较差(图5b) ●●●●。
10个不等间距组收入数据的插值Lorenz曲线[26]如所示图6a.对于第页<0.492,区间长度小于0.08,两条插值Lorenz曲线与最大Es和最小Es之间的差异非常小。然而,当第页>0.492,达到峰值0.042第页= 0.959. 基尼系数(G公司)用这两条插值洛伦兹曲线估计的值分别为0.3988和0.4009(图6b) 分别是。G公司使用Min.Es插值方法时稍微低估了。同时,估计G公司基于最大Es的估计值与使用中方法4的估计值相同[26]这两个值都非常接近根据所有人口普查数据计算得出的“真实”值0.4014。的值G公司用最大Ec和最小Ec估算的结果与用最小Es估算的接近,但都略低于G公司用最大Es估算。

4.讨论和结论

基尼系数在许多领域被广泛用于描述不等式,但对于分组较少的分组数据,基尼系数的准确估计仍然很困难。我们提出了一种形状保持的三次Hermite插值方法,通过最大化或最小化插值曲线的近似应变能或曲率变化能来逼近Lorenz曲线,然后可以使用该方法直接从插值系数估计基尼系数。16个分组五分位数或不等间距数据集的案例研究(图3,图4,图5图6)结果表明,与用所有普查数据计算的“真实”基尼系数相比,最大应变能插值法在不同方法中通常表现最佳。
所提出的洛伦兹曲线的保形三次Hermite插值方法具有几个优点。首先,插值曲线通过所有数据点,这比拟合曲线更可取,因为拟合曲线通常不够灵活,无法全局描述实际数据的复杂变化,并且不能通过所有的数据点[13]. 其次,插值曲线保持了洛伦兹曲线的基本要求,即非负性、单调性和凸性[17]. 第三,通过最大化或最小化受非负性、单调性和凸性条件(9)和(10)约束的能量函数,同时优化中间点和端点的导数,这比其他一些用不同方法确定中间点和端点导数的插值方法简单得多[9]. 因为准确估计中间点和端点的导数,特别是右端点的导数,对于准确估计G公司,同时估计中间点和端点的导数可能是估计精度较高的原因G公司第四,与其他方法相比,该方法适用于等间距和不等间距分组数据集,具有更高的精度,尤其适用于分组较少的数据集(图3,图4图5). 对于大多数案例研究,使用最大应变能规则估计的基尼系数优于或接近其他方法。
最小应变/曲率变化能产生的洛伦兹曲线比最大应变/曲率改变能产生的曲线更平滑。这两种类型的插值洛伦兹曲线分别代表了满足洛伦茨曲线要求的最光滑和最不光滑的插值曲线,它们之间的差异随着人口比例和区间长度的增加而增加(图3,图5图6). 从最大应变能插值得到的洛伦兹曲线通常包含相对尖锐的曲率,可以更好地反映收入或其他考虑中的变量在各组内的分布,从而更好地估计中间点和端点的导数,与其他能量规则相比,这可能是使用最大应变能规则更好地估计基尼系数的原因。

作者贡献

概念化,S.S.(上松浦)和S.S.(上松好);方法学S.S.(Songpu Shang);验证,S.S.(Songhao Shang);形式分析S.S.(Songpu Shang);调查,S.S.(Songhao Shang);编写原始草案,S.S.(宋浦上)和S.S;编审与编辑,S.S.(Songhao Shang);可视化,S.S.(Songhao Shang);融资收购S.S.(Songhao Shang)。所有作者都已阅读并同意手稿的出版版本。

基金

本研究由国家自然科学基金资助,批准号51839006。

数据可用性声明

本研究中提供的数据可参见第3节

利益冲突

作者声明没有利益冲突。资助者在研究设计中没有任何作用;收集、分析或解释数据;在撰写手稿时,或在决定公布结果时。

工具书类

  1. Ceriani,L。;Verme,P.《基尼指数的起源:科拉多·基尼(Corrado Gini)于1912年提出的变种提取物》。《经济学杂志》。不平等。 2012,10, 421–443. [谷歌学者] [交叉参考]
  2. Furman,E。;Kye,Y。;Su,J.计算基尼指数:注释。经济。莱特。 2019,185, 108753. [谷歌学者] [交叉参考]
  3. 郭,E。;Wang,Y。;吉里加拉,B。;Jin,E.中国大陆降水浓度的时空变化及其与干旱的潜在联系。J.清洁。产品。 2020,267, 122004. [谷歌学者] [交叉参考]
  4. Damgaard,C。;描述植物大小或繁殖力的不平等。生态学 2000,81, 1139–1142. [谷歌学者] [交叉参考]
  5. Y.Masaki。;北朝鲜花崎。;高桥,K。;Hijioka,Y.使用基尼和洛伦兹不对称系数对未来流态变化进行全球尺度分析。水资源。物件。 2014,50,4054–4078。[谷歌学者] [交叉参考]
  6. Qi,H.W.先生。;尚,S.H。;Li,J.中国水资源空间异质性定量评价。J.水力发电。工程师。 2020,39, 28–38. [谷歌学者] [交叉参考]
  7. 苏亚雷斯,T.C。;费尔南德斯,E.A。;丰岛,S.H.公司2排放基尼指数与环境效率:对60个世界主要经济体的分析。经济 2018,19, 266–277. [谷歌学者] [交叉参考]
  8. Gastwirth,J.L。;Glauberman,M.分组数据中洛伦兹曲线和基尼指数的插值。计量经济学 1976,44, 479–483. [谷歌学者] [交叉参考]
  9. Okamoto,M.插值洛伦兹曲线:保持形状并与成分浓度曲线保持一致的方法。收入财富收入 2014,60, 349–384. [谷歌学者] [交叉参考]
  10. 里昂,M。;Cheung,L.C.公司。;Gastwirth,J.L.从分组数据中估算Lorenz曲线和基尼指数时使用分组平均数的优点。美国统计局。 2016,70, 25–32. [谷歌学者] [交叉参考]
  11. Lorenz,M.O.衡量财富集中度的方法。出版物。美国统计协会。 1905,9, 209–219. [谷歌学者] [交叉参考]
  12. Sarabia,J.M。;卡斯蒂略,E。;Slottje,D.J.洛伦兹曲线的有序族。《经济学杂志》。 1999,91, 43–60. [谷歌学者] [交叉参考]
  13. 王,Z。;Ng,Y.-K。;Smyth,R.创建Lorenz曲线的通用方法。收入财富收入 2011,57, 561–582. [谷歌学者] [交叉参考]
  14. K.A.Darkwah。;Nortey,E.N.N。;Lotsi,A.使用Lorenz曲线估计收入对数正态分布的基尼系数。SpringerPlus系列 2016,5, 1196. [谷歌学者] [交叉参考] [绿色版本]
  15. 弗里奇,F.N。;Carlson,R.E.单调分段三次插值。SIAM J.数字。分析。 1980,17, 238–246. [谷歌学者] [交叉参考]
  16. 莫勒,C。用MATLAB进行数值计算; MathWorks公司:美国马萨诸塞州纳蒂克,2004年。[谷歌学者]
  17. 施拉格,H。;Kramer,W.插值Lorenz曲线凸性的一个简单的充要条件。统计 1993,53, 167–170. [谷歌学者]
  18. 雅克利奇,G。;琼脂,E.平面立方G1具有小应变能的插值样条。J.计算。申请。数学。 2011,235, 2758–2765. [谷歌学者] [交叉参考] [绿色版本]
  19. 雅克利奇,G。;ƀ琼脂,E.曲率变化最小化立方Hermite插值。申请。数学。计算。 2011,218, 3918–3924. [谷歌学者] [交叉参考]
  20. Li,J.C.构建平面C1通过近似能量最小化的三次Hermite插值曲线。数学杂志。Res.应用。 2019,39, 433–440. [谷歌学者] [交叉参考]
  21. 杜兰斯,S.R。;S.J.布里安。;尼克斯,S.J。;Hajji,A。;R.E.皮特。;风扇,C.-Y。;Field,R.基于多项式的连续水文模拟小时降雨量分解。J.Am.水资源。协会。 1999,35, 1213–1221. [谷歌学者] [交叉参考]
  22. W.L.温斯顿。运筹学:应用与算法第4版。;汤姆森·布鲁克斯/科尔:美国加利福尼亚州贝尔蒙特,2004年。[谷歌学者]
  23. W.L.温斯顿。Microsoft Excel 2016数据分析和业务建模第5版。;微软出版社:美国华盛顿州雷德蒙德,2016年。[谷歌学者]
  24. 基尼系数的五分位数规则。数学。美格。 2007,80, 133–135. [谷歌学者] [交叉参考]
  25. Golden,J.近似基尼系数的简单几何方法。《经济学杂志》。教育。 2008,39, 68–77. [谷歌学者] [交叉参考]
  26. Gastwirth,J.L.Lorenz曲线和基尼指数的估计。经济收益率。斯达。 1972,54, 306–316. [谷歌学者] [交叉参考]
图1。洛伦兹曲线示意图,显示收入或其他考虑变量的累计份额( [0,1])来自不同人群或其他变量(第页 [0, 1]).
图1。Lorenz曲线草图,显示收入或其他变量的累计份额( [0,1])来自不同人群或其他变量(第页 [0, 1]).
数学09 02551 g001
图2。数据点和插值Lorenz曲线的草图。
图2。数据点和插值Lorenz曲线的草图。
数学09 02551 g002
图3。()2000年美国收入普查数据的分组五分位数[24]以及基于近似应变能最大化(最大Es)或最小化(最小Es)的插值Lorenz曲线;(b条)比较不同方法估计的基尼系数。
图3。()2000年美国收入普查数据的分组五分位数[24]以及基于近似应变能最大化(最大Es)或最小化(最小Es)的插值Lorenz曲线;(b条)比较不同方法估计的基尼系数。
数学09 02551 g003
图4。比较1947年至2002年五年期间美国五分之一收入的不同方法估算的基尼系数。G-Z和G-T是使用Z梯度和梯形规则估计基尼系数[25]分别是。
图4。比较1947年至2002年五年期间美国五分之一收入的不同方法估算的基尼系数。G-Z和G-T是使用Z梯度和梯形规则估计基尼系数[25]分别是。
数学09 02551 g004
图5。()分组五分位数加上2010年美国人口普查数据的第95百分位数[10]以及基于近似应变能的最大化(最大Es)或最小化(最小Es)的插值洛伦兹曲线;(b条)用不同方法估计基尼系数的比较,其中M1-[10]至M6-[10]有六种方法用于[10].
图5。()分组五分位数加上2010年美国收入普查数据的第95个百分位数[10]以及基于近似应变能最大化(最大Es)或最小化(最小Es)的插值Lorenz曲线;(b条)用不同方法估计基尼系数的比较,其中M1-[10]至M6-[10]有六种方法用于[10].
数学09 02551 g005
图6。()10个不等间距组的收入数据[10]以及基于近似应变能最大化(最大Es)或最小化(最小Es)的插值Lorenz曲线;(b条)比较不同方法估计的基尼系数。
图6。()10个不等间距组的收入数据[10]以及基于近似应变能最大化(最大Es)或最小化(最小Es)的插值Lorenz曲线;(b条)比较不同方法估计的基尼系数。
数学09 02551 g006
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

尚,S。;尚,S。基于Lorenz曲线保形三次Hermite插值的分组数据基尼系数估计。数学 2021,9, 2551.https://doi.org/10.3390/math9202551

AMA风格

尚S,尚S。基于Lorenz曲线保形三次Hermite插值的分组数据基尼系数估计。数学. 2021; 9(20):2551.https://doi.org/10.3390/math9202551

芝加哥/图拉宾风格

尚松浦和尚松浩。2021.“基于Lorenz曲线保形三次Hermite插值从分组数据中估算基尼系数”数学9,编号20:2551。https://doi.org/10.3390/math9202551

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。查看更多详细信息在这里

文章指标

返回页首顶部