3.1. 模型
让成为市政当局的MHDI-Ij个在其相应区域我在里约热内卢州,,用于我 = 5个地区和市政当局。观察范围有限在这种情况下,我们提醒分位数函数的单调变换性质的等方差[20]. 让是上的非递减函数,那么对于任何随机变量年,,其中代表τ的第个分位数年。等方差属性允许返回原始变量生成的条件分位数.
在应用程序中,我们特别假设link函数是logit变换,表示然后τ第个分位数,,第页,共页由随机效应和解释变量的线性组合描述,如下所示:
哪里,用于,表示τ-分位数此外,是一个q个-城市辅助变量的维列向量j个在其相应区域我,是q个-维度列向量τth回归系数和是与区域相关的随机效果我从此,上标τ为了使符号尽可能简单,将省略。
正如Santos和Bolfarine强调的那样[35]与回归分析问题相比,这里的转换有着不同的目的,因为后者会尝试获得常规线性模型的正态分布,避免这种转换是在处理区间数据时使用β回归的动机在分位数回归中,转换不是将数据近似为分布,但确保分析不会考虑值超出范围的密度可能性。根据数据的不对称性,在分析高极值分位数时,这一事实特别重要。
遵循Koenker和Bassett的定义[21],的τ方程中表达式的分位数回归估计(1)是分位数最小化问题的任何解
哪里,,用于、和损失(或检查)函数定义为,使用表示指示器功能。从贝叶斯的观点来看,我们可以使用最小化损失函数的思想相当于基于[39]或其特定情况分配[43]. 然而,不是最大化似然,而是获得参数向量的后验分布。
因此,我们的方法假设分配,这是:
哪里τ是固定分位数,是位置参数,,是一个比例参数,并且是一个形状参数,用于启用相对于分配。这个当.由于广义非对称拉普拉斯分布的位置-尺度混合表示[39],我们提出的方法可以分层表示如下:
哪里,,,、和.潜在变量和启用先前的层次结构,提供几乎完全可处理的条件后验密度,参数除外γ简化了马尔可夫链蒙特卡罗(MCMC)方案。在这里,,和表示上的法线、指数和截断法线分布。参数γ在区间上具有有界支持(L(左),U型),其中L(左)是的负根和U型是的正根.
然后,和潜在变量和由提供
哪里,,,,和.
在我们的分位数回归模型中还考虑了贝叶斯变量选择。据巴德拉介绍等。[5],稀疏参数估计的贝叶斯过程可分为两类:全局-局部收缩先验[8–10,30]和两组模型或spike-and-slab先验[6,11,13]. 后者将点质量的离散混合物(尖峰)和绝对连续密度(平板)放在每个参数上,这是本文中应用的方法。因此,假设指标变量、和独立条目先验的,其中,,我们有
哪里.
3.2. 推理程序
让是参数向量。从贝叶斯的角度来看,模型是在为.假设参数向量的分量是独立的先验的,我们采用以下分布:,,、和.固定τ,区间内重新缩放的Beta分布是一个自然的选择γ[39]. 最后,为在方程式中表示(三)和(4). 在这里,,,,,,,,是已知的超参数,以及和分别表示β分布和逆γ分布。
然后,关节后部密度,和潜在变量、和可以写为
哪里.方程中的增强后验分布(5)没有分析表达式,但可以探索MCMC方法。特别是,我们对除γ,我们使用Metropolis–Hastings算法从完整条件后验分布中采样。后验模拟方法基于以下更新:
样品ξ从,其中和
对于,示例从在哪儿是向量没有条目k个 样品从,带有协方差矩阵,和平均向量.给,是所选变量的数量,是这些变量的系数,,、和表示ι-变量正态分布
对于每个,,示例从广义逆高斯分布,其中和,密度由
对于每个,,示例来自,其中、和
样品σ来自分布,其中,、和
更新γ使用Metropolis-Hastings步骤,在logit范围内使用正态提案分布
对于每个,示例来自,其中、和;
样品μ来自,其中、和
样品φ来自,其中、和.