×

在分层样本的多元回归分析中使用样本调查权重。 (英语) Zbl 0533.62011号

假设抽样调查测量n个人中每一个人的(p+1)变量,使数据由矩阵Y和矩阵X组成,那么Y在X上的回归系数的最小二乘估计为({hat\beta}=(X^TX)^{-1}X^TY.\)
这里,考虑分层抽样,分层是基于X的,并假设可观察的分层变量J具有k个水平,以及已知(J=J)、(J=1,2,…,k)的人口比例。设(n_j)为从第j层中提取的简单随机样本的大小,(j=1,2,…,k),因此^{k}_{j=1}n_j=n\),分配给第i个观测值的权重为\(w_i\propto\pi_{j_i}/n_{j_ i}\),其中\(j_i\)是第i个观察值的j值,\(i=1,2,…,n\)。设W是第i对角元素为(W_i)的对角矩阵,则回归系数的加权最小二乘估计量为({hat\beta}{}_W=(X^TWX)^{-1}X^TWY.\)
本文通过说明适当的估计值如何取决于人口回归模型的四个越来越普遍的规范中哪一个是适当的,以及基于({hat\beta}{}_w-{hat\beta})的检验如何,澄清了应该使用哪一个估计值({had\beta}})和({hae\beta{}_w)的问题可以用作一种设备,以帮助确定哪个模型以及哪个估计器是合适的。此外,通过构建基于全国调查的教育成就模型,给出了一个例子来说明这些问题。
审核人:张海杰

MSC公司:

62D05型 抽样理论、抽样调查
62第25页 统计学在社会科学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部