话题
搜索

方差


对于单个变量 X(X)进行分配P(x)具有已知 人口意思是 亩这个总体方差 变量(X),通常也写西格玛^2,定义为

 西格玛^2=<(X-mu)^2>,
(1)

哪里亩人口意思是<X>表示期望值属于X(X)。对于离散分布具有N个的可能值x _ i,因此总体方差为

 σ^2=总和_(i=1)^NP(x_i)(x_i-mu)^2,
(2)

而对于连续分布它是由

 σ^2=整数P(x)(x-mu)^2dx。
(3)

因此,方差等于第二个中心力矩 二氧化锰.

请注意,在口译时需要注意西格玛^2作为差异,因为符号西格玛也通常用作与相关但不相关的参数等于方差的平方根,例如日志正态分布麦克斯韦分布瑞利分布.

如果基础分布未知,则样品方差可以计算为

 s_N^2=1/Nsum_(i=1)^N(x_i-x^_)^2,
(4)

哪里x个^_样品意思是.

请注意样本方差 s_N^2上述定义为一个无偏见的估计器对于总体方差 西格玛^2为了获得公正估计量西格玛^2相反,有必要定义“偏差校正样本方差”

 s_(N-1)^2=1/(N-1的)总和_(i=1)^N(x_i-x^_)^2。
(5)

两者之间的区别s_N^2(_N)s(N-1)^2是一个常见的困惑来源,在查阅文献以确定使用的是哪一种约定,特别是由于无信息符号秒通常用于两者。偏差校正的样本方差s_(N-1)^2用于实现数据列表作为方差[列表].

方差的平方根称为标准偏离.

原因是s_N^2(_N)给出了一个有偏估计量人口方差这是两个自由参数吗亩西格玛^2实际上是根据数据本身进行估计的。在这种情况下,这是适当的使用学生' -分配而不是正态分布作为一个模型因为,非常笼统地说,学生' -分配是可以在不知情的情况下做到的“最好”西格玛^2.

形式上,为了估计总体方差 西格玛^2从以下样本中n个具有先验的元素未知的 意思是(即意思是根据样本本身估计),我们需要一个无偏见的估计器对于西格玛^2.这是由k个-统计 k_2=σ^^^2,其中

 k_2=N/(N-1)m2
(6)

m_2=s_N^2样品方差未纠正偏差。

事实证明,数量Ns_N^2/西格玛^2有一个方形的分布.

对于数据集X(X)通过线性变换获得的数据的方差由下式给出

var(aX+b)=<[(aX+b)-<aX+b>]^2>
(7)
=<(aX+b-a)^2>
(8)
=<(aX amu)^2>
(9)
=<a^2(X亩)^2>
(10)
=a^2<(X-mu)^2>
(11)
=a^2var(X)
(12)

对于多个变量,使用协方差

var(总和i=1)^(n)X_i)=cov(总和_(i=1)^(n)X_i,总和_(j=1)
(13)
=总和_(i=1)^(n)总和_(j=1)*(n)cov(X_i,X_j)
(14)
=总和_(i=1)^(n)总和_(j=1;j=i)^
(15)
=sum_(i=1)^(n)cov(X_i,X_i)+sum_
(16)
=总和_(i=1)^(n)变量(X_i)+2sum_(i=1)^。
(17)

线性和具有类似的形式:

var(总和i=1)^(n)a_iX_i)=cov(总和(i=1)^(n)a_iX_i,总和(j=1)
(18)
=总和_(i=1)^(n)总和_(j=1)*(n)a_ia_jcov(X_i,X_j)
(19)
=sum_(i=1)^(n)a_i^2var(X_i)+2sum_。
(20)

这些方程可以用协方差矩阵.


另请参见

中心力矩查利尔支票协方差协方差矩阵错误传播k个-统计学平均值力矩原始力矩样本方差样品方差计算样本方差分发西格玛标准错误统计相关性 在中探索此主题数学世界教室

与Wolfram一起探索| Alpha

工具书类

J.F.肯尼。和Keeping,E.S。统计学数学,第2部分,第2版。新泽西州普林斯顿:Van Nostrand,1951年。帕普利斯,答:。概率,随机变量和随机过程,第二版。纽约:McGraw-Hill,第144-145页,1984年。出版社,W.H。;弗兰纳里,B.P。;图科尔斯基,S.A.公司。;和韦特林。“分布矩:均值、方差、,偏斜,等等。“第14.1条数字的FORTRAN:科学计算的艺术,第二版。英国剑桥:剑桥大学出版社,第604-609页,1992年。M.J.罗伯茨。和Riccardo,R。一个学生方差分析指南。伦敦:劳特利奇出版社,1999年。

引用的关于Wolfram | Alpha

方差

引用如下:

埃里克·魏斯坦(Eric W.Weisstein)。“差异”自数学世界--Wolfram Web资源。https://mathworld.wolfram.com/Variance.html

主题分类