话题
搜索

统计相关性


对于两个随机变量X(X)Y(Y),相关性由Y定义

 cor(X,Y)=(cov(X,Y))/(σ_Xsigma_Y),
(1)

哪里西格玛_X表示标准偏差覆盖(X,Y)协方差属于这两个变量。对于变量的一般情况X _ iX _ j,其中i、 j=1, 2, ...,n个,

 cor(X_i,X_j)=(cov(X_i,X_j))/(平方码(V_(ii)V_(jj))),
(2)

哪里V_(ii)是的元素协方差矩阵一般来说,相关性给出了变量之间关系的强度。对于i=j,

 cor(X_i,X_i)=(cov(X_i,X_i))/(sigma_i^2)=1。
(3)

任何数量的方差总是非负的根据定义,所以

 var(X/(sigma_X)+Y/(simma_Y))>=0。
(4)

来自的属性差异,总和可以展开

 var(X/(sigma_X))+var(Y/(simma_Y))+2cov(X/
(5)
 1/(西格玛_X^2)变量(X)+1/(西格马_Y^2)var(Y)+2/(西格玛_Xsigma_Y)cov(X,Y)>=0
(6)
 1+1+2/(σ_Xsigma_Y)覆盖(X,Y)=2+2/(∑_Xsigma_Y)覆盖(X,Y)>=0。
(7)

因此,

 cor(X,Y)=(cov(X,Y))/(σ_Xsigma_Y)>=-1。
(8)

同样,

 var(X/(西格玛_X)-Y/(西格玛_Y))>=0
(9)
 var(X/(sigma_X))+var(-Y/(simma_Y))+2cov(X/
(10)
 1/(σ_X^2)变量(X)+1/(∑_Y^2)var(Y)-2/(σ_ Xsigma_Y)cov(X,Y)>=0
(11)
 1+1-2/(σ_Xsigma_Y)覆盖(X,Y)=2-2/(∑_Xsigma_Y)覆盖(X,Y)>=0。
(12)

因此,

 cor(X,Y)=(cov(X,Y))/(σ_Xσ_Y)<=1,
(13)

所以-1<=cor(X,Y)<=1.

对于线性组合在两个变量中,

变量(Y-bX)=var(Y)+var(-bX)+2cov(Y,-bX)
(14)
=var(Y)+b^2 var(X)-2bcov(X,Y)
(15)
=σ_Y^2+b^2sigma_X^2-2bcov(X,Y)
(16)
=σ_Y^2+b^2sigma_X^2-2bsigma_Xsigma~Ycor(X,Y)。
(17)

检查以下情况cor(X,Y)=+/-1,

 cor(X,Y)=(cov(X,Y))/(σ_Xσ_Y)=+/-1
(18)
 var(Y-bX)=b^2sigma_X^2+σ_Y^2∓2bsigma_Xσ_Y=。
(19)

这个方差将为零,如果b=+/-σ_Y/σ_X,它要求方差是一个常量。因此,y-bx=a,所以y=a+bx.如果cor(X,Y)=+/-1,年要么是完全相关的(b> 0个)或完全反相关(b<0)带有x个.


另请参见

协方差,协方差矩阵,方差

与Wolfram一起探索| Alpha

引用如下:

埃里克·魏斯坦(Eric W.Weisstein)。“统计相关性。”发件人数学世界--Wolfram Web资源。https://mathworld.wolfram.com/StatisticalCorrelation.html

主题分类