线性回归
解决方案中的问题

线性回归和建模问题及其解决在页面底部。也是一个线性回归计算器和图示器可以用来检查答案并创造更多练习机会。

审查

如果实验的n对数据(x,y)的绘图显示y和x之间存在“线性关系”,那么 最小二乘法 可以用来写出x和y之间的线性关系。
最小二乘回归线是使从每个数据点到该线的垂直偏差的平方和(d1+d2+d3+d4)最小化的线(参见下图作为4个点的示例)。
线性回归,其中观测值和预测值之间的垂直距离之和最小。

图1。线性回归,其中垂直距离d1+d2+d3+d4的总和
观测值和预测值(直线及其方程)之间的差值被最小化。
n个数据点集的最小二乘回归线由斜率截距形式的直线方程给出:
y=a x+b

其中a和b由下式给出
线性回归公式。

图2。线性回归中包含的常数a和b的公式。
  • 问题1

    考虑以下一组点:{(-2,-1),(1,1),(3,2)}
    a) 找到给定数据点的最小二乘回归线。
    b) 在同一矩形轴系中绘制给定点和回归线。
  • 问题2

    a) 找到以下数据集的最小二乘回归线
    {(-1 , 0),(0 , 2),(1 , 4),(2 , 5)}

    b) 在同一矩形轴系中绘制给定点和回归线。
  • 问题3

    y值及其对应的y值如下表所示
    x个 0 1 2 4
    2 5 4 6

    a) 求最小二乘回归线y=a x+b。
    b) 当x=10时,估算y的值。
  • 问题4

    公司每年的销售额(单位:百万美元)如下表所示。
    x(年) 2005 2006 2007 2008 2009
    y(销售额) 12 19 29 37 45

    a) 求最小二乘回归线y=a x+b。
    b) 使用最小二乘回归线作为模型来估计公司2012年的销售额。

上述问题的解决方案

  1. a) 让我们把数据组织在一个表中。
    x个 x年 x个2
    -2 -1 2 4
    1 1 1 1
    2 6 9
    ∑x=2 ∑y=2 ∑xy=9 ∑x2= 14

    我们现在使用上述公式计算a和b,如下所示
    a=(n∑x y-∑x∑y)2-(∑x)2) = (3*9 - 2*2) / (3*14 - 22) = 23/38
    b=(1/n)(∑y-a∑x)=(1/3)(2-(23/38)*2)=5/19
    b) 现在,我们绘制由y=ax+b和给定点给出的回归线。
    回归线图问题1

    图3。问题1中的线性回归图。
  2. a) 我们使用的表格如下
    x个 x年 x个2
    -1 0 0 1
    0 2 0 0
    1 4 4 1
    2 5 10 4
    ∑x=2 ∑y=11 ∑x y=14 ∑x2= 6

    我们现在使用上述公式计算a和b,如下所示
    a=(n∑x y-∑x∑y)2-(∑x)2) = (4*14 - 2*11) / (4*6 - 22) = 17/10 = 1.7
    b=(1/n)(∑y-a∑x)=(1/4)(11-1.7*2)=1.9
    b) 现在,我们绘制由y=ax+b给出的回归线和给定点。
    回归线图问题2

    图4。问题2中的线性回归图。
  3. a) 我们用表格计算a和b。
    x个 x年 x个2
    0 2 0 0
    1 1
    2 5 10 4
    4 12 9
    4 6 24 16
    ∑x=10 ∑y=20 ∑x y=49 ∑x2= 30

    我们现在使用a和b的最小二乘回归公式计算a和b。
    a=(n∑x y-∑x∑y)2-(∑x)2) = (5*49 - 10*20) / (5*30 - 102) = 0.9
    b=(1/n)(∑y-a∑x)=(1/5)(20-0.9*10)=2.2
    b) 既然我们有了最小二乘回归线y=0.9 x+2.2,那么用10替换x来求相应y的值。
    y=0.9*10+2.2=11.2
  4. a) 我们首先将变量x改为t,使t=x-2005,因此t表示2005年之后的年份数。用t代替x可以使数字更小,因此可以管理。值表变为。
    t(2005年后) 0 1 2 4
    y(销售额) 12 19 29 37 45

    我们现在使用该表计算包含在最小回归线公式中的a和b。
    t吨 t年 t吨2
    0 12 0 0
    1 19 19 1
    2 29 58 4
    37 111 9
    4 45 180 16
    ∑x=10 ∑y=142 ∑xy=368 ∑x2= 30

    我们现在使用a和b的最小二乘回归公式计算a和b。
    a=(n∑t y-∑t∑y)/(nσt2-(∑t)2) = (5*368 - 10*142) / (5*30 - 102) = 8.4
    b=(1/n)(∑y-a∑x)=(1/5)(142-8.4*10)=11.6
    b) 2012年,t=2012-2005=7
    2012年预计销售额为:y=8.4*7+11.6=7040万美元。

更多参考和链接

  1. 线性回归计算器和图示器.
  2. 线性最小二乘拟合。
  3. 基本统计和概率.
{ezoic-ad-1}
{ez_footer_ads}