统计学 - 线性回归



一旦使用相关分析确定了变量之间的关系程度,自然就会深入研究关系的性质。回归分析有助于确定变量之间的因果关系。如果可以使用图形方法或代数方法预测自变量的值,则可以预测其他变量(称为因变量)的值。

图形方法

这涉及绘制散点图,其中自变量位于 X 轴上,因变量位于 Y 轴上。之后,绘制一条线,使其穿过大部分分布,其余点几乎均匀地分布在线的两侧。

回归线被称为最佳拟合线,它总结了数据的总体走势。它显示了一个变量的最佳平均值与另一个变量的平均值相对应。回归线基于这样的标准:它是一条直线,可以最小化因变量的预测值和观察值之间的平方差之和。

代数方法

代数方法建立了 X 对 Y 的两个回归方程和 Y 对 X 的两个回归方程。

Y 对 X 的回归方程

${Y = a+bX}$

其中 -

  • ${Y}$ = 因变量

  • ${X}$ = 自变量

  • ${a}$ = 表示 Y 截距的常数

  • ${b}$ = 表示直线斜率的常数

a 和 b 的值由以下正规方程获得

${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 }$

其中 -

  • ${N}$ = 观察次数

X 对 Y 的回归方程

${X = a+bY}$

其中 -

  • ${X}$ = 因变量

  • ${Y}$ = 自变量

  • ${a}$ = 表示 Y 截距的常数

  • ${b}$ = 表示直线斜率的常数

a 和 b 的值由以下正规方程获得

${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 }$

其中 -

  • ${N}$ = 观察次数

示例

问题陈述

一位研究人员发现父亲和儿子的体重趋势之间存在相关性。他现在有兴趣根据给定数据开发这两个变量的回归方程。

父亲体重(公斤)696366646764706668676571
儿子体重(公斤)706568656966686571676472

开发

  1. Y 对 X 的回归方程。

  2. 对 Y 的回归方程。

解决方案

${X}$${X^2}$${Y}$${Y^2}$${XY}$
6947617049004830
6339696542254095
6643566846244488
6440966542254160
6744896947614623
6440966643564224
7049006846244760
6643566542254290
6846247150414828
6744896744894489
6542256440964160
7150417251845112
${\sum X = 800}$${\sum X^2 = 53,402}$${\sum Y = 810}$${\sum Y^2 = 54,750}$${\sum XY = 54,059}$

Y 对 X 的回归方程

Y = a+bX

其中,a 和 b 由正规方程获得

${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 \\[7pt] 其中\ \sum Y = 810, \sum X = 800, \sum X^2 = 53,402 \\[7pt] , \sum XY = 54, 049, N = 12 }$

${\Rightarrow}$ 810 = 12a + 800b ... (i)

${\Rightarrow}$ 54049 = 800a + 53402 b ... (ii)

将方程 (i) 乘以 800,将方程 (ii) 乘以 12,我们得到

96000 a + 640000 b = 648000 ... (iii)

96000 a + 640824 b = 648588 ... (iv)

从 (iii) 中减去方程 (iv)

-824 b = -588

${\Rightarrow}$ b = -0.713

将 b 的值代入方程 (i)

810 = 12a + 800 (-0.713)

810 = 12a + 570.4

12a = 239.6

${\Rightarrow}$ a = 19.96

因此,Y 对 X 的方程可以写成

${Y = 19.96 - 0.713X}$

X 对 Y 的回归方程

X = a+bY

其中,a 和 b 由正规方程获得

${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 \\[7pt] 其中\ \sum Y = 810, \sum Y^2 = 54,750 \\[7pt] , \sum XY = 54, 049, N = 12 }$

${\Rightarrow}$ 800 = 12a + 810b ... (V)

${\Rightarrow}$ 54,049 = 810a + 54,750b ... (vi)

将方程 (v) 乘以 810,将方程 (vi) 乘以 12,我们得到

64800 = 9720a + 656100b ... (vii)

648588 = 9720a + 657000b ... (viii)

从方程 (vii) 中减去方程 (viii)

-588 = -900b

${\Rightarrow}$ b = 0.653

将 b 的值代入方程 (v)

800 = 12a + 810 (0.653)

12a = 271.07

${\Rightarrow}$ a = 22.58

因此,X 和 Y 的回归方程为

${X = 22.58 + 0.653Y}$
广告