统计 - 残差分析



残差分析用于通过定义残差并检查残差图来评估线性回归模型的适用性。

残差

残差 (e) 指的是观察值 (y) 与预测值 (ŷ) 之间的差异。每个数据点都有一个残差。

残差 = 观察值 - 预测值
e = y - ŷ

残差图

残差图是一个图表,其中残差位于垂直轴上,自变量位于水平轴上。如果点随机分散在水平轴周围,则线性回归模型适用于数据;否则,选择非线性模型。

残差图的类型

以下示例显示了残差图中的一些模式。

Residual Plots

在第一种情况下,点随机分散。因此,首选线性回归模型。在第二种和第三种情况下,点是非随机分散的,这表明首选非线性回归方法。

示例

问题陈述

检查线性回归模型是否适用于以下数据。

x60 70 80 85 95
y(实际值)70 65 70 95 85
ŷ(预测值)65.411 71.849 78.288 81.507 87.945

解决方案

步骤 1:计算每个数据点的残差。

x60 70 80 85 95
y(实际值)70 65 70 95 85
ŷ(预测值)65.411 71.849 78.288 81.507 87.945
e(残差)4.589 -6.849 -8.288 13.493 -2.945

步骤 2:绘制残差图。

Residual Plot

步骤 3:检查残差的随机性。

此处的残差图显示出随机模式——第一个残差为正,接下来的两个为负,第四个为正,最后一个残差为负。由于模式相当随机,这表明线性回归模型适用于上述数据。

广告