- 统计学教程
- 主页
- 调整后R方
- 方差分析
- 算术平均数
- 算术中位数
- 算术众数
- 算术极差
- 条形图
- 最佳点估计
- 贝塔分布
- 二项分布
- 布莱克-斯科尔斯模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 环状排列
- 整群抽样
- 科恩 Kappa 系数
- 组合
- 有放回组合
- 比较图表
- 连续均匀分布
- 连续数列算术平均数
- 连续数列算术中位数
- 连续数列算术众数
- 累积频率
- 变异系数
- 相关系数
- 累积图
- 累积泊松分布
- 数据收集
- 数据收集 - 问卷设计
- 数据收集 - 观察法
- 数据收集 - 案例研究法
- 数据模式
- 十分位数统计
- 离散数列算术平均数
- 离散数列算术中位数
- 离散数列算术众数
- 点图
- 指数分布
- F分布
- F检验表
- 阶乘
- 频率分布
- 伽马分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 总平均数
- Gumbel 分布
- 调和平均数
- 调和数
- 谐振频率
- 直方图
- 超几何分布
- 假设检验
- 个体数列算术平均数
- 个体数列算术中位数
- 个体数列算术众数
- 区间估计
- 逆伽马分布
- Kolmogorov-Smirnov检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽马分布
- 逻辑回归
- 麦克尼马尔检验
- 平均差
- 均值差异
- 多项分布
- 负二项分布
- 正态分布
- 奇排列和偶排列
- 单比例Z检验
- 离群值函数
- 排列
- 有放回排列
- 饼图
- 泊松分布
- 合并方差 (r)
- 功效计算器
- 概率
- 概率加法定理
- 概率乘法定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) 和过程性能 (Pp)
- 过程Sigma
- 二次回归方程
- 定性数据与定量数据
- 四分位差
- 经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 信度系数
- 所需样本量
- 残差分析
- 残差平方和
- 均方根
- 样本计划
- 抽样方法
- 散点图
- Shannon-Wiener 多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误 (SE)
- 标准正态表
- 统计显著性
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生t检验
- 平方和
- t分布表
- TI-83 指数回归
- 转换
- 截尾均值
- I类和II类错误
- 方差
- 韦恩图
- 大数弱定律
- Z表
- 统计学有用资源
- 统计学 - 讨论
统计学 - 线性回归
一旦使用相关分析确定了变量之间的关系程度,自然就会深入研究关系的性质。回归分析有助于确定变量之间的因果关系。如果可以使用图形方法或代数方法预测自变量的值,则可以预测其他变量(称为因变量)的值。
图形方法
这涉及绘制散点图,其中自变量位于 X 轴上,因变量位于 Y 轴上。之后,绘制一条线,使其穿过大部分分布,其余点几乎均匀地分布在线的两侧。
回归线被称为最佳拟合线,它总结了数据的总体走势。它显示了一个变量的最佳平均值与另一个变量的平均值相对应。回归线基于这样的标准:它是一条直线,可以最小化因变量的预测值和观察值之间的平方差之和。
代数方法
代数方法建立了 X 对 Y 的两个回归方程和 Y 对 X 的两个回归方程。
Y 对 X 的回归方程
${Y = a+bX}$
其中 -
${Y}$ = 因变量
${X}$ = 自变量
${a}$ = 表示 Y 截距的常数
${b}$ = 表示直线斜率的常数
a 和 b 的值由以下正规方程获得
${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 }$
其中 -
${N}$ = 观察次数
X 对 Y 的回归方程
${X = a+bY}$
其中 -
${X}$ = 因变量
${Y}$ = 自变量
${a}$ = 表示 Y 截距的常数
${b}$ = 表示直线斜率的常数
a 和 b 的值由以下正规方程获得
${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 }$
其中 -
${N}$ = 观察次数
示例
问题陈述
一位研究人员发现父亲和儿子的体重趋势之间存在相关性。他现在有兴趣根据给定数据开发这两个变量的回归方程。
父亲体重(公斤) | 69 | 63 | 66 | 64 | 67 | 64 | 70 | 66 | 68 | 67 | 65 | 71 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
儿子体重(公斤) | 70 | 65 | 68 | 65 | 69 | 66 | 68 | 65 | 71 | 67 | 64 | 72 |
开发
Y 对 X 的回归方程。
对 Y 的回归方程。
解决方案
${X}$ | ${X^2}$ | ${Y}$ | ${Y^2}$ | ${XY}$ |
---|---|---|---|---|
69 | 4761 | 70 | 4900 | 4830 |
63 | 3969 | 65 | 4225 | 4095 |
66 | 4356 | 68 | 4624 | 4488 |
64 | 4096 | 65 | 4225 | 4160 |
67 | 4489 | 69 | 4761 | 4623 |
64 | 4096 | 66 | 4356 | 4224 |
70 | 4900 | 68 | 4624 | 4760 |
66 | 4356 | 65 | 4225 | 4290 |
68 | 4624 | 71 | 5041 | 4828 |
67 | 4489 | 67 | 4489 | 4489 |
65 | 4225 | 64 | 4096 | 4160 |
71 | 5041 | 72 | 5184 | 5112 |
${\sum X = 800}$ | ${\sum X^2 = 53,402}$ | ${\sum Y = 810}$ | ${\sum Y^2 = 54,750}$ | ${\sum XY = 54,059}$ |
Y 对 X 的回归方程
Y = a+bX
其中,a 和 b 由正规方程获得
${\Rightarrow}$ 810 = 12a + 800b ... (i)
${\Rightarrow}$ 54049 = 800a + 53402 b ... (ii)
将方程 (i) 乘以 800,将方程 (ii) 乘以 12,我们得到
96000 a + 640000 b = 648000 ... (iii)
96000 a + 640824 b = 648588 ... (iv)
从 (iii) 中减去方程 (iv)
-824 b = -588
${\Rightarrow}$ b = -0.713
将 b 的值代入方程 (i)
810 = 12a + 800 (-0.713)
810 = 12a + 570.4
12a = 239.6
${\Rightarrow}$ a = 19.96
因此,Y 对 X 的方程可以写成
X 对 Y 的回归方程
X = a+bY
其中,a 和 b 由正规方程获得
${\Rightarrow}$ 800 = 12a + 810b ... (V)
${\Rightarrow}$ 54,049 = 810a + 54,750b ... (vi)
将方程 (v) 乘以 810,将方程 (vi) 乘以 12,我们得到
64800 = 9720a + 656100b ... (vii)
648588 = 9720a + 657000b ... (viii)
从方程 (vii) 中减去方程 (viii)
-588 = -900b
${\Rightarrow}$ b = 0.653
将 b 的值代入方程 (v)
800 = 12a + 810 (0.653)
12a = 271.07
${\Rightarrow}$ a = 22.58
因此,X 和 Y 的回归方程为