统计 - 相关系数



相关系数

相关系数是衡量一个变量的值的变化在多大程度上可以预测另一个变量的值的变化的统计指标。在正相关的变量中,值会同步增加或减少。在负相关的变量中,一个变量的值增加时,另一个变量的值会减少。

相关系数表示为+1和-1之间的值。

系数+1表示完美的正相关:一个变量的值的变化将预测第二个变量在相同方向上的变化。

系数-1表示完美的负相关:一个变量的值的变化预测第二个变量在相反方向上的变化。较低程度的相关性表示为非零小数。系数为零表示变量波动之间没有明显的关联。

公式

${r = \frac{N \sum xy - (\sum x)(\sum y)}{\sqrt{[N\sum x^2 - (\sum x)^2][N\sum y^2 - (\sum y)^2]}} }$

其中:

  • ${N}$ = 分数对的数量

  • ${\sum xy}$ = 成对分数的乘积之和。

  • ${\sum x}$ = x分数之和。

  • ${\sum y}$ = y分数之和。

  • ${\sum x^2}$ = x分数的平方和。

  • ${\sum y^2}$ = y分数的平方和。

示例

问题陈述

计算下列数据的相关系数

XY
12
35
45
48

解答

${ \sum xy = (1)(2) + (3)(5) + (4)(5) + (4)(8) = 69 \\[7pt] \sum x = 1 + 3 + 4 + 4 = 12 \\[7pt] \sum y = 2 + 5 + 5 + 8 = 20 \\[7pt] \sum x^2 = 1^2 + 3^2 + 4^2 + 4^2 = 42 \\[7pt] \sum y^2 = 2^2 + 5^2 + 5^2 + 8^2 = 118 \\[7pt] r= \frac{69 - \frac{(12)(20)}{4}}{\sqrt{(42 - \frac{(12)^2}{4})(118-\frac{(20)^2}{4}}} \\[7pt] = .866 }$
广告