理解平均数的类型
介绍
一组数据点、观察值或值的平均值称为数据的平均数。它是集中趋势的度量。
在数学上,平均数是通过将值的总和除以值或观察值的个数得到的。它也称为期望值。平均数本身并不局限于这种简单的形式,而是具有不同的类型,例如算术平均数、几何平均数、调和平均数和加权平均数。
数学上表示为:
$$\mathrm{平均数=\frac{\sum x}{N}}$$
其中:
x = 观察值集合
N = 观察值的个数
不同类型的平均数
算术平均数
它是数据/观察值的算术平均值。它表示为观察值的总和除以此类观察值的总数。
例如,假设 x_1,x_2,x_3,x_4,....,x_n 是 n 个观察值,则算术平均数 μ 为:
$$\mathrm{\mu=\frac{x_1 +x_2+x_3+...+x_n}{n}=\frac{\sum x}{n}}$$
如果 3、4、5、8、10 是一组 5 个观察值,则算术平均数将为:
$$\mathrm{\mu=\frac{3+4+5+8+10}{5}=6}$$
几何平均数
几何平均数表示为数据集中所有观察值/值的乘积的 n 次方根。它通常小于算术平均数,并且通常用于数据波动的情况下,例如投资用例。
例如,假设 x_1,x_2,x_3,x_4,....,x_n 是 n 个观察值,则几何平均数 G 表示为:
$$\mathrm{G=\sqrt[n]{x_1,x_2,x_3,\ldots,xn}}$$
三个观察值 2、4 和 8 的几何平均数将为:
$$\mathrm{G=\sqrt[n]{2\times 4\times 8}=\sqrt[n]{64}=4}$$
但是,当根较大时,对观察值取对数来计算几何平均数会更容易得多。这从下面的表示中可以看出:
$$\mathrm{\log G = \frac{\log x_1+log x_2+log x_3+...+log x_n}{n}=\frac{log \sum x}{n}}$$
在上面 2、4、8 的观察值示例中应用对数:
$$\mathrm{\log G = \frac{\log 2+\log 4+\log 8}{n}=\frac{0.3010+0.6020+0.9030}{3}=0.602}$$
G = antilog 0.602 = 4
调和平均数
调和平均数定义为值的倒数的算术平均数的倒数。换句话说,将观察值的个数除以值的倒数之和即可得到调和平均数。在数学上,对于观察值 x_1,x_2,x_3,x_4,....,x_n:
$$\mathrm{H=\frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\frac{1}{x_3}+\frac{1}{x_4}+\dotso+\frac{1}{x_n}}}$$
例如,2、4 和 8 的调和平均数将为:
$$\mathrm{H=\frac{3}{\frac{1}{2}+\frac{1}{4}+\frac{1}{8}}=\frac{3}{0.5 + 0.25+ 0.125}=3.428}$$
加权平均数/平均值
当每个观察值在平均数计算中具有不同的重要性时,使用加权平均数。每个观察值都加权为 w 因子。加权平均数是通过将每个观察值的加权值之和除以观察值的权重之和来计算的。在数学上,对于观察值 x_1,x_2,x_3,...,x_n 及其权重 w_1,w_2,w_3,...w_n:
$$\mathrm{\mu_w=\frac{w_1x_1+w_2x_2+w_3x_3\dotso+w_nx_n}{w_1+w_2+w_3+\dotso+w_n}=\frac{\sum wx}{\sum w}}$$
例如,假设学生在三门课程中的分数分别为 90、80 和 70,并且相应分配给这些课程的权重分别为 5、7 和 9,则加权平均数将为:
$$\mathrm{\mu_w = \frac{5\times 90+7\times 80+9\times 70}{5+7+9}=78.09}$$
结论
平均数是统计学和机器学习中最流行和最重要的集中趋势之一。它总结了整个数据。了解平均数有助于得出关于数据集的重要见解。平均数的类型包括算术平均数、几何平均数、调和平均数和加权平均数。