平均绝对偏差
介绍
各种统计术语和方法用于表示、分析和比较数学中的数据。数据集包含许多数字或值,分析起来相当困难。在这个方向上,各种平均值和偏差术语被用来预测过程的行为。在本教程中,我们将学习集中趋势、方差、偏差、平均值、绝对值和标准差的一些示例。
集中趋势
集中趋势是描述性统计中的一个重要概念。在统计学中,集中趋势被定义为代表概率分布中心值的唯一值。它没有说明数据集的个体信息;然而,它指的是一个索引值,该索引值总结了整个数据集。各种术语已被用来描述数据集的集中趋势。但是,下面描述了一些重要的术语。
平均值 - 平均值或算术平均值是将所有样本值加总除以样本总数的比率。
中位数 - 数据集的中间值(但是数据集按升序排列)。
众数 - 它表示数据集中最频繁的值。
几何平均数 - 几何平均数定义为所有数据的乘积的 n 次方根。换句话说,它也定义为所有数据点的对数值的算术平均数。
算术平均数 - 算术平均数包括数据集中所有数据的平均值。
调和平均数 - 调和平均数是算术平均数的倒数。
加权平均数 - 这种类型的平均数用于总结数据集,以便最大限度地重视数据集中特定值。中值范围 - 它定义为数据集的最大值和最小值的算术值。
方差和偏差
方差和偏差是金融领域最常用的两个统计参数。在数学上,这两个参数彼此相关。让我们详细讨论每个术语。
方差
方差定义为与平均值(算术)的平方差的算术平均值。它告诉我们单个数据与数据集平均值的距离。换句话说,它用于找到预期偏差与实际值的差异。数据集的方差在数学上与偏差相关,如下面的表达式所示。
$$\mathrm{方差 = (标准差)^2=\sigma ^2}$$
评估数据集中方差的一般公式如下所示。
$\mathrm{ 方差 =\sigma ^2=\frac{∑(X-μ)^2}{P}}$(对于分组数据)
$\mathrm{方差 =\sigma^2=\frac{\sum(X-( \underline{\bar{x}}) )^2}{P-1}}$(对于非分组数据)
其中 X、μ、 和 P 分别表示单个数据的值、总体平均值、数据的平均值和数据的总数。
偏差
偏差衡量方差和单个数据之间的差异。它告诉我们数据分散的程度。偏差值低表示观察到的数据更接近平均值。在偏差值较高的情况下,观察值和平均值之间存在显着差异。
偏差类型
统计学中存在几种类型的偏差,如下所示。
平均绝对偏差
标准差
平均绝对偏差
最大绝对偏差
平均绝对偏差
它被定义为每个观察到的数据与整个数据集平均值的平均距离。它缩写为“MAD”。以下公式可用于确定平均绝对偏差。
$$\mathrm{MAD =\sum \frac{距中心测量的绝对值偏差}{样本总数}= \sum \frac{|X-\underline{\bar{x}}|}{P}}$$
需要遵循以下步骤来评估平均绝对偏差。
评估整个数据集的平均值。
找到每个观测值与平均值之间的差异。
找到获得的差值的算术平均值。所得值将给出所需的平均绝对偏差。
标准差
标准差是方差的平方根,它告诉我们数据分散的程度。它用符号“σ”表示,缩写为 SD。SD 值低表示观察到的数据更接近平均值。在 SD 值较高的情况下,观察值和平均值之间存在显着差异。评估数据集中 SD 的一般公式如下所示。
$\mathrm{ SD =\sigma =\sqrt{\frac{\sum (X-μ)^2}{P}}}$(对于分组数据)
$\mathrm{ SD =\sigma =\sqrt{\frac{\sum (X-\underline{\bar{x}})^2}{P-1}}}$(对于非分组数据)
其中 $\mathrm{X, \mu, \underline{\bar{x}}, and\: P }$ 分别表示单个数据的值、总体平均值、数据的平均值和数据的总数。
标准差和平均绝对偏差之间的异同
标准差和平均绝对偏差之间的相似之处如下所述。
两种偏差都用于量化数据集中偏差。
算术平均值用于计算两种偏差。
但是,这两种偏差之间存在一些差异,总结如下。
序号 | 标准差 | 平均绝对偏差 |
---|---|---|
1 | 它通常用于统计学。 | 它是查找偏差的另一种方法。 |
2 | 它可以使用公式计算,$\mathrm{\sigma =\sqrt{\frac{\sum (X-\underline{\bar{x}})^2}{P-1}}}$ | 它可以使用公式计算, $\mathrm{MAD=\sum \frac{ |X-\underline{\bar{x}}|}{P}}$ |
3 | SD 的值始终小于 MAD。 | MAD 的值始终大于 SD。 |
已解决示例
示例 1
评估以下数据集的平均绝对偏差:10、5、19、30、45、60、55 和 72。
解决方案
数据的平均值 = $\mathrm{\underline{\bar{x}}=\frac{10+5+19+30+45+60+55+72}{8}=37}$
平均绝对偏差可以使用以下公式获得,
$$\mathrm{MAD=\sum \frac{|X-\underline{\bar{x}|}}{P}}$$
$$\mathrm{\Rightarrow MAD=\frac{|10-37|+|5-37|+|19-37|+|30-37|+|45-37|+|60-37|+|55-37|+|72-37|}{8}}$$
$$\mathrm{\Rightarrow MAD=21}$$
∴ 给定数据集的平均绝对偏差为 21。
示例 2
评估分组数据的方差和标准差。
类别间隔 | 0-4 | 4-8 | 8-12 | 12-16 | 16-20 | 20-24 |
---|---|---|---|---|---|---|
频率 | 2 | 3 | 1 | 5 | 6 | 8 |
解决方案
类别间隔 | 频率 (f) | 类别标记 (xi) | fxi | fxi2 |
---|---|---|---|---|
0-4 | 2 | 2 | 4 | 8 |
4-8 | 3 | 6 | 18 | 108 |
8-12 | 1 | 10 | 10 | 100 |
12-16 | 5 | 14 | 70 | 980 |
16-20 | 6 | 18 | 108 | 1944 |
20-24 | 8 | 22 | 176 | 3872 |
$$\mathrm{\sum \mathit{f}=25}$$ | $$\mathrm{\sum \mathit{f}x_i=386}$$ | $$\mathrm{\sum \mathit{f}x_i^2=7012}$$ |
$$\mathrm{平均值 = \bar{x}=\frac{\sum fx_i}{\sum f}=\frac{386}{25}=15.44}$$
$$\mathrm{方差 =\frac{1}{\sum f-1}[\sum fx_i^2-\frac{1}{\sum f}(\sum fx_i )^2]}$$
$$\mathrm{\Rightarrow 方差 =\frac{1}{25-1}[7012-\frac{1}{25}(386)^2]}$$
$$\mathrm{\Rightarrow 方差 =43.84}$$
现在,标准差 $\mathrm{= \sqrt{方差}=\sqrt{43.84}=6.62}$
∴ 给定数据集的方差和标准差分别为 43.84 和 6.62。
结论
本教程简要介绍了集中趋势及其各种平均值。本教程中说明了平均绝对偏差和标准偏差的基本定义。此外,还说明了这两种偏差之间的异同。此外,还提供了一些已解决的示例,以更好地阐明此概念。总之,本教程可能有助于理解平均绝对偏差的基本概念。
常见问题解答
1. 标准差为零意味着什么?
标准差值为零表示数据集中所有观察到的数据都相等。
2. 标准差的局限性是什么?
计算偏差的困难是标准差的主要缺点。此外,它无法在开区间中计算。
3. 标准差的良好值应该是多少?
大多数数学家希望将标准差值保持在 ±2 的范围内。
4. 方差为零意味着什么?
数据集的零方差表示数据值是恒定的。
5. 平均绝对偏差的优点是什么?
平均绝对偏差的主要优点包括与标准偏差相比的简单性和有效性。