均值定义
引言
在一个组织中,为了分析和表示的目的,需要收集和处理大量数据。在这个方向上,统计参数帮助我们有效地分析数据。在上述目的中,统计学中使用了各种均值。在本教程中,我们将学习均值的含义、类型、它们之间的关系,以及对其他集中趋势的简要讨论,并附带解题示例。
数据
数据是一个集合词,代表数量或类别值的集合或排列。
数据收集的目的是分析过程中特定事件。
当数据系统地排列时,它被称为信息。
数据可以根据值或收集来源进行分类。
下面总结了关于各种数据类型的简要讨论。
| 序号 | 数据类型 | 含义 |
|---|---|---|
| 1 | 定量数据 | 这些数据类型可以被测量或量化,并用算术值表示。可以对它们进行代数运算。 |
| 2 | 定性数据 | 数据不能被测量或用数值表示。它们要么是特征,要么是属性。 |
| 3 | 原始数据 | 数据是第一次收集的,并且对这些数据没有进行任何统计运算。 |
| 4 | 次级数据 | 这些类型的数据是从已发表的或未发表的来源收集的。这些数据已经进行了统计运算。 |
| 5 | 离散数据 | 它代表数据的特定值。线形图或图表主要用于表示数据。 |
| 6 | 连续数据 | 它表示特定范围内的数据值。直方图通常用于表示数据。 |
集中趋势
集中趋势是描述性统计中的一个重要概念。
在统计学中,集中趋势被定义为代表概率分布中心值的唯一值。
它没有说明数据集的个体信息;然而,它指的是一个索引值,它总结了整个数据集。
各种术语已被用来描述数据集的集中趋势。统计学中使用了各种集中趋势,例如均值、中位数、众数、几何均值、算术平均数、调和平均数等。
均值
均值是一个统计术语,用于描述一组数据的集中趋势。
它被定义为所有数据点的总和与数据点个数的比率。
它通常用一个符号表示,即$\mathrm{\underline{M}}$。数学上,它可以写成
$$\mathrm{\underline{M}=\frac{所有数据点的总和}{数据点的总数}}$$
$$\mathrm{或\:\underline{M}=\frac{m_1+m_2+m_3+m_4+.......+m_r}{r}}$$
$$\mathrm{或\:\underline{M}=\frac{\sum_{i=1}^r m_i}{r}}$$
其中 r = 数据点的总数
m1,m2,m3,...= 各个数据的数值
符号 "∑ " 表示值的加法或求和。
均值的类型
统计学中使用了四种类型的均值。
算术平均数 − 算术平均数的含义包括数据集中所有数据的平均值。此外,它缩写为AM。统计上,它表示为算术平均数$\mathrm{(AM) =\underline{M}= \frac{Σ m}{r}}$
其中 r = 数据总数
Σ m = 所有单个数据的总和
几何平均数 − 几何平均数定义为所有数据乘积的 r 次方根。换句话说,它也被定义为所有数据点的对数值的算术平均数。此外,它缩写为 GM。因此,几何平均数可以表示为
几何平均数 (GM) =$\mathrm{=\sqrt[r]{m_1×m_2×m_3×m_4×.....×m_r}}$
$$\mathrm{或\: GM= (m_1×m_2×m_3×m_4×.....×m_r )^{\frac{1}{r}} }$$
其中 m_1,m_2,m_3,...= 各个数据的数值
调和平均数 − 调和平均数是算术平均数的倒数。它缩写为 HM。当组大小与另一个组不同时,它被发现更有效。因此,调和平均数可以表示为调和平均数$\mathrm{(HM) =\frac{r}{\sum \frac{1}{m}}(其中\: r = 元素个数) }$
加权平均数 − 此类型的平均数用于总结数据集,以便最大限度地重视数据集中特定值。此外,它缩写为 WM。加权平均数可以表示如下加权平均数$\mathrm{(WM) = \frac{Σw_i x_i}{w_i}}$
其中 wi= 应用于每个值的权重,xi= 要平均的单个数据。
AM、GM 和 HM 之间的关系
为了建立 AM、GM 和 HM 之间的关系,考虑两个算术值,即 p 和 q。
现在这两个数的 AM 是 = $\mathrm{AM =\frac{p+q}{2}}$
这两个数的 GM 是 = $\mathrm{GM =\sqrt{pq}}$
这两个数的 HM 是 $\mathrm{=\frac{2pq}{p+q}}$
通过对 AM 和 GM 进行代数运算,我们将得到
$$\mathrm{\frac{p+q}{2}\times \frac{2pq}{p+q}=(\sqrt{pq})^2}$$
这意味着,AM×HM=GM2
因此,GM 的平方是 AM 和 HM 的乘积。
其他集中趋势
一些重要的集中趋势已列在下面。
广义平均数
截断均值
四分位数间距平均数
中值范围
四分位数中位数
拟算术平均数
三均值
众数和中位数
众数 − 它被定义为数据集中出现频率最高的值。
中位数 − 中位数是一个索引或值,当样本按升序或降序排列时,它显示数据集的中间位置。它将数据集分成两半,即上半部分和下半部分集。此外,中位数也称为位置平均数。
解题示例
例 1
计算数据 -6、-9、10、8 的 AM 和 GM。
解答
算术平均数为 = $\mathrm{AM=\frac{-6-9+10+8}{4}=0.75}$
可以使用以下公式找到几何平均数
$$\mathrm{(GM) =\sqrt[4]{(-6)×(-9)×10×8}≃8.11}$$
∴ 给定数据的 AM 和 GM 分别为 0.75 和 8.11。
例 2
给定一组数据:4 和 16。
使用给定的数据集证明语句 AM×HM=GM2。
解答
$$\mathrm{AM =\frac{4+16}{2}=10}$$
$$\mathrm{GM = \sqrt{4×16}=8}$$
$$\mathrm{HM =\frac{2}{\frac{1}{4}+\frac{1}{16}}=6.4}$$
根据上述值,可以得出结论 AM×HM=GM2
结论
本教程简要介绍了均值及其各种类型。本教程说明了集中趋势的基本定义及其各种参数。此外,还推导了 AM、GM 和 HM 之间的关系。此外,还提供了一些解题示例,以便更好地理解这一概念。总之,本教程可能有助于理解均值的基本概念。
常见问题
1.几何平均数的第一项可以为零吗?
不可以。几何级数或序列的第一项应为非零数。
2.几何平均数和算术平均数中哪个是更好的选择?
算术平均数用于评估数据的平均值,而几何平均数考虑了随时间推移的复合概念。因此,它更适合用于金融领域,以确定固定投资的回报。
3.在什么情况下,这两个均值(即 AM 和 GM)相同?
如果所有数据的数值都相等,那么这两个均值彼此相同。
4.前五个偶数的均值和中位数相同吗?
前五个偶数是 2、4、6、8 和 10。
$$\mathrm{Mean =\frac{2 + 4+ 6 + 8 + 10}{5} = 6}$$
$$\mathrm{Median =(\frac{n+1}{2})^{th}\:term}$$
$$\mathrm{=(\frac{5+1}{2})^{th}\:term}$$
$$\mathrm{=(3)^{rd}\: term=6}$$
∴ 前五个偶数的均值和中位数相等。
5.几何平均数的局限性是什么?
如果数据集中存在负整数,则难以找到几何平均数。
数据结构
网络
关系数据库管理系统(RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP