单峰分布和双峰分布的区别
我们的生活充满了随机因素,这些因素可能在任何时间对任何特定情况产生重大影响。绝大多数科学领域都严重依赖这些随机变量,尤其是在管理学和社会科学中,尽管化学、工程和物理学也从中受益匪浅。概率和统计特性(包括分布函数)会被分析和量化。在讨论统计概念时,“分布”一词通常指的是概率分布。
分布描述了变量可能值的范围以及这些值出现的频率。变量的模态是指构成数据集中出现次数最多的值或值。数据分布的第一个特征是所讨论变量的最常见值(s)的出现频率。可以通过分布中峰的数量来确定模态。分布中值的频率决定了分布是单峰还是双峰。让我们比较和对比单峰分布和双峰分布。
什么是单峰分布?
单峰分布是指只有一个“峰”的分布,这意味着一个特定值出现的频率高于其他值。这一点从分布名称中就隐含地体现出来了。有时分布可以被认为具有明显的峰值。如果分布只有一个清晰可辨的峰值,或者只有一个值是最常见的,则认为该分布是单峰的。这意味着分布中只有一个峰值。超过这个里程碑后,值在上升到该点后开始下降。
迄今为止最常见的单峰分布形式是正态分布。有时最高点位于中心,有时位于右侧或左侧。众数是数据中最常见的值。无法确保单峰分布是对称的;事实上,此类分布更有可能表现出不对称或偏斜。如果分布的平均值偏离中心到左侧,我们说它是左偏的,如果它偏离中心到右侧,我们说它是右偏的。
什么是双峰分布?
当有两个峰值彼此几乎相等时,我们说分布表现出双峰特征。两个值主导分布,构成绝大多数出现次数。如果你仔细观察图表,你会注意到它有两个驼峰,就像骆驼的背部一样。Bi-表示两个,因此双峰表示有两种方法可以做某事。
具有两个峰值或两个频繁值并由间隙分隔表明为双峰分布。在双峰分布中,有两个或更多不同的众数,每个众数都可以被认为是数据中一个特别引人注目的模式。给定分布的众数是出现频率最高且代表该分布峰值的值。
双峰分布的特点是两个值占主导地位。在大多数情况下,两个众数之间会有很大的差异,并且此分布比大多数其他分布具有更多的观察点。
差异:单峰分布和双峰分布
下表重点介绍了单峰分布与双峰分布的不同之处 -
特征 | 单峰分布 | 双峰分布 |
---|---|---|
定义 |
分布中值的频率决定了分布是单峰还是双峰。 单峰是指一个分布中有一个值比任何其他值都更常见。这里我们有一个分布,其中最常见的出现次数或“峰值”是一个整数。 |
在双峰分布中,最常见的值是中间的值。这表明两个最常见数字之间存在差异。 |
重要性 |
具有单峰形状的分布具有单个最大值。它被称为“钟形曲线”,因为最高点位于中间,并且随着远离顶部,钟形的形状向下倾斜,就像一个钟一样。 由于它是数据中最常出现的数字,因此众数有时被称为峰值。 |
当一个分布有两个几乎相等的峰值时,我们说该分布是双峰的(或众数)。 此分布比大多数其他分布具有更多的观察值,并且两个众数之间的距离比大多数其他分布更宽。 |
例子 |
单峰分布最突出的例子之一是正态分布,其平均值为零,标准差为一。 它的标准差为 1,平均值为 0。卡方分布、柯西分布、指数分布、学生 t 分布等等,仅仅是众多可用分布中的一小部分例子。 |
双峰分布的一个日常例子是伦敦桥在一天中不同时间段的交通量变化。 在上午 8 点到下午 6 点之间,道路上的汽车数量达到峰值,然后数量急剧下降。如果你绘制数据,你会看到同时发生了几个峰值。 |
结论
从统计学角度来看,单峰分布具有单个最大值。它被称为“钟形曲线”,因为最高点位于中间,并且随着远离顶部,钟形的形状向下倾斜,就像一个钟一样。给出了许多单峰分布的例子,但正态分布是迄今为止最常见的。
相反,双峰分布的特点是两个峰值,也称为两个主要高点,它们之间有一个称为局部最小值的谷值。