频率分布
简介
有时,了解给定数量的包含数据的函数中数据或数据集重复出现的次数非常重要。这些推断有助于检查者确定某些数据集是否占主导地位,或者某些数据重复出现的次数是否低于预期。对于此类推断,频率分布非常有用。
频率分布:定义
频率分布以表格或图形形式给出数据观察值的次数。在频率分布中,观察值的表示是在指定的区间内完成的。因此,频率分布必须具有均匀分布的指定区间。
频率分布是统计学的一部分,它们对正态分布特别有用。对正态分布使用频率分布显示了各种概率在标准差之间的观察结果。
频率分布通常提供观察值分布的视觉表示。因此,它有助于数据用户了解观察值分布的性质。作为样本收集的数据通常需要以视觉形式表示。这样做是为了使数据更易于理解和使用。因此,当以其真实形式使用时,频率分布可以帮助分析师对样本做出更好的推断。
例如,在比较经理的收入时,很有可能有些人获得的工资较高,有些人获得的工资低于平均水平,但很有可能中等收入的集中度高于其他所有收入。频率分布可以通过查看分布(通过频率图或表)帮助分析师很好地了解这一点。
视觉表示
通常,频率分布的视觉表示是使用直方图和条形图完成的。在此类表示中,y 轴表示频率,而 x 轴表示要测量的变量。
例如,在经理的工资中,y 轴是经理的数量,而 x 轴将显示工资。
直方图通常表示正态分布。这意味着大多数频率将集中在中间列中。这些正态分布可以显示在标准差之间划分的观察概率。
饼图也用于频率分布,其中频率的百分比用作组的各个部分。它在一个圆形图中显示了数据在所考虑的总数据中的特定部分。
频率多边形:当直方图的中点用直线连接时,就会得到频率多边形。
频率分布的类型
统计学中有四种频率分布和两种频率分布表。它们是 –
- 非分组频率分布
- 分组频率分布
- 相对频率分布
- 累积频率分布
非分组频率分布
在非分组频率分布中,频率是单独分布的。在非分组频率分布中,没有数据值的组。
分组频率分布
与非分组频率分布不同,在分组频率分布中,数据被划分为组并收集在频率组下。这些组称为区间。因此,分组频率分布以类间距的形式显示频率分布。
相对频率分布
它显示了每个类别中频率分布与总分布观察值的比例。
累积频率分布
它是频率分布中第一个频率和所有其他频率的总和。在这种类型的频率分布中,必须取下一个频率并向其添加一个值。
添加后,将添加值的总和添加到下一个值,依此类推,直到获得最后一个值。以这种方式获得的最后一个值将是分布的累积频率。
频率分布表
频率分布表是频率分布的表格形式。
要制作频率分布表,将收集每个数据,然后将其按组或非分组表的形式放置在表中。记号计数系统是创建分布表表格形式的一种方法。在记号计数系统中,取五个数据形成一个集合,并将每个值放在每个数据集的频率部分。一旦五个数据形成一个集合,一个记号集合就完成了,并且用第五个数据将其划掉。
这样,所有数据都收集在表格中,最后计算每个属性。记号计数系统是一种简单易行的方法,可以收集单个原始数据并将其转换为易于理解的形式。
频率分布表的类型
以下是频率分布表的类型
分组频率分布表
它用于大量数据。形成具有相等区间的类间距,并将数据放入它们所属的组中,一个接一个。最后,在此过程中获得可用数据的表格形式。
分组频率分布表的一个例子如下。
假设在一个班级的 50 个孩子中,有 10 个孩子的分数超过 80。他们的分数如下:81、82、86、83、92、94、86、87、85、90。这可以用表格形式表示如下
分数 | 学生 |
---|---|
80–85 | 4 |
86–90 | 4 |
91–95 | 2 |
96–100 | 0 |
非分组频率分布表
在这种类型的表中,没有根据数据的性质进行分组。单个数据放置在表中,频率放在此类频率分布表的表中。
上面类似的例子将是学生在考试中获得特定分数的数量。
分数 | 学生 |
---|---|
85 | 4 |
86 | 2 |
90 | 1 |
93 | 3 |
分组和非分组频率分布都提供了对原始数据的计划见解。但是,分组数据被认为更优越,因为它与非分组分布相比更容易推断和使用。但是,它们根据可以准备的特定表格具有自身的优缺点。因此,这取决于用户为更容易推断和对数据采取可操作的见解而制作哪种表格。
值得注意的是,采用过长或过短的区间会导致研究错误。因此,必须选择与研究目的相关的最佳区间。
结论
频率分布是统计学中一种流行的方法,可以为数据提供有洞察力的形状。各种形式的数据分类和分组对于研究人员来说以多种方式很有用。例如,频率分布可用于提供有关统计和科学研究期间获得的各种数据的想法。
为了向研究人员提供现成的解决方案和有用的数据,频率分布是一个重要的工具。尽管对数据进行分层并不总是容易的,但频率分布提供了一种使数据收集和管理标准化的方法。由于这种质量,频率分布是不可避免的。
常见问题
Q1. 两种频率分布表是什么,它们之间最大的区别是什么?
答:两种频率分布表是分组和非分组频率分布表。它们之间最大的区别在于,分组频率分布表具有区间,而非分组频率分布表没有区间,并且使用数据个体形式。因此,分组频率分布本质上是连续的。
Q2. 频率是什么意思?
答:频率是指特定项目出现的次数。它通常以单个数字表示。
Q3. 频率分布是如何呈现的?
答:频率分布通过图表或数据集呈现。