Minitab 中的正态性检验:带统计功能的 Minitab
正态性是统计学中的一个关键概念,它被用于各种统计程序中。正态性检验用于确定数据是否服从正态分布。正态分布是以其均值为中心的对称钟形曲线。由于在许多物理、生物和社会测量情况下,正态性会自发出现,因此正态分布是最常见的统计分布。许多统计研究需要来自正态分布总体的数
可以使用 Minitab 进行正态性检验。Minitab 具有可轻松进行统计计算的统计工具。让我们看看如何在 Minitab 中进行正态性检验。
什么是正态性检验?
正态性检验,也称为 Anderson-Darling 检验,是一种统计检验,用于确定数据集是否正态分布。正态分布通常被称为“钟形曲线”。数据分布是否正态决定了可以使用哪些检验或函数。
如何在 Minitab 上进行正态性检验?
在对给定数据进行任何统计分析之前,确定它是否遵循正态分布至关重要。如果给定数据呈正态分布,则可以使用参数检验(均值检验)来进行进一步的统计分析。如果提交的数据不呈正态分布,则必须进行非参数检验(中位数检验)。参数检验比非参数检验更强大。因此,检查提交数据的正态性变得更加重要。
提出假设 - 提出假设是开始任何统计研究的一种明智方法。正态性检验的原假设是“数据服从正态分布”,而备择假设是。
选择数据 - 从您希望进行正态性检验的电子表格中复制数据。
将数据复制并粘贴到 Minitab 电子表格中 - 打开 Minitab 并将数据复制并粘贴到 Minitab 电子表格中。
在 Minitab 的菜单栏中,单击“统计”。
单击“基本统计”。
单击“正态性检验”
选择数据 - 屏幕上会出现一个小窗口,标题为“正态性检验”。在实际选择项上的白色框内单击,然后单击“选择”。
请注意,所选数据的名称将显示在“变量”选项卡上。
此外,请记住“Anderson-Darling”已在“正态性检验”下选中。最常用的正态性检验是Anderson-Darling。因此,Minitab 中正态性检验的默认选择是“Anderson-Darling”。
单击“确定”。
识别正态概率图中显示的 p 值 - 屏幕上会出现一个正态概率图。
请检查正态概率图中显示的 p 值是大于还是小于 0.05。
得出结论 - 如果我们未能拒绝原假设(如起草阶段所示),则推论将是“数据服从正态分布”。如果拒绝原假设,则结论将是“数据不服从正态分布”。现在让我们将 p 值与书面假设联系起来。
如果 p 值大于 0.05,则不拒绝原假设 - 如果在正态概率图中找到的 p 值大于 0.05,则不拒绝原假设。因此,结论是“数据服从正态分布”。
如果 p 值小于 0.05,则拒绝原假设 - 如果正态概率图中的 p 值小于 0.05,则我们拒绝原假设。因此,结论是“数据不服从正态分布”。
图形方法
可以将样本数据的直方图与正态概率曲线进行比较,作为评估正态性的非正式方法。数据的经验分布(直方图)应呈钟形,并且与正态分布相似。如果样本量很小,这可能不容易观察到。在这种情况下,将数据与具有与样本相同的均值和方差的正态分布的分位数进行回归可能是合适的。与回归线的拟合不足表明偏离正态性(参见 Anderson Darling 系数和 Minitab)。
正态概率图,即标准化数据相对于标准正态分布的分位数-分位数图 (QQ 图),是一种用于检验正态性的图形工具。在这种情况下,样本数据与正态分位数之间的相关性(拟合优度度量)表明正态分布描述数据的程度。正态数据的 QQ 图中显示的点应大致落在一条直线上,表明高度正相关。这些图表易于阅读,并且还具有突出异常值的额外好处。
粗略估计检验
68-95-99.7 规则指出,如果正态分布包含一个三事件(准确地说是 3s 事件)并且样本少于 300 个或 4s 事件,尤其是在 15,000 个样本中更罕见,则它将低估偏差的最大幅度。一个简单的粗略估计检验使用样本最大值和最小值来计算其 z 分数,或者更准确地说,是 t 统计量。
正态性检验示例
一家加工食品制造商的科学家试图确定该公司瓶装酱汁中包含多少脂肪。标称百分比为 15%。在 20 个随机样本中,科学家计算了脂肪的比例。
在进行假设检验之前,科学家希望验证正态性假设的有效性。
描述结果
拟合的正态分布线和数据点非常接近。p 值高于 0.05 的显著性阈值。因此,科学家无法证明数据不服从正态分布。