- 统计学教程
- 主页
- 调整后的R平方
- 方差分析
- 算术平均数
- 算术中位数
- 算术众数
- 算术极差
- 条形图
- 最佳点估计
- Beta分布
- 二项分布
- Black-Scholes模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 循环排列
- 整群抽样
- Cohen's kappa系数
- 组合
- 有放回组合
- 比较图表
- 连续均匀分布
- 连续数列算术平均数
- 连续数列算术中位数
- 连续数列算术众数
- 累积频率
- 变异系数
- 相关系数
- 累积图
- 累积泊松分布
- 数据收集
- 数据收集 - 问卷设计
- 数据收集 - 观察
- 数据收集 - 案例研究方法
- 数据模式
- 十分位数统计
- 离散数列算术平均数
- 离散数列算术中位数
- 离散数列算术众数
- 点图
- 指数分布
- F分布
- F检验表
- 阶乘
- 频数分布
- 伽马分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 总平均数
- Gumbel分布
- 调和平均数
- 调和数
- 谐振频率
- 直方图
- 超几何分布
- 假设检验
- 个体数列算术平均数
- 个体数列算术中位数
- 个体数列算术众数
- 区间估计
- 逆伽马分布
- Kolmogorov Smirnov检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽马分布
- 逻辑回归
- Mcnemar检验
- 平均偏差
- 均值差异
- 多项分布
- 负二项分布
- 正态分布
- 奇排列和偶排列
- 单比例Z检验
- 离群值函数
- 排列
- 有放回排列
- 饼图
- 泊松分布
- 合并方差 (r)
- 功效计算器
- 概率
- 概率加法定理
- 概率乘法定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) & 过程性能 (Pp)
- 过程Sigma
- 二次回归方程
- 定性数据与定量数据
- 四分位差
- 经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 信度系数
- 所需样本量
- 残差分析
- 残差平方和
- 均方根
- 样本计划
- 抽样方法
- 散点图
- Shannon Wiener多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误 (SE)
- 标准正态表
- 统计显著性
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生t检验
- 平方和
- t分布表
- Ti 83指数回归
- 变换
- 截尾均值
- I型和II型错误
- 方差
- 韦恩图
- 大数弱定律
- Z表
- 统计学有用资源
- 统计学 - 讨论
统计学 - Kolmogorov Smirnov检验
此检验用于需要比较观察样本分布与理论分布的情况。
K-S单样本检验
此检验用作拟合优度检验,当样本量较小时非常理想。它将变量的累积分布函数与指定的分布进行比较。零假设假设观察分布与理论分布之间没有差异,并且检验统计量“D”的值计算如下
公式
$D = 最大值 |F_o(X)-F_r(X)|$
其中 -
${F_o(X)}$ = n个观测值的随机样本的观察累积频率分布。
以及 ${F_o(X) = \frac{k}{n}}$ = (≤X的观测值数)/(观测值总数)。
${F_r(X)}$ = 理论频率分布。
从K-S表中找到单样本检验的${D}$的临界值。
接受标准:如果计算值小于临界值,则接受零假设。
拒绝标准:如果计算值大于表值,则拒绝零假设。
示例
问题陈述
在一项针对大学不同专业的60名学生的调查中,从每个专业抽取相同数量的学生进行访谈,并记录了他们加入大学戏剧俱乐部的意愿。
理学士 | 文学士 | 工商管理学士 | 文学硕士 | 工商管理硕士 | |
---|---|---|---|---|---|
每个班级的数量 | 5 | 9 | 11 | 16 | 19 |
预计每个班级的12名学生将加入戏剧俱乐部。使用K-S检验来确定学生班级在加入戏剧俱乐部的意愿方面是否存在差异。
解决方案
${H_o}$:不同专业的学生在加入戏剧俱乐部的意愿方面没有差异。
我们为观察分布和理论分布开发累积频率。
专业 | 有兴趣加入的学生人数 | ${F_O(X)}$ | ${F_T(X)}$ | ${|F_O(X)-F_T(X)|}$ | |
---|---|---|---|---|---|
观察值 (O) | 理论值 (T) | ||||
理学士 | 5 | 12 | 5/60 | 12/60 | 7/60 |
文学士 | 9 | 12 | 14/60 | 24/60 | 10/60 |
工商管理学士 | 11 | 12 | 25/60 | 36/60 | 11/60 |
文学硕士 | 16 | 12 | 41/60 | 48/60 | 7/60 |
工商管理硕士 | 19 | 12 | 60/40 | 60/60 | 60/60 |
总数 | n=60 | ||||
检验统计量${|D|}$计算如下
在5%显著性水平下,D的表值由下式给出
由于计算值大于临界值,因此我们拒绝零假设,并得出结论,不同专业的学生在加入俱乐部的意愿方面存在差异。
K-S双样本检验
当有两个独立样本而不是一个样本时,可以使用K-S双样本检验来检验两个累积分布之间的一致性。零假设表明两个分布之间没有差异。D统计量的计算方式与K-S单样本检验相同。
公式
${D = 最大值 |{F_n}_1(X)-{F_n}_2(X)|}$
其中 -
${n_1}$ = 第一个样本的观测值。
${n_2}$ = 第二个样本的观测值。
可以看出,当累积分布显示较大的最大偏差${|D|}$时,表明两个样本分布之间存在差异。
对于${n_1 = n_2}$且≤ 40的样本,使用双样本情况下的K-S表来查找D的临界值。当${n_1}$和/或${n_2}$ > 40时,应使用双样本大样本的K-S表。如果计算值小于表值,则接受零假设,反之亦然。
因此,使用任何这些非参数检验都可以帮助研究人员在目标总体特征未知或未对其进行任何假设的情况下检验结果的显著性。