- 统计学教程
- 首页
- 调整后的R平方
- 方差分析
- 算术平均数
- 算术中位数
- 算术众数
- 算术极差
- 条形图
- 最佳点估计
- 贝塔分布
- 二项分布
- 布莱克-斯科尔斯模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 环形排列
- 整群抽样
- 科恩kappa系数
- 组合
- 有放回组合
- 比较图表
- 连续均匀分布
- 连续数列算术平均数
- 连续数列算术中位数
- 连续数列算术众数
- 累积频率
- 变异系数
- 相关系数
- 累积图
- 累积泊松分布
- 数据收集
- 数据收集 - 问卷设计
- 数据收集 - 观察
- 数据收集 - 案例研究方法
- 数据模式
- 十分位数统计
- 离散数列算术平均数
- 离散数列算术中位数
- 离散数列算术众数
- 点图
- 指数分布
- F分布
- F检验表
- 阶乘
- 频率分布
- 伽马分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 总平均数
- Gumbel分布
- 调和平均数
- 调和数
- 谐振频率
- 直方图
- 超几何分布
- 假设检验
- 个体数列算术平均数
- 个体数列算术中位数
- 个体数列算术众数
- 区间估计
- 逆伽马分布
- Kolmogorov-Smirnov检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽马分布
- 逻辑回归
- 麦克尼马尔检验
- 平均偏差
- 均值差异
- 多项分布
- 负二项分布
- 正态分布
- 奇排列和偶排列
- 单比例Z检验
- 异常值函数
- 排列
- 有放回排列
- 饼图
- 泊松分布
- 合并方差 (r)
- 功效计算器
- 概率
- 概率加法定理
- 概率乘法定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) 和过程性能 (Pp)
- 过程Sigma
- 二次回归方程
- 定性数据与定量数据
- 四分位差
- 经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 信度系数
- 所需样本量
- 残差分析
- 残差平方和
- 均方根
- 样本计划
- 抽样方法
- 散点图
- 香农-维纳多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误 (SE)
- 标准正态分布表
- 统计显著性
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生t检验
- 平方和
- t分布表
- TI-83指数回归
- 转换
- 截尾均值
- I型和II型错误
- 方差
- 韦恩图
- 大数定律
- Z表
- 统计学有用资源
- 统计学 - 讨论
统计学 - 分层抽样
这种检查策略用于总体可以轻松地划分为群体或层的情况,这些群体或层彼此之间特别不同,但在一个群体内的元素在某些属性方面是同质的,例如,学校的学生可以根据性别、提供的课程、年龄等划分为层。在这种情况下,总体首先被划分为层,然后从每个层中抽取一个简单随机样本。分层抽样有两种类型:比例分层抽样和非比例分层抽样。
比例分层抽样 - 在这种情况下,从每个层中选择的单位数量与该层在总体中的比例成正比,例如,在一所大学中,共有 2500 名学生,其中 1500 名学生注册了本科课程,1000 名学生注册了研究生课程。如果要使用比例分层抽样选择 100 个样本,则样本中本科生的数量将为 60,研究生为 40。因此,这两个层在样本中的表示比例与其在总体中的表示比例相同。
当抽样的目的是估计某个特征的总体值并且层内方差没有差异时,这种方法最合适。
非比例分层抽样 - 当研究的目的是比较层之间的差异时,有必要从所有层中抽取相同数量的单位,而不管它们在总体中的比例如何。有时,某些层在某些特征方面比其他层变化更大,在这种情况下,可以从变化更大的层中抽取更多数量的单位。在这两种情况下,抽取的样本都是非比例分层样本。
层的大小和层变异性的差异可以使用以下公式来优化分配,以确定来自不同层的样本量
公式
${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+...+n_k\sigma_k}\ for\ i = 1,2 ...k}$
其中 -
${n_i}$ = 第i层的样本量。
${n}$ = 层的大小。
${\sigma_1}$ = 第i层的标准差。
此外,可能存在在一个层中收集样本的成本可能高于另一个层的情况。最佳非比例抽样应以以下方式进行
${\frac{n_1}{n_1\sigma_1\sqrt{c_1}} = \frac{n_2}{n_2\sigma_1\sqrt{c_2}} = ... = \frac{n_k}{n_k\sigma_k\sqrt{c_k}}}$
其中 ${c_1, c_2, ... ,c_k}$ 指的是在k层中抽样的成本。可以使用以下公式确定来自不同层的样本量
${n_i = \frac{\frac{n.n_i\sigma_i}{\sqrt{c_i}}}{\frac{n_1\sigma_1}{\sqrt{c_i}}+\frac{n_2\sigma_2}{\sqrt{c_2}}+...+\frac{n_k\sigma_k}{\sqrt{c_k}}}\ for\ i = 1,2 ...k}$
示例
问题陈述
一个组织有 5000 名员工,他们被分层为三个级别。
层A:50名高管,标准差=9
层B:1250名非体力劳动者,标准差=4
层C:3700名体力劳动者,标准差=1
如何以非比例的方式抽取 300 名员工的样本,并进行最佳分配?
解决方案
使用非比例抽样公式进行最佳分配。