- 统计学教程
- 首页
- 调整后的R平方
- 方差分析
- 算术平均数
- 算术中位数
- 算术众数
- 算术极差
- 条形图
- 最佳点估计
- 贝塔分布
- 二项分布
- 布莱克-斯科尔斯模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 环形排列
- 整群抽样
- 科恩kappa系数
- 组合
- 有放回组合
- 比较图表
- 连续均匀分布
- 连续数列算术平均数
- 连续数列算术中位数
- 连续数列算术众数
- 累计频率
- 变异系数
- 相关系数
- 累积图
- 累积泊松分布
- 数据收集
- 数据收集 - 问卷设计
- 数据收集 - 观察
- 数据收集 - 案例研究方法
- 数据模式
- 十分位数统计
- 离散数列算术平均数
- 离散数列算术中位数
- 离散数列算术众数
- 点图
- 指数分布
- F分布
- F检验表
- 阶乘
- 频率分布
- 伽马分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 总平均数
- Gumbel分布
- 调和平均数
- 调和数
- 谐振频率
- 直方图
- 超几何分布
- 假设检验
- 个体数列算术平均数
- 个体数列算术中位数
- 个体数列算术众数
- 区间估计
- 逆伽马分布
- Kolmogorov-Smirnov检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽马分布
- 逻辑回归
- 麦克尼马尔检验
- 平均偏差
- 均值差异
- 多项分布
- 负二项分布
- 正态分布
- 奇排列和偶排列
- 单比例Z检验
- 异常值函数
- 排列
- 有放回排列
- 饼图
- 泊松分布
- 合并方差 (r)
- 功效计算器
- 概率
- 概率加法定理
- 概率乘法定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) 和过程性能 (Pp)
- 过程Sigma
- 二次回归方程
- 定性数据与定量数据
- 四分位差
- 经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 信度系数
- 必需样本量
- 残差分析
- 残差平方和
- 均方根
- 样本计划
- 抽样方法
- 散点图
- 香农-维纳多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误 (SE)
- 标准正态分布表
- 统计显著性
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生t检验
- 平方和
- t分布表
- TI-83指数回归
- 转换
- 截尾均值
- I型和II型错误
- 方差
- 维恩图
- 大数弱定律
- Z表
- 统计学有用资源
- 统计学 - 讨论
统计学 - 必需样本量
检验的一个关键部分是选择检验的度量,即从总体中选择多少单位来完成研究。对于确定最合适的样本量,没有明确的答案或解决方案。关于样本量的大小存在一些误解,例如样本量应为总体的10%或样本量与总体的大小成正比。但是,如前所述,这些仅仅是误解。样本量的大小取决于所研究总体参数的变化以及研究人员所需的估计精度。
关于样本量的最佳大小的决策可以从两个角度出发,即主观和数学角度。
确定样本量的主观方法
确定样本量的数学方法
确定样本量的主观方法
样本量大小的选择受以下讨论的各种因素的影响
总体的性质 - 同质性或异质性的水平会影响样本量的大小。如果总体在感兴趣的特征方面是同质的,那么即使是少量样本也足够了。但是,如果总体是异质的,那么需要更大的样本才能确保足够的代表性。
被调查者的性质 - 如果被调查者容易获得且容易接触,那么可以从少量样本中获得所需的数据。然而,如果被调查者不合作并且预计不回复率很高,那么需要更大的样本。
研究的性质 - 可以使用大型样本进行一次性研究。如果发生持续性的研究,并且需要进行深入的研究,那么较小的样本更合适,因为它易于管理和在较长的时间范围内保持较小的样本。
采用的抽样技术 - 影响样本量大小的一个重要变量是采用的抽样方法。首先,非概率方法需要比概率方法更大的样本。此外,在概率抽样中,如果使用简单随机抽样,则需要比使用分层抽样更大的样本,在分层抽样中,较小的样本就足够了。
制表复杂度 - 在确定样本量时,研究人员还应该考虑将结果汇总和分析到的类别和组的数量。已经观察到,要生成的类别越多,样本量就越大。由于每个类别都应有足够的代表性,因此需要更大的样本才能提供对最小类别的可靠度量。
资源可用性 - 研究人员可用的资源和时间会影响样本量的大小。研究是一项耗时且耗资的任务,例如工具准备、聘用和培训外勤人员、运输成本等会占用大量资源。因此,如果研究人员没有足够的时间和资源,他将选择较小的样本。
所需的精度和准确度 - 从我们之前的讨论中可以清楚地看出,由标准误差衡量的精度,只有当S.E较小或样本量较大时才会较高。
此外,要获得高水平的精度,需要更大的样本。除了这些主观努力之外,样本量也可以用数学方法确定。
确定样本量的数学方法
在确定样本量的数学方法中,首先说明所需的估计精度,然后计算样本量。精度可以指定为真实均值的±1,置信水平为99%。这意味着,如果样本均值为200,则均值的真实值将在199到201之间。此精度级别由术语“c”表示。
均值的样本量确定。
总体均值的置信区间由下式给出
${\bar x \pm Z\frac{\sigma_p}{\sqrt N}\ 或\ \bar x \pm e}$
其中 -
${\bar x}$ = 样本均值
${e}$ = 可接受误差
${Z}$ = 给定置信水平下标准正态变量的值
${\sigma_p}$ = 总体标准差
${n}$ = 样本量
可接受误差'e',即${\mu}$和${\bar x}$之间的差异由下式给出
${Z.\frac{\sigma_p}{\sqrt N}}$
因此,样本量为
${n = \frac{Z^2{\sigma_p}^2}{e^2}}$
或
如果样本量相对于总体大小而言很大,则上述公式将通过有限总体乘数进行校正。
${n = \frac{Z^2.N.{\sigma_p}^2}{(N-1)e^2 + Z^2.{\sigma_p}^2}}$
其中 -
${N}$ = 总体大小
比例的样本量确定
当估计比例时确定样本量的方法与估计均值的方法相同。总体比例${\hat p}$的置信区间由下式给出
${ p \pm Z. \sqrt{\frac{p.q}{n}}}$
其中 -
${p}$ = 样本比例
${q = (1 - p)}$
${Z}$ = 样本比例的标准正态变量的值
${n}$ = 样本量
由于要估计${ \hat p}$,因此可以通过取p = 0.5(一个可接受的值)来确定p的值,从而得到一个保守的样本量。另一种选择是通过试点研究或根据个人判断来估计p的值。给定p的值,可接受误差'e'由下式给出
如果总体是有限的,则上述公式将通过有限总体乘数进行校正。
示例
问题陈述
一家购物商店有兴趣估计拥有该商店特权会员卡的家庭的比例。以前的研究表明,59% 的家庭拥有该商店的信用卡。在置信水平为 95% 且容许误差水平为 05 的情况下。
确定进行研究所需的样本量。
如果目标家庭的数量已知为 1000,样本量是多少?
解决方案
该商店拥有以下信息
可以通过应用以下公式确定样本量
因此,369 户家庭的样本足以进行研究。
由于总体,即目标家庭已知为 1000,并且上述样本是总人口的重要部分,因此使用包含有限总体乘数的校正公式。
因此,如果总体是包含1000户家庭的有限总体,则进行该研究所需的样本量为270。
从这个例子可以看出,如果已知总体规模,则确定的样本量会减小。