测量尺度
科学研究的第一条规则是诚实而准确地报告科学家观察到什么以及在什么条件下观察到。科学家描述了观察到的内容以及遵循的条件和程序。需要为他人提供证实这些发现的机会,这使得这一要求成为高度优先事项。为了达到真实性,定义观察参数是测量特定事件的初始步骤。
测量尺度
测量是对观察结果进行记录,并将收集到的数据作为研究的一部分写下来。分配给变量的特征、情感或观点的值之间的关系被称为测量水平。例如,对于变量“快餐的味道是否好”有各种属性,包括非常好、好、不好不坏、坏和非常糟糕。我们可以按顺序给五个属性赋予值1、2、3、4和5,以分析此变量的结果。测量水平描述了这五个变量之间的关系。在这里,数字作为较长文本短语的简短替代品。
名义尺度或类别尺度
当我们可以用符号或数字替换真实物体(而不理解其数字含义)时,最简单、最基本和最弱的测量类型就是这种情况。换句话说,我们只使用这些符号或数字来描述或分类事物、人甚至特征。在最基本的层面上,科学家需要开发一个分类系统,使所有记录的事件都能符合该系统。为方便识别,我们为每类事件或项目分配一个名称、一个数字或一个符号。
然后,名义尺度或分类尺度包含这些符号或数字。该尺度的类别必须是互斥的(每个观察结果只能在一个类别下分类)、穷尽的(必须有足够的类别来对每个观察结果进行分类)且无序的。通常,构成名义尺度的类别称为特征。因此,哺乳动物的性别只有两种:雄性和雌性。在名义尺度中,缩放操作包括将给定类别划分为多个互不相容的子类别。任何子类别的成员在缩放属性或特征上都必须是等价的。等价性是此尺度中使用的唯一关系。
名义尺度的统计检验
由于分配给每个类别的符号或标签是任意的,并且可以在不改变尺度基本信息的情况下进行修改,因此唯一可以使用的描述性统计数据是不受此类互换影响或改变的统计数据。它们就是粗略众数、比例和频率。但是,名义尺度上的数据可用于检验关于事件如何在类别中分布的假设。为此,可以使用卡方检验、列联系数和一些基于二项式展开的更多检验。
顺序尺度
顺序尺度允许研究人员根据共享的特定特征对人、事物或调查回复进行分组。例如,在名义尺度上,一个类别的对象不仅与同一尺度上另一个类别的对象不同,而且彼此之间也存在某种关系。一个类别的成员通常比其他类别的成员拥有更多某种质量或特征。这种关系通常用符号“>”表示,表示“大于”。
所有类别之间的关系,包括“优于”、“大于”、“高于”、“高于”等,都用符号“>”表示。顺序数表示字符相对于其他特征的相对位置或大小。类别的等级由在被比较特征的数量方面有多少类别在其之前决定,而不是由有多少类别在其之后决定。顺序数的差异并不表示对象所拥有的特征百分比的精确差异。
顺序尺度的统计检验
确定顺序尺度上分数中心趋势的最佳方法是使用中位数。对于此类数据,四分位数偏差无疑是衡量离散度的最佳方法。许多非参数检验,例如游程检验、符号检验、中位数检验、Mann-Whitney U 检验等,可用于检验顺序尺度分数的假设。“顺序统计”和“秩统计”这两个术语经常用来描述这些检验。同一组人的两组观察结果的等级可用于计算相互关系。对于这些情况,Spearman 秩相关系数或 Kendall 秩相关系数是合适的。
区间尺度
在区间尺度上对质量进行排序时,尺度上的数值相等距离对应于被测量特征中的相似距离,而区间尺度允许比较质量之间的距离或差异,同时仍然包含顺序尺度的所有数据。
虽然存在最低端点(零点),但由实数表示的任何两个时间段的比率与测量单位无关。这导致 32 厘米和 40 厘米以及 100 厘米和 140 厘米这两个区间之间的比率为 1:5,没有单位。如果将一个常数(例如 10 厘米)添加到每个区间点,则两个区间之间的比率保持不变,从而得到新的区间分别为 42 厘米 - 50 厘米和 110 厘米 - 150 厘米。
在分析两种或多种质量之间的差异时,应谨慎进行区间测量。当两个尺度的原点(零)相同时,并且测量单位相同时,比较才有意义。区间尺度用于使用温度计测量温度、从选择的起始点起的时间以及相对于平均海平面的高度。
区间尺度也具有度量尺度(关于类别之间距离的传递关系),它具有名义尺度(等价关系)、顺序尺度(大于或传递关系)的所有特征。此尺度还可以指定任何两个区间的比率。使用测量相等距离区间的单位,区间尺度可以将事物或事件放置到连续体中。该尺度的零位置是随机选择的。
区间尺度的统计检验
即使与物体位置相关的数字可能会根据规则系统发生变化,但区间尺度仍然保留物体的顺序和它们之间的相对差异。如果信息允许线性变换,则一组观察结果将按区间大小进行缩放。
换句话说,如果方程 y = a + bx(其中 a 和 b 是两个正常数)满足一组实数,则称该组实数处于区间尺度。遵循区间尺度的数可以进行所有典型的参数检验,包括算术平均值、中位数、标准差、积差相关等。为了进行统计显著性检验,也可以对区间尺度数据使用 Z、t 和 F 等非参数检验。
比率尺度
比率尺度提供最准确的测量,因为它满足所有区间尺度要求以及另一个关键要求:它具有不变或绝对零点。由于这个不变的零点,数学运算进入了一个新的维度。与刻度点相关的数字也可以写成与测量单位无关的比率,就像两个类别之间区间的比率一样。
比率尺度最常用于物理科学。无论用磅还是公斤称重两个物体,比率都保持不变。两个物体的长度或两个人完成特定任务所需时间的长短也是如此。如果可以操作地获得 I 等价(ii)大于(iii)任何两个区间之间的已知比率和(iv)与尺度上任何两个位置相关的任何两个实数值之间的已知比率这四种关系。在这种情况下,测量被称为比率尺度。
比率尺度的统计检验
比率尺度中的值是具有真实零点(无上限)的实数,只有测量单位是任意的,因此两个数字和区间之间的比率保持尺度中包含的所有信息。即使这些真实数字乘以一个真实的正常数,情况也是如此。当使用比率尺度时,可以应用任何统计检验,无论是参数检验还是非参数检验。像几何平均数和变异系数这样的统计工具需要知道真实分数,可以应用于使用比率尺度的数。
判断测量工具的标准
测量还必须满足几个要求。以下是评估测量工具时要考虑的最重要因素列表。
单维性 – 对于一把尺子,一个尺度一次只能测量一个特征,例如长度而不是温度。
线性 – 一个尺度必须遵守直线概念才能被认为是线性的。有必要创建一个基于可移动单元的评分系统。无论在一把尺子的哪一端,一英寸都是一英寸。但是,对于高度尺度,无法保证这种互换性。在这种情况下,排名是首选。
效度 – 这里指的是一个尺度衡量其预期衡量内容的能力。
信度 – 一致性具有此特性。一个尺度应该产生可靠的结果。
准确性和精确性 – 一个工具应该对我们试图衡量的对象进行精确和准确的测量。
简单性 – 一个尺度应该尽可能简单;否则,它可能会变得不必要地复杂、昂贵甚至无用。
实用性 – 这涵盖了广泛的问题,包括可承受性、实用性和可解释性。通常,必须在“完美”的仪器和预算允许的仪器之间进行权衡。获得的收益必须等于产生的成本。
结论
测量尺度分为四个等级:名义、顺序、区间和比率。这些尺度构成一个等级体系,其中名义尺度的统计应用远少于更高等级的尺度。名义尺度提供类别数据;顺序尺度提供序列数据;区间尺度揭示尺度上各点之间的数量关系;比率尺度解释尺度上任意两点之间的顺序和绝对距离。