数据处理
软件度量是包含许多活动的衡量标准,这些活动涉及一定程度的测量。软件度量的成功在于收集和分析的数据质量。
什么是好的数据?
如果收集到的数据能够解答以下问题,则可以将其视为好的数据:
它们是否正确? - 如果数据是根据度量定义的精确规则收集的,则可以认为它是正确的。
它们是否准确? - 准确性是指数据与实际值之间的差异。
它们是否具有适当的精确度? - 精确度涉及表达数据所需的十进制位数。
它们是否一致? - 如果数据在不同的测量设备之间没有显示出重大差异,则可以认为它是一致的。
它们是否与特定的活动或时间段相关联? - 如果数据与特定的活动或时间段相关联,则应在数据中明确说明。
它们是否可以复制? - 通常,诸如调查、案例研究和实验之类的调查会在不同的情况下重复进行。因此,数据也应该易于复制。
如何定义数据?
为测量目的而收集的数据有两种类型:
原始数据 - 原始数据来自对过程、产品或资源的初始测量。例如:组织中员工的每周时间表。
精炼数据 - 精炼数据来自从原始数据中提取基本数据元素以推导出属性值的结果。
可以根据以下几点定义数据:
- 位置
- 时间
- 症状
- 最终结果
- 机制
- 原因
- 严重程度
- 成本
如何收集数据?
数据收集需要人工观察和报告。管理人员、系统分析师、程序员、测试人员和用户必须在表单上记录原始数据。为了收集准确完整的数据,重要的是:
保持程序简单
避免不必要的记录
培训员工了解记录数据的必要性以及使用的程序
及时以有用的形式向原始提供者提供数据捕获和分析的结果,以帮助他们开展工作
在中央收集点验证所有收集到的数据
数据收集规划涉及几个步骤:
根据 GQM 分析确定要测量的产品
确保产品处于配置控制之下
准确确定要测量的属性以及如何导出间接度量
一旦度量集明确且要测量的组件集已确定,请设计一种方案来识别测量过程中涉及的每个活动
建立处理表单、分析数据和报告结果的程序
数据收集计划必须在项目计划开始时开始。实际的数据收集发生在开发的许多阶段。
例如 - 一些与项目人员相关的数据可以在项目开始时收集,而其他数据收集(如工作量)则从项目开始时开始,并持续到运行和维护。
如何存储和提取数据
在软件工程中,数据应存储在数据库中,并使用数据库管理系统 (DBMS) 进行设置。数据库结构示例如下所示。此数据库将存储在组织的不同部门工作的不同员工的详细信息。
在上图中,每个框都是数据库中的一个表,箭头表示从一个表到另一个表的多种到一映射。映射定义了保留数据逻辑一致性的约束。
一旦数据库设计完成并填充了数据,我们就可以使用数据操纵语言提取数据进行分析。