数据仓库质量的各种工具是什么?
数据仓库质量管理的各种工具如下:
质量定义
质量的定义和量化被给出,作为性能与期望值的比率。它用于将质量定义为产品交付给社会后所造成的损失。社会的全部损失可以被认为是生产者损失和用户损失的总和。
众所周知,产品或服务的质量与生产成本之间存在权衡关系,并且组织应该在这两个参数之间找到平衡。如果平衡被打破,那么组织无论如何都会失败。
数据质量研究
在数据质量领域已经完成了多项研究。研究人员和实践者都面临着提高决策支持系统质量的问题,通常是通过改善其信息质量来实现的。它可以展示该领域的相关工作,这些工作或多或少地影响了我们数据仓库质量的方法。
该框架包括七个从 ISO 9000 标准中采用的要素,例如行政责任、服务和保证成本、研究与开发、生产、分销、人事管理和法律服务。该框架回顾了数据质量文献的重要部分,但只有数据质量的研究与开发形式似乎与数据仓库质量设计的原因相一致。
该领域包含三个主要问题:数据产品的分析和设计数据质量方法、结合数据质量方法的设计数据制造系统 (DMS) 以及数据质量度量的定义。
数据质量系统围绕组织结构、责任、流程和实现数据质量管理的资源。数据质量控制是一组用于获得数据产品所需质量的操作方法和活动。数据质量保证包含所有必要的准备和有序服务,以支持充分的信心,即数据产品将满足给定的一组质量规范。
数据质量
存储在仓库中的数据的质量本身并不是一个过程。它受到仓库环境中发生的所有过程的影响。以下是一些数据质量因素:
**完整性**因素定义了源和仓库中引入的感兴趣的真实世界数据的百分比。
**可信度**因素定义了支持数据的源的可信度。
**准确性**因素定义了出现在源中的数据输入过程的准确性。
**一致性**因素定义了数据相对于逻辑规则和约束的逻辑连贯性。
**数据可解释性**因素与数据定义有关(即遗留系统和外部记录的数据设计、关系数据库的表定义、主键和外键、别名、默认值、域、编码值的描述等)。