- 数据仓库教程
- DWH - 首页
- DWH - 概述
- DWH - 概念
- DWH - 术语
- DWH - 交付流程
- DWH - 系统流程
- DWH - 架构
- DWH - OLAP
- DWH - 关系型 OLAP
- DWH - 多维 OLAP
- DWH - 模式
- DWH - 分区策略
- DWH - 元数据概念
- DWH - 数据市场化
- DWH - 系统管理员
- DWH - 流程管理员
- DWH - 安全性
- DWH - 备份
- DWH - 调优
- DWH - 测试
- DWH - 未来展望
- DWH - 面试问题
- DWH 有用资源
- DWH - 快速指南
- DWH - 有用资源
- DWH - 讨论
数据仓库 - 概念
什么是数据仓库?
数据仓库是构建和使用数据仓库的过程。数据仓库通过整合来自多个异构数据源的数据来构建,这些数据源支持分析报告、结构化和/或临时查询以及决策制定。数据仓库涉及数据清洗、数据集成和数据整合。
使用数据仓库信息
有一些决策支持技术可以帮助利用数据仓库中可用的数据。这些技术帮助高管快速有效地使用仓库。他们可以收集数据、分析数据,并根据仓库中的信息做出决策。仓库中收集的信息可用于以下任何领域:
调整生产策略 - 通过比较季度或年度销售额,可以重新定位产品并管理产品组合来很好地调整产品策略。
客户分析 - 通过分析客户的购买偏好、购买时间、预算周期等来进行客户分析。
运营分析 - 数据仓库还有助于客户关系管理和进行环境修正。这些信息还允许我们分析业务运营。
集成异构数据库
为了集成异构数据库,我们有两种方法:
- 查询驱动方法
- 更新驱动方法
查询驱动方法
这是集成异构数据库的传统方法。这种方法用于在多个异构数据库之上构建包装器和集成器。这些集成器也称为中介。
查询驱动方法的过程
当向客户端发出查询时,元数据字典会将查询转换为参与的各个异构站点适用的形式。
现在这些查询被映射并发送到本地查询处理器。
来自异构站点的结果被集成到全局答案集中。
缺点
查询驱动方法需要复杂的集成和过滤过程。
这种方法非常低效。
对于频繁的查询,它非常昂贵。
对于需要聚合的查询,这种方法也非常昂贵。
更新驱动方法
这是对传统方法的替代方法。当今的数据仓库系统遵循更新驱动方法,而不是前面讨论的传统方法。在更新驱动方法中,来自多个异构源的信息会预先集成并存储在仓库中。此信息可用于直接查询和分析。
优点
这种方法具有以下优点:
这种方法提供高性能。
数据预先在语义数据存储中被复制、处理、集成、注释、汇总和重构。
查询处理不需要接口来处理本地源的数据。
数据仓库工具和实用程序的功能
以下是数据仓库工具和实用程序的功能:
数据提取 - 涉及从多个异构源收集数据。
数据清洗 - 涉及查找和纠正数据中的错误。
数据转换 - 涉及将数据从旧格式转换为仓库格式。
数据加载 - 涉及排序、汇总、整合、检查完整性以及构建索引和分区。
刷新 - 涉及从数据源更新到仓库。
注意 - 数据清洗和数据转换是提高数据质量和数据挖掘结果的重要步骤。