什么是质量驱动的数据仓库设计?
数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过支持可靠的整合历史记录平台来支持数据处理,以进行分析。
数据仓库可以被视为一组在远程基础关系上表示的物化视图。当查询正式时,它会在本地使用物化视图进行计算,而无需访问初始数据源。
数据仓库是一个随着时间推移不断发展的活动实体。随着时间的推移,需要回答新的查询。可以使用物化视图专门回答各种查询。通常,需要将新视图插入到数据仓库中。
在某些组织中,基本的联机事务处理 (OLTP) 基础设施到位后(并非最小的,通过包括 SAP/R3 在内的标准化企业资源规划工具),感兴趣的目标现在至少正在三个方向上扩展:
更广泛的内部和外部多媒体数据源。
更广泛的客户群体,具有不同的兴趣和能力特征以及情境参数。
将事务处理生成的庞大经验数据转换为适用于组织信息和行动的知识。
正在提出各种各样的数据流物流架构,包括供应链管理和企业对企业电子商务。在这些架构中,数据库可以被视为数据的短期和中期中间存储,而数据仓库则用于长期存储、知识创建和管理。
数据仓库系统包括数据库(源数据库、数据仓库中的物化视图)、将记录从一个数据库发送到另一个数据库的数据传输代理以及保存有关系统及其扩展的元数据的存储库。
在此架构中,首先通过称为包装器的提取机制创建适用于统一方法的异构数据源,然后中介承担数据集成和冲突解决的服务。包装器和中介之间的分离是一个经过深思熟虑的设计决策,反映了包括 CORBA 在内的中间件系统中服务包装器和请求代理之间的分离。
生成的标准化和集成记录作为物化视图保存在数据仓库中。这些基本视图通常略微聚合。可以为多个分析师用户定制它们,具有关于特定兴趣领域更聚合信息的数据市场被构建为二级缓存,然后由从查询工具到电子表格工具再到成熟的数据挖掘系统的各种数据分析工具渗透。
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP