组织如何使用数据仓库中的信息?
数据仓库是一种可以收集和管理来自多个来源的数据的方法,为企业提供重要的商业洞察力。数据仓库专门设计用于提供管理决策。
简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过提供整合的、历史性的数据分析平台来支持数据处理。
数据仓库是一个语义一致的数据存储,作为决策支持数据模型的物理实现。它保存企业制定战略决策所需的数据。数据仓库被视为一种架构,通过整合来自多个异构来源的记录来构建,以提供结构化和临时查询、分析文档和决策制定。
数据仓库的构建需要数据清洗、数据集成和数据整合。数据仓库的使用需要一组决策支持技术。这使得“知识工作者”,如管理人员、分析师和高管,能够快速方便地获取数据的概览,并根据仓库中的数据做出合理的决策。
一些组织使用这些数据来提供商业决策活动,包括:
它可以提高用户关注度,这涉及对用户购买模式的分析,包括购买偏好、购买时间、预算周期和支出需求。
它可以用于重新定位产品和处理产品组合,方法是比较按季度、按年度和按地理区域的销售情况,以微调生产方法。
它可以分析运营并寻找利润来源。
它可以管理客户关系,进行环境修正,并管理公司资产的成本。
从异构数据库集成的角度来看,数据仓库是有益的。组织通常收集多种类型的数据,并支持来自多个、异构、自治和分布式数据源的大型数据库。
组合这些数据并支持对其轻松有效的访问是极其理想的,但也极具挑战性。数据库市场和研究界为此付出了巨大的努力。
异构数据库集成的传统数据库方法是在多个异构数据库之上构建包装器和集成器(或中介)。当向用户站点提出查询时,可以使用元数据字典将查询解释为适合所包含的单个异构站点的查询。
这些查询被映射并共享到本地查询处理器。从多个站点恢复的结果被统一成一个全局答案集。这种查询驱动的方法需要复杂的数据过滤和集成过程,并且与本地站点竞争处理资源。对于频繁的查询,特别是需要聚合的查询,它效率低下且可能成本高昂。