商业智能 - 架构
商业智能 (BI) 架构本质上是BI解决方案中所有组件的合理安排,旨在满足企业或组织的独特需求。当我们谈论BI中的架构图时,它就像一张地图,直观地显示BI解决方案的所有部分以及它们如何协同工作。这些图可以很简单,只提供一个大致的概念,也可以非常详细,显示具体的工具和组件。有时它们会根据需要理解的人混合这两种方法。
由于每个组织都有自己的一套BI需求,因此他们部署的BI架构也会有所不同。一些企业可能会从基本的设置开始,并在需求扩展时逐步构建。
这些组件的选择基于特定的需求、预算和可用工具。例如,如果一个组织不需要历史数据,并且其数据源能够处理分析查询,则可能不需要额外的数仓之类的存储库。
BI架构没有放之四海而皆准的方法。对一个组织有效的方案,对另一个组织可能无效。
在查看BI架构示例时,重要的是要记住这些图只是示例。它们不一定是最佳实践或全面的解决方案。相反,它们展示了BI架构如何根据业务需求从简单到复杂的范围。
架构类别
这些架构通常分为两类:
- 就地数据BI架构 - 在数据驻留位置分析数据。
- 基于数据仓库的BI架构 - 将数据移动到中心仓库进行分析。
架构1
在此架构中,只有一个数据源,数据源以静态报告的形式向下一步(即报表和分析平台)提供数据。
报表和分析平台 (RAP) 提供更强大的解决方案。它支持各种类型的输出,包括静态报表、精确的像素级报表、数据分析和动态可视化。
RAP还提供多种交付这些报表的方式,例如通过电子邮件、FTP/SFTP或门户网站。它还包括基于角色的访问控制功能,以确保合适的人员查看合适的数据,并为开发人员和最终用户提供不同的工具。
示例
销售团队可能会收到包含销售额的每月PDF报告,而数据分析师可以使用RAP创建和探索基于实时数据的自定义可视化。
架构2
在早期的架构中,我们专注于只使用一个数据源。在架构2中,虽然有多个数据源,但这些数据源的数据并没有合并在一起。不同的用户可以使用相同的前端工具访问这些独立的数据源,但如果他们需要组合来自不同数据源的数据,则必须自行完成。
示例
营销团队可能会从一个数据源提取客户数据,从另一个数据源提取销售数据,使用相同的仪表板,但他们需要手动组合这些信息才能获得完整的视图。
架构3
上面给出的BI架构由多个组件协同工作,将原始数据转化为有用的信息。保存运营和事务数据的核心系统被称为数据源。借助数据集成工具,特别是ETL,可以清理和准备这些数据以进行分析。准备所有数据后,数据将保存在运营数据存储、数据湖和数据仓库中。
之后,BI工具评估并呈现数据,以帮助用户识别模式并做出决策。信息分发工具简化了与这些数据的工作,使您可以访问实时信息和深入的视图。
在上面给出的架构中:
1. 数据源
在给定的架构中,数据源是保存运营和事务数据的系统。
示例
源系统就像公司存储其重要数据的各种地方。可以将它们想象成大型图书馆中的不同书架。
这里提到的“书架”是指保存来自不同领域数据的书架,例如销售记录、客户详细信息、财务交易,甚至来自外部来源的数据,例如市场趋势或客户调查。所有这些数据对于公司做出明智的决策都非常重要。
在选择数据源时,务必考虑数据的相关性、最新程度和准确性以及其详细程度。您可能还需要混合使用结构化、半结构化和非结构化等不同类型的数据,以满足高管和其他用户的需求。
2. 数据集成工具
数据集成工具用于数据分析。这里使用的数据集成技术是ETL。
商业智能架构包括数据清洗和数据分析,两者都用于识别数据质量问题并进行修复。
此外,BI架构还包括数据清洗和数据分析,这些对于识别和解决数据质量问题至关重要。例如,数据清洗可能包括删除重复项或更正数据中的错误,而数据分析有助于了解数据的结构和内容。这些过程共同确保分析中使用的数据准确可靠,从而做出更好的业务决策。
3. 数据存储系统
存储系统是存储和管理BI数据的系统。主要的存储是数据仓库,它以不同的格式(如关系数据库或多维数据库)保存结构化数据。这使得搜索和分析数据变得容易。为了更具体的需要,部门或业务部门可以使用连接到主数据仓库的较小的数据市场。
现在,在数据进入数据仓库之前,它通常会经过运营数据存储 (ODS)。可以将ODS视为数据的临时停留点,在这里也可以快速分析数据,特别是最近的交易。
最后,我们可以说存在数据湖,通常运行在Hadoop之类的平台上。数据湖是存储所有类型原始数据的地方。这些原始数据可以直接在数据湖中进行分析,也可以过滤后加载到数据仓库中进行更深入的分析。
4. BI工具
BI工具帮助企业通过多种方式理解其数据。它们允许您运行自定义查询、通过数据挖掘深入研究数据并执行详细分析。关键功能之一是OLAP(联机分析处理),它允许用户从各个角度快速浏览数据。
借助自助式BI工具,分析师和管理人员现在可以运行自己的查询并创建报表,而无需BI团队的帮助。这些工具还具有数据可视化功能,例如图表和图形,这使得轻松发现数据中的趋势和模式变得容易。
5. 消费者
BI中的信息交付工具使用户可以轻松查看和交互式地查看分析结果。它们通常包括可视化和自助服务选项,以便进行更深入的分析。例如,BI仪表板和在线门户提供实时数据和可自定义的视图,允许用户浏览详细信息,而传统报表则以固定格式呈现数据。
除了这些工具之外,BI系统通常还具有数据准备软件,用于组织数据以进行分析。它们还提供诸如元数据存储库、业务词汇表和数据目录之类的工具,以帮助用户查找相关数据并了解其上下文和来源。