数据仓库 - 面试问题



亲爱的读者,这些数据仓库面试问题专为让您熟悉在数据仓库主题的面试中可能遇到的问题类型而设计。

问:定义数据仓库?

:数据仓库是面向主题的、集成的、随时间变化的、非易失性的数据集合,用于支持管理层的决策过程。

问:面向主题的数据仓库意味着什么?

:面向主题表示数据仓库围绕特定主题(如产品、客户、销售等)存储信息。

问:列出数据仓库的五个应用。

:一些应用包括金融服务、银行服务、消费品、零售行业、控制制造。

问:OLAP 和 OLTP 分别代表什么?

:OLAP 是联机分析处理的首字母缩写,OLTP 是联机事务处理的首字母缩写。

问:数据仓库和操作数据库之间最基本的区别是什么?

:数据仓库包含历史信息,可用于业务分析,而操作数据库包含运行业务所需的当前信息。

问:列出数据仓库系统可以实现的模式。

:数据仓库可以实现星型模式、雪花模式和事实星座模式。

问:什么是数据仓库?

:数据仓库是构建和使用数据仓库的过程。

问:列出数据仓库中涉及的流程。

:数据仓库涉及数据清洗、数据集成和数据整合。

问:列出数据仓库工具和实用程序的功能。

:数据仓库工具和实用程序执行的功能包括数据提取、数据清洗、数据转换、数据加载和刷新。

问:数据提取是什么意思?

:数据提取意味着从多个异构数据源收集数据。

问:定义元数据?

:元数据简单地定义为关于数据的数据。换句话说,我们可以说元数据是引导我们获取详细数据的汇总数据。

问:元数据存储库包含什么?

:元数据存储库包含数据仓库的定义、业务元数据、操作元数据、从操作环境到数据仓库的映射数据以及汇总算法。

问:数据立方体如何帮助我们?

:数据立方体帮助我们以多维方式表示数据。数据立方体由维度和事实定义。

问:定义维度?

:维度是企业保留记录的相关实体。

问:解释数据市场。

:数据市场包含组织范围数据的子集。此数据子集对组织的特定群体很有价值。换句话说,我们可以说数据市场包含特定群体的数据。

问:什么是虚拟仓库?

:操作数据仓库上的视图称为虚拟仓库。

问:列出数据仓库交付流程中涉及的阶段。

:这些阶段包括 IT 策略、教育、业务案例分析、技术蓝图、构建版本、历史加载、Ad hoc 查询、需求演变、自动化和扩展范围。

问:定义加载管理器。

:加载管理器执行提取和加载过程所需的运算。加载管理器的规模和复杂性因数据仓库到数据仓库的特定解决方案而异。

问:定义加载管理器的功能。

:加载管理器从源系统提取数据。将提取的数据快速加载到临时数据存储中。执行简单的转换以使其结构类似于数据仓库中的结构。

问:定义仓库管理器。

:仓库管理器负责仓库管理流程。仓库管理器由第三方系统软件、C 程序和 shell 脚本组成。仓库管理器的规模和复杂性因特定解决方案而异。

问:定义仓库管理器的功能。

:仓库管理器执行一致性和参照完整性检查,创建索引、业务视图、针对基本数据的分区视图,将源数据从临时存储转换为发布的数据仓库,备份数据仓库中的数据,以及存档已达到其捕获生命周期末尾的数据。

问:什么是汇总信息?

:汇总信息是数据仓库中保存预定义聚合的区域。

问:查询管理器负责什么?

:查询管理器负责将查询定向到合适的表。

问:列出 OLAP 服务器的类型。

:OLAP 服务器有四种类型,即关系型 OLAP、多维 OLAP、混合 OLAP 和专用 SQL 服务器。

问:多维 OLAP 和关系型 OLAP 哪个更快?

:多维 OLAP 比关系型 OLAP 快。

问:列出 OLAP 执行的功能。

:OLAP 执行诸如上卷、下钻、切片、切块和旋转等功能。

问:切片操作中选择多少个维度?

:切片操作仅选择一个维度。

问:切块操作中选择多少个维度?

:对于切块操作,为给定立方体选择两个或多个维度。

问:星型模式中有多少个事实表?

:星型模式中只有一个事实表。

问:什么是规范化?

:规范化将数据拆分为其他表。

问:在星型模式和雪花模式中,哪个的维度表是规范化的?

:雪花模式使用规范化的概念。

问:规范化的优点是什么?

:规范化有助于减少数据冗余。

问:哪种语言用于定义模式定义?

:数据挖掘查询语言 (DMQL) 用于模式定义。

问:DMQL 基于哪种语言?

:DMQL 基于结构化查询语言 (SQL)。

问:分区的原因是什么?

:分区出于各种原因进行,例如易于管理、协助备份恢复和提高性能。

问:数据市场涉及哪些类型的成本?

:数据市场涉及硬件和软件成本、网络访问成本和时间成本。

广告