862 次查看
硬件和操作系统平台有多种类别,如下所示:大型机 - 数据仓库可能是不适用的一个应用。特别是,大型机不是数据仓库的首选平台。有一些成功的大型机数据仓库,其中大多数已经在大型机上运行多年,迁移成本很高,或者它们正在利用剩余容量,因此边际成本相对较低。大型机对于数据仓库来说不一定具有成本效益。管理、硬件和编程成本通常高于开放系统平台,... 阅读更多
176 次查看
服务器平台有以下要求:易变性 - 易变性计算数据库的动态特性。它包括数据库更新频率、每次更改或替换的数据量以及加载窗口持续时间等方面。每日数据比每周或每月数据更易变。客户流失率可以告诉您客户维度随时间推移会发生多少变化。对这些问题的解释对硬件平台的大小和速度有直接影响。数据仓库承担了... 阅读更多
426 次查看
查询公式有以下几个特点:多遍 SQL - 它可以用于评估比较或在报表断点行中正确计算非加法度量,查询工具应将报表划分为多个由 DBMS 独立处理的查询。查询工具会自动智能地组合各个查询的结果。多遍 SQL 还支持跨多个事实表(可能在不同的数据库中)的多个一致数据市场进行钻取。例如,销售额和成本可能在多个数据库中,但考虑到它们共享相同的维度,例如组织和期间,... 阅读更多
112 次查看
标准报表提供创建具有有限用户交互、广泛受众和定期执行计划的生产风格固定格式报表的能力。应用程序模板本质上是一种非正式的标准报表。在正式的范围内,当 ERP 系统无法处理运营事务和报表的负载时,大型标准报表系统往往会浮出水面。全面标准报表是一项大工作,涉及其自身的一系列要求和服务。在这种情况下,应该有一个专门负责管理此工作的标准报表项目。标准报表工具有各种要求... 阅读更多
263 次查看
查询管理服务是一组处理查询生成、在数据库上实现查询以及将结果集返回到桌面的可能性。这些服务对客户与数据库的交互有很大影响。查询管理有以下几种服务:内容简化 - 这些技术试图在制定某些特定查询之前,保护用户免受数据和查询语言复杂性的影响。这包括将用户的视图限制为表和列的子集、预定义的连接规则(包括列,... 阅读更多
271 次查看
作业控制有以下几种服务:作业定义 - 创建操作流程的第一步是找到某种方法将一系列步骤定义为作业,并指定作业之间的某些关系。这是数据仓库结构被写入的地方。在某些情况下,如果给定表的加载减少,它将影响您加载基于它的表的能力。例如,如果客户表没有正确更新,则无法加载尚未进入客户表的... 阅读更多
181 次查看
在数据转换中,数据被转换为或链接到适用于挖掘的形式。数据转换可以包含以下内容:平滑 - 它可以用于消除数据中的噪声。此类技术包括分箱、回归和聚类。聚合 - 在聚合中,对数据应用汇总或聚合操作。泛化 - 在泛化中,通过需要概念层次结构,将低级或“原始”(原始)数据还原为更高级别的概念。数据转换有以下几种服务:集成 - 集成包括生成代理键、将一个方案中的键映射到另一个方案,以及将程序映射到完整的... 阅读更多
374 次查看
数据分段有以下几个要求:生产力支持 - 任何决定实施的系统都需要支持基本开发环境功能,例如代码库管理签入/签出、版本控制以及生产和开发系统结构。最初,对于较小的项目,可以通过标准文档、流程描述和一组标准目录来实现这些功能。可用性 - 鉴于任务的底层复杂性,数据分段系统也必须尽可能易用。在过去几年中,这已转化为图形用户界面。一个好的界面可以... 阅读更多
368 次查看
选择数据源有以下几个标准:数据可访问性 - 如果两个可能的数据源存在,一个存储在由一组在项目团队中最年轻的成员出生之前编写的程序维护的二进制文件中,另一个来自读取二进制文档并支持更多处理的系统,那么决策就很明显了。数据准确性 - 当数据从一个系统传递到另一个系统时,会进行许多修改。有时会添加来自其他系统的数据元素,有时会处理现有元素以创建新元素和其他... 阅读更多
335 次查看
促进项目开展的工具有很多,如下所示:- 数据仓库总线架构矩阵 - 设计团队在内部会议中生成的矩阵可以进行整理,用作与多位设计师、权威人士和最终用户开会的演示支持。该矩阵作为设计的高级介绍非常有用。它让每个受众都能了解数据仓库最终的功能发展方向。事实表图 - 在准备完总线架构矩阵后,可以准备每个已完成的事实表的逻辑图。事实表并非... 阅读更多