4K+ 次浏览
服务器市场上有三种基本的并行处理硬件架构,例如对称多处理 (SMP)、大规模并行处理 (MPP) 和非一致性内存访问架构 (NUMA)。对称多处理 (SMP)SMP 架构是一个具有多个处理器的单个设备,所有处理器都由一个操作系统管理,并且都访问相同的磁盘和内存区域。具有 8 到 32 个处理器、并行数据库、大内存(2GB 或更多)、良好的磁盘和良好设计的 SMP 机器在处理中等规模的仓库时应该能够很好地运行。数据库需要能够并行运行其进程,并且数据仓库进程需要 ... 阅读更多
862 次浏览
硬件和操作系统平台有多种类别,如下所示:大型机 - 数据仓库可能是唯一不适用此类别的应用程序。特别是,大型机不是数据仓库的首选平台。有一些成功的大型机数据仓库,其中大多数已经运行大型机多年,迁移成本很高,或者它们正在利用剩余容量,因此边际成本相对较低。大型机对于数据仓库来说不一定是具有成本效益的。管理、硬件和编程成本通常高于开放系统平台,... 阅读更多
176 次浏览
服务器平台有以下要求:波动性 - 波动性计算数据库的动态特性。它包括数据库更新频率、每次数据更改或替换的量以及加载窗口长度等方面。每日数据比每周或每月数据更不稳定。客户流失率可以告诉您客户维度随时间的变化程度。对这些问题的解释对硬件平台的规模和速度有直接影响。数据仓库承担了 ... 阅读更多
426 次浏览
查询公式有以下几个特点:多遍 SQL - 它可用于评估比较或在报表断点行中正确计算非加性度量,查询工具应将报表划分为多个由 DBMS 独立处理的查询。查询工具会自动智能地组合各个查询的结果。多遍 SQL 还支持跨多个事实表(可能在不同的数据库中)到多个一致的数据集市进行钻取。例如,销售额和成本可能在多个数据库中,但考虑到它们共享相同的维度,例如组织和期间,它 ... 阅读更多
112 次浏览
标准报告提供创建生产风格的固定格式报表的能力,这些报表的用户交互有限,受众广泛,并且具有定期执行计划。应用程序模板本质上是一种非正式的标准报表。在频谱的正式端,当 ERP 系统无法处理运营交易和报告的工作负载时,大型标准报告系统往往会出现。全面标准报告是一项大工作,涉及其自身的一系列需求和服务。在这种情况下,应该有一个专门负责管理此工作的标准报告项目。标准报告工具有各种需求 ... 阅读更多
263 次浏览
查询管理服务是一组处理查询生成、在数据库上实现查询以及将结果集返回到桌面的功能。这些服务对客户与数据库的交互产生全面影响。查询管理有以下几种服务:内容简化 - 这些技术试图在制定某些特定查询之前保护用户免受数据和查询语言复杂性的影响。这包括将用户的视图限制为表和列的子集、预定义的连接规则(包括列,... 阅读更多
271 次浏览
作业控制有以下几种服务:作业定义 - 创建操作流程的第一步是能够将一系列步骤定义为作业,并指定作业之间的某些关系。这是编写数据仓库结构的地方。在某些情况下,如果给定表的加载量下降,则会影响您加载基于它的表的能力。例如,如果客户表未正确更新,则加载未进入客户表的新客户的销售事实 ... 阅读更多
181 次浏览
在数据转换中,数据被转换为或链接成适用于挖掘的形式。数据转换可能包含以下内容:平滑 - 它可以用于去除数据中的噪声。此类技术包括分箱、回归和聚类。聚合 - 在聚合中,将汇总或聚合操作应用于数据。泛化 - 在泛化中,通过需要概念层次结构,将低级或“原始”(原始)数据恢复为更高级别的概念。数据转换有以下几种服务:集成 - 集成包括生成代理键、将一个方案中的键映射到另一个方案,以及将程序映射到完整 ... 阅读更多
374 次浏览
数据分段有以下几个要求:生产力支持 - 任何决定实施的系统都需要支持基本开发环境功能,例如代码库管理签入/签出、版本控制以及生产和开发系统构造。最初,对于较小的项目,可以通过标准文档、流程描述和一组标准目录来实现这些功能。可用性 - 鉴于任务的底层复杂性,数据分段系统也必须尽可能易于使用。在过去几年中,这转化为图形用户界面。良好的界面可以 ... 阅读更多
368 次浏览
选择数据源有多种标准,如下所示:数据可访问性 - 如果存在两个可能的数据源,一个存储在由一组在项目团队中最年轻的成员出生之前编写的程序维护的二进制文件中,另一个来自读取二进制文档并支持更多处理的系统,那么决策就很明显了。数据准确性 - 当数据从一个系统传递到另一个系统时,会进行许多修改。有时会添加来自其他系统的数据元素,有时会处理现有元素以创建新元素和其他 ... 阅读更多