265 次浏览
数据可视化定义了数据在综合图表、图像、列表、图表和多个视觉对象支持下的视觉表示。它允许用户在很短的时间内轻松了解数据并提取有用的数据、模式和趋势。此外,它使数据易于理解。换句话说,可以这样说,以图形形式表示数据,以便用户可以轻松理解数据趋势的过程称为数据可视化。数据可视化包含多种工具,包括图表地图、图形等。用于数据可视化的工具帮助用户... 阅读更多
5K+ 次浏览
数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意外的关系并以对数据所有者而言既合乎逻辑又有帮助的新颖方法总结记录。数据挖掘有各种概念,如下所示:分类 - 分类是发现表示和区分数据类或概念的模型的过程,目的是能够使用该模型... 阅读更多
360 次浏览
数据挖掘是通过使用包括统计和数学技术在内的模式识别技术,通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意外的关系并以对数据所有者而言既合乎逻辑又有帮助的新颖方法总结记录。数据挖掘有各种转换,如下所示:标记正常、异常、超出范围或不可能的事实 - 使用特殊标记标记测量的事实可能完全有益。某些测量事实可能是正确的,但高度... 阅读更多
238 次浏览
事实表包含一个复合主键,其中包含多个外键(每个维度表一个)以及使用这些维度度量的每一列。每个数据分段过程都必须包含一个步骤,用于将传入事实表记录中的生产 ID 替换为数据仓库代理键,用于事实表中的每个维度。也可能需要其他处理、计算和重组。在仓库中,引用完整性 (RI) 定义了对于事实表中的每个外键,在等效维度表中都存在一个条目。如果您在事实表中有一笔销售... 阅读更多
3K+ 次浏览
数据仓库是一种主要用于从各种来源收集和管理数据的技术,以便为企业提供有意义的业务洞察。数据仓库专门设计用于支持管理决策。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过为分析提供强大的整合历史数据平台来支持数据处理。数据仓库在多维空间中概括和集中数据。数据仓库的构建包含数据清理、数据集成和数据转换,并且可以... 阅读更多
2K+ 次浏览
最简单的加密形式是对称密钥加密。这种加密也称为私钥加密。使用对称密钥加密,单个密钥可以同时锁定信息和解锁信息。对称密钥加密主要在两种情况下很有趣:数据的私有加密 - 用户使用不向任何人透露的私钥加密数据。如果密钥很好,则其他人无法解密数据。数据的私有加密在数据仓库中可能有多种用途。任何特别敏感的数据都可以进行此类加密。... 阅读更多
目录服务器是一种相关网络上可访问资源的数据仓库。资源如数据库设备、单个数据库、文件存储库、事务系统、文件存储区域、打印机和人员。人员描述包括姓名和地址、组织角色、电子邮件地址等。目录服务器向合法的、经过身份验证的请求者显示选定的信息项。它旨在成为一个有用的、集中的、控制的资源,用于了解如何在相关网络上进行通信。许多供应商已同意使用 LDAP 标准与目录服务器进行通信,因此,隐式地用于实现目录服务器。术语... 阅读更多
132 次浏览
桌面机器的大小基于用户的特征和相关的工具需求。一个休闲用户,其数据需求通过 Web 浏览器中的 HTML 文档得到满足,只需要运行 Internet 浏览器所需的那么多的功能。另一方面,从头开发复杂查询和分析的强力用户可能需要一台更强大的机器。有一些与桌面相关的挑战,如下所示:跨平台支持 - 一些组织在营销组织中保留了 Macintosh,而一些组织需要在工程和制造领域保留 UNIX 存储。... 阅读更多
4K+ 次浏览
服务器市场上有三种基本的并行处理硬件架构,例如对称多处理 (SMP)、大规模并行处理 (MPP) 和非一致性内存访问 (NUMA)。对称多处理 (SMP)SMP 架构是一个具有多个处理器的单个设备,所有处理器都由一个操作系统管理,并且都访问相同的磁盘和内存区域。一台具有 8 到 32 个处理器、并行数据库、大内存(2GB 或更多)、良好的磁盘和良好设计的 SMP 机器在中型仓库中应该表现良好。数据库需要能够并行运行其进程,并且数据仓库进程需要... 阅读更多
862 次浏览
硬件和操作系统平台有多个类别,如下所示:大型机 - 数据仓库可能是唯一不适用的应用程序。特别是,大型机不是数据仓库的首选平台。有一些成功的大型机基于数据仓库,其中大多数已在大型机上运行多年,迁移成本很高,或者它们正在利用剩余容量,因此边际成本相对较低。大型机对于数据仓库来说不一定具有成本效益。管理、硬件和编程成本通常高于开放系统平台,... 阅读更多