找到 413 篇文章 关于数据挖掘

如何减少预测变量的数量?

Ginni
更新于 2022年2月10日 11:22:49

252 次查看

数据挖掘中一个常见的问题是利用回归方程预测因变量的值,而模型中可以选择多个变量作为预测变量。另一个考虑因素是包含大量变量,以期发现以前隐藏的关系。例如,一家公司发现购买椅子和桌子腿防磨保护套的客户信用风险较低。在将所有可能的变量放入模型之前,有几个理由需要谨慎。设置完整的预测变量可能价格昂贵或不可行…… 阅读更多

什么是热力图?

Ginni
更新于 2022年2月10日 11:19:52

445 次查看

热力图是数值数据的图形显示,其中颜色用于表示值。在数据挖掘的背景下,热力图特别适用于两种用途——可视化相关表和可视化数据中的缺失值。在这两种情况下,信息都以二维表的形式传达。热力图是对数据的图形描述,需要一个颜色编码系统来定义多个值。热力图用于各种分析形式,但最常用于显示用户在特定网页或网页模板上的行为。热力图可以用来显示…… 阅读更多

数据可视化的用途是什么?

Ginni
更新于 2022年2月10日 11:16:41

265 次查看

数据可视化定义了使用综合图表、图像、列表、图表和多个视觉对象对数据进行视觉表示。它允许用户在很短的时间内简单地了解数据并提取有用的数据、模式和趋势。此外,它使数据易于理解。换句话说,可以将数据以图形形式表示,以便用户可以简单地理解数据趋势的过程,这被称为数据可视化。数据可视化包含多种工具,包括图表地图、图形等。用于数据可视化的工具支持用户…… 阅读更多

数据挖掘的基本概念是什么?

Ginni
更新于 2022年2月10日 11:12:42

5K+ 次查看

数据挖掘是通过使用模式识别技术(包括统计和数学技术)来处理存储在存储库中的大量数据,从而发现有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既逻辑又有效的新方法来总结记录。数据挖掘有各种概念,如下所示:分类——分类是发现表示和区分数据类或概念的模型的过程,目的是能够使用该模型…… 阅读更多

数据挖掘转换是什么?

Ginni
更新于 2022年2月10日 11:11:33

360 次查看

数据挖掘是通过使用模式识别技术(包括统计和数学技术)来处理存储在存储库中的大量数据,从而发现有用的新相关性、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者既逻辑又有效的新方法来总结记录。数据挖掘有各种转换,如下所示:标记正常、异常、超出范围或不可能的事实——用特殊标记标记测量的事实可能非常有益。一些测量的事实可能是正确的,但高度…… 阅读更多

事实表的处理过程是什么?

Ginni
更新于 2022年2月10日 11:09:30

238 次查看

事实表包含一个复合主键,其中包括多个外键(每个维度表一个)和一个用于使用这些维度的每个度量的列。每个数据分段过程都必须包含一个步骤,用于将传入事实表记录中的生产 ID 替换为数据仓库代理键,对于事实表中的每个维度。还可能需要其他处理、计算和重组。在仓库中,引用完整性 (RI) 定义了事实表中每个外键,在等效维度表中继续存在一个条目。如果您在事实表中有一个关于……的销售记录…… 阅读更多

数据仓库环境的元素是什么?

Ginni
更新于 2022年2月10日 11:06:38

3K+ 次查看

数据仓库是一种主要用于从各种来源收集和管理数据以使企业获得有意义的业务洞察的技术。数据仓库专门设计用于支持管理决策。简单来说,数据仓库定义了一个独立于组织运营数据库维护的数据库。数据仓库系统能够集成多个应用程序系统。它们通过为分析提供强大的合并历史数据平台来支持数据处理。数据仓库在多维空间中概括和集中数据。数据仓库的构建包含数据清理、数据集成和数据转换,并且可以…… 阅读更多

什么是对称密钥加密?

Ginni
更新于 2022年2月10日 10:59:32

2K+ 次查看

最简单的加密形式是对称密钥加密。这种加密也称为私钥加密。使用对称密钥加密,单个密钥既可以锁定信息,也可以解锁信息。对称密钥加密主要在两种情况下很有趣:数据的私有加密——用户使用不向任何人透露的私钥加密数据。如果密钥是一个好密钥,那么其他人就无法解密数据。数据的私有加密在数据仓库中可能有几种用途。任何特别敏感的数据都可以被这样加密…… 阅读更多

什么是目录服务器?

Ginni
更新于 2022年2月10日 10:54:50

3K+ 次查看

目录服务器是一种相关网络上可访问资源的数据仓库。资源例如数据库设备、单个数据库、文件存储库、事务系统、文件存储区、打印机和人员。人员描述包括姓名和地址、组织角色、电子邮件地址等等。目录服务器向合法的、经过身份验证的请求者显示选定的信息项。它旨在成为一个有用的、集中的、控制性的资源,用于了解如何在关联网络上进行通信。许多供应商已就与目录服务器通信的 LDAP 标准达成一致,因此,隐式地实现了目录服务器。术语…… 阅读更多

桌面考虑的挑战是什么?

Ginni
更新于 2022年2月9日 13:33:53

132 次查看

台式机的尺寸基于用户的特性和相关的工具需求。一个休闲用户,其所需的数据通过 Web 浏览器通过 HTML 文档满足,只需要运行互联网浏览器所需的那么多的功能。另一方面,一个从头开始开发复杂查询和分析的强力用户可能需要一台更强大的机器。有一些与桌面相关的挑战,如下所示:跨平台支持——一些组织在营销组织中保留了 Macintosh,一些组织需要工程和制造中的 UNIX 商店…… 阅读更多

广告