2K+ 次浏览
维度建模是一种逻辑设计方法,用于将数据呈现为标准结构,使其易于理解并实现高性能访问。它本质上是维度化的,并遵循对关系模型施加若干限制的规范。每个维度模型都由一个具有多部分主键的表(称为事实表)和一组较小的表(称为维度表)组成。每个维度表都有一个单独的元素主键,该主键与事实表中多部分主键的一个元素相关联。这种独特的星形结构称为星型连接…… 阅读更多
315 次浏览
业务维度生命周期有几种方法,如下所示:项目规划 - 项目规划解决了数据仓库项目的描述和范围界定,例如准备情况评估和业务理由。由于数据仓库项目的高知名度和高成本,这些都是重要的任务。项目规划针对资源和技能水平的员工需求,以及项目任务分配、持续时间和顺序。由此产生的集成项目计划识别与业务维度生命周期相关的所有任务以及参与的各方。它可以作为持续管理数据仓库项目的基础。项目规划…… 阅读更多
227 次浏览
数据分段是一个主要流程,包括以下子流程:提取 - 提取步骤是将信息放入数据仓库环境的第一阶段。提取定义了读取和了解源数据,以及将所需元素复制到数据分段区域以进行进一步处理。转换 - 由于数据被提取到数据分段区域,因此存在多个可能的转换过程,如下所示:它可以通过纠正拼写错误、解决域冲突(包括与邮政编码不一致的城市名称)、处理…… 阅读更多
685 次浏览
数据仓库系统有各种组成部分,如下所示:源系统 - 一个运营数据系统,其服务是捕获业务事务。在大型机环境中,源系统被称为“遗留系统”。源系统的特点是正常运行时间和可用性。与源系统相反的查询是明确的、“基于帐户”的查询,这些查询是正常事务流的组成部分,并且对其对遗留系统提出的要求有严格的限制。数据分段区域 - 一个存储区域和一组处理过程,这些过程简单地、转换、组合、重复数据删除、归档和生成…… 阅读更多
592 次浏览
数据挖掘的趋势如下:应用探索 - 早期的数据挖掘应用通常针对帮助企业获得竞争优势。随着电子商务和电子营销成为零售市场的主流组成部分,企业对数据挖掘的探索仍在不断扩大。数据挖掘越来越多地用于探索多个领域的应用,包括财务分析、电信、生物医学和科学。新兴的软件领域包括用于反恐(包括入侵检测及其他)和移动(无线)数据挖掘的数据挖掘。由于通用数据挖掘系统在处理特定于应用程序的问题时可能存在局限性,因此它可以查看…… 阅读更多
4K+ 次浏览
数据挖掘有以下几个特点:数据类型 - 行业中可用的大多数数据挖掘系统都处理具有统计、分类和符号属性的格式化、基于记录的关系型数据。数据可以是 ASCII 文本、关系数据库数据或数据仓库数据形式。测试每个系统可以处理的确切格式至关重要。某些类型的数据或应用程序可能需要专门的算法来搜索模式,因此它们的需要无法由现成的通用数据挖掘系统来管理。与其相反,专门的数据挖掘系统可以…… 阅读更多
125 次浏览
以下是数据挖掘技术可用于或为其创建入侵检测的领域:开发用于入侵检测的数据挖掘算法 - 数据挖掘算法可用于滥用检测和异常检测。在滥用检测中,训练信息被标记为“正常”或“入侵”。然后可以更改分类器以检测已知的入侵。这方面的多项研究包括分类算法、关联规则挖掘和成本敏感建模的应用。异常检测构建正常行为模型并自动检测与其显著偏差,以及监督…… 阅读更多
110 次浏览
我们计算机系统和信息的安全始终面临风险。网络的广泛发展以及入侵和攻击网络的工具和技巧的可访问性不断增加,这使得入侵检测成为网络管理的重要组成部分。入侵可以表示为任何威胁网络资源(包括用户帐户、文件系统、系统内核等)的完整性、机密性或可用性的一组事件。一些商业入侵检测系统受到限制,不支持完整的解决方案。此类系统通常采用滥用检测方法。滥用检测搜索程序或用户…… 阅读更多
1K+ 次浏览
用于生物数据分析的数据挖掘具有以下几个方面:异构分布式基因组和蛋白质组数据库的语义集成 - 基因组和蛋白质组数据集是在多个实验室和通过各种方法生成的。它们是分布式的、异构的,并且种类繁多。这种数据的语义集成对于生物记录的跨站点分析非常重要。此外,在研究文献及其相关的生物实体之间找到正确的联系也很重要。这种集成和关联分析可以支持基因组和生物记录的系统和协调分析。这促进了…… 阅读更多
电信行业已从提供本地和长途电话服务快速发展到提供其他多种综合通信服务,例如传真、寻呼机、蜂窝电话、网络信使、图像、电子邮件、计算机和Web数据传输以及大量数据流量。电信、计算机网络、互联网以及其他多种通信和计算手段的集成也在进行中。此外,随着多个国家电信市场的 deregulation 和新型计算机与通信技术的开发,电信行业正在快速扩张,竞争异常激烈。这使得对数据挖掘的需求巨大,以便支持对业务的理解……阅读更多