找到 6705 篇文章 关于数据库

什么是 CBR?

Ginni
更新于 2022 年 2 月 16 日 11:50:51

401 次浏览

CBR 代表基于案例推理。CBR 分类器需要一个问题解决方案数据库来澄清新问题。与最近邻分类器(将训练元组保存为欧几里得空间中的点)不同,CBR 将元组或“案例”保存为解决问题的复杂符号表示。CBR 的各种商业应用包括客户服务帮助台的问题解决,其中案例描述与产品相关的诊断问题。CBR 已被用于工程和法律等领域,其中案例分别为技术设计或法律裁决。医学教育是 CBR 的一个应用,其中患者病史和治疗方案用于支持诊断和考虑…… 阅读更多

贝叶斯信念网络是如何学习的?

Ginni
更新于 2022 年 2 月 16 日 11:49:01

316 次浏览

贝叶斯分类器是统计分类器。它们可以预测类成员概率,包括给定样本属于特定类的概率。贝叶斯分类器在处理大型数据库时也显示出很高的效率和速度。一旦定义了类,系统应该推断控制分类的规则,因此系统应该能够找到每个类的描述。描述应该只参考训练集的预测属性,以便只有正例应该满足描述,而不是负例。如果规则的描述涵盖…… 阅读更多

什么是属性选择度量?

Ginni
更新于 2022 年 2 月 16 日 11:46:57

25K+ 次浏览

属性选择度量是一种启发式方法,用于选择“最佳”地将给定类标签训练元组的数据分区 D 分割成单个类的分裂测试。如果它可以根据分裂标准的结果将 D 分割成更小的分区,理想情况下,每个分区都可以是纯净的(即,落入给定分区的一些元组可以属于同一类)。从概念上讲,“最佳”分裂标准最接近于产生这种方法的结果。属性选择度量称为分裂规则,因为它们决定了如何划分给定节点处的元组。属性选择…… 阅读更多

决策树如何用于分类?

Ginni
更新于 2022 年 2 月 16 日 11:44:47

1K+ 次浏览

决策树归纳是从类标签训练元组中学习决策树。决策树是一种类似于序列图的树状结构,其中每个内部节点(非叶节点)表示对属性的测试,每个分支定义测试的结果,每个叶节点(或终端节点)影响类标签。树中最高的节点是根节点。它定义了概念购买计算机,即它预测 AllElectronics 的用户是否可能购买计算机。内部节点用矩形表示,叶节点用椭圆形表示。有各种决策树…… 阅读更多

分类是如何工作的?

Ginni
更新于 2022 年 2 月 16 日 11:43:32

938 次浏览

分类是一种数据挖掘方法,它将元素分配给一组数据,以帮助更有效地进行预测和分析。分类通常用于有两个目标类的情况,称为二元分类。当可以预测两个以上类时,尤其是在模式识别问题中,这被定义为多项式分类。但是,多项式分类可以用于分类响应数据,其中需要预测各种元素中的哪个类别具有最大概率的实例。数据分类是一个两阶段的过程。在第一阶段,构建分类器以定义预定数据集合…… 阅读更多

我们如何使用规则约束来修剪搜索空间?

Ginni
更新于 2022 年 2 月 16 日 11:40:48

119 次浏览

规则约束可以分为以下五个元素,如下所示 - 反单调 - 约束的第一个元素是反单调的。考虑规则约束“sum(I.price) ≤ 100”。假设它使用 Apriori 框架,在每次迭代 k 中分析大小为 k 的项集。如果项集中项的成本总和不少于 100,则可以从搜索空间中缩短此项集,因为在集合中插入更多项只会使其成本更高,因此不会满足约束。反单调约束的修剪可以用于…… 阅读更多

元规则在数据挖掘中如何有用?

Ginni
更新于 2022 年 2 月 16 日 11:37:34

705 次浏览

数据挖掘是通过传输存储在存储库中的大量数据来查找有用的新相关性、模式和趋势的过程,使用包括统计和数学技术的模式识别技术。它是对事实数据集的分析,以发现意想不到的关系,并以对数据库所有者而言既合乎逻辑又有所帮助的新颖方法总结记录。它是选择、探索和建模大量信息的过程,以查找最初未知的规律或关系,以便为数据库所有者获得清晰且有益的结果。数据挖掘类似…… 阅读更多

什么是基于约束的关联挖掘?

Ginni
更新于 2022 年 2 月 16 日 11:36:27

21K+ 次浏览

数据挖掘过程可以从给定的一组信息中发现数千条规则,其中大部分最终对用户来说是独立的或乏味的。用户最清楚挖掘的哪个“方向”可以导致有趣的模式以及他们可能想要发现的模式或规则的“形式”。因此,一个好的启发式方法是让用户将这种直觉或期望定义为约束以约束搜索空间。这种策略称为基于约束的挖掘。基于约束的算法需要约束来减少频繁项集生成步骤(关联规则生成步骤…… 阅读更多

关联规则聚类系统涉及哪些步骤?

Ginni
更新于 2022 年 2 月 16 日 11:34:44

1K+ 次浏览

关联规则聚类系统中涉及以下步骤,如下所示 - 分箱 - 定量属性可以具有代表其域的广泛值范围。可以考虑如果将年龄和收入作为轴绘制二维网格会是多大,其中年龄的每个可能值都会在一条轴上创建一个特定位置,同样,收入的每个可能值都会在另一条轴上创建一个特定位置。可以将网格保持在可管理的大小,可以改为将定量属性的区域划分为区间。这些…… 阅读更多

我们如何挖掘封闭频繁项集?

Ginni
更新于 2022 年 2 月 16 日 11:30:57

1K+ 次浏览

在朴素的方法中,它可以挖掘完整的频繁项集,然后移除每个是当前频繁项集的真子集且具有相似支持度的频繁项集。这种方法可以推导出 2100-1 个频繁项集以获得长度为 100 的频繁项集,所有这些操作都在开始移除冗余项集之前进行。推荐的技术是在挖掘阶段精确地搜索闭合频繁项集。这需要我们在挖掘过程中尽快识别闭合项集的方法来修剪搜索空间。有各种修剪策略,包括以下内容 - 项... 阅读更多

广告