找到关于数据库的6705篇文章

什么是时间序列数据库?

Ginni
更新于 2021年11月25日 08:00:25

996 次浏览

时间序列数据库包含一系列值或事件,这些值或事件通过重复的时间评估来访问。这些值通常以相等的时间间隔计算(例如,每小时、每天、每周)。时间序列数据库在许多应用程序中很流行,例如股票市场分析、经济和销售预测、预算分析、效用研究、库存研究、产量预测、工作量预测、过程和质量控制、自然现象的观察(包括大气、温度、风和地震)、数值和工程实验以及医疗处理。时间序列数据库也是一种序列数据库。序列数据库是任何包含有序事件序列的数据库,无论是否有具体的……阅读更多

什么是CluStream?

Ginni
更新于 2021年11月25日 07:58:04

780 次浏览

CluStream 是一种基于用户指定的在线聚类查询对不断发展的数据流进行聚类的算法。它将聚类过程分为在线和离线组件。在线组件使用微型集群计算和存储有关数据流的汇总统计信息,并执行微型集群的增量在线计算和维护。离线组件执行宏观聚类,并使用存储的汇总统计信息回答各种用户问题,这些统计信息基于倾斜时间框架模型。该集群根据历史和当前流数据信息不断发展的数据流,采用倾斜时间框架模型(例如渐进对数模型),……阅读更多

什么是Hoeffding树算法?

Ginni
更新于 2021年11月25日 07:54:06

4K+ 次浏览

Hoeffding 树算法是一种用于流数据分类的决策树学习方法。它最初用于跟踪 Web 点击流并构建模型以预测用户可能访问哪些 Web 主机和网站。它通常以次线性时间运行,并生成与传统批量学习者生成的决策树几乎相同的决策树。它使用 Hoeffding 树,利用这样的想法:一个小样本通常足以选择最佳分裂属性。这个想法得到了 Hoeffding 界限(或加性 Chernoff 界限)的数学支持。假设我们对随机……阅读更多

什么是BIRCH?

Ginni
更新于 2021年11月25日 07:47:53

1K+ 次浏览

BIRCH 代表使用层次结构的平衡迭代缩减和聚类。它旨在通过集成层次聚类和其他聚类方法(包括迭代分区)来聚类大量数值记录。BIRCH 提供了两个概念,即聚类特征和聚类特征树 (CF 树),用于总结聚类描述。这些结构使聚类方法能够在大型数据库中实现最佳速度和可扩展性,并使其对传入对象的增量和动态聚类有效。给定一个集群中的 n 个 d 维数据对象或点,它可以表示质心 x0、半径 R 和直径 D……阅读更多

什么是基于距离的离群值?

Ginni
更新于 2021年11月25日 07:46:20

2K+ 次浏览

如果数据集 S 中的对象 o 的至少一部分 p 的对象与 o 的距离大于 d,则该对象 o 是具有参数 p 和 d 的基于距离的 (DB) 离群值,即 DB (p, d)。换句话说,它可以认为基于距离的离群值是那些没有足够邻居的对象,而不是依赖于统计检验。邻居是根据与给定对象的距离来表示的。与基于统计的方法相比,基于距离的离群值检测概括或合并了标准分布的差异性检验背后的思想。因此,基于距离的离群值也是……阅读更多

什么是半监督聚类分析?

Ginni
更新于 2021年11月24日 10:55:56

6K+ 次浏览

半监督聚类是一种通过使用领域知识来划分未标记数据的方法。它通常表示为实例之间的成对约束,或者只是一个额外的标记实例集。使用一些弱监督结构(例如,成对约束的形式(即标记为属于相似或不同集群的对象对))可以极大地提高无监督聚类的质量。这种依赖于用户反馈或指导约束的聚类过程称为半监督聚类。有多种半监督聚类方法,可以分为两类,它们是……阅读更多

基于约束的聚类分析有哪些类型?

Ginni
更新于 2021年11月24日 10:53:53

3K+ 次浏览

基于约束的聚类查找满足用户声明的首选项或约束的集群。基于约束的性质,基于约束的聚类可以采用不同的方法。有几类约束如下:对单个对象的约束 - 它可以定义对要聚类的对象的约束。例如,在房地产应用程序中,人们可能只想对价值超过一百万美元的豪华别墅进行空间聚类。此约束将要聚类的对象集合限制在范围内。它可以通过预处理(例如,使用 SQL 查询实现选择)简单地进行管理,之后……阅读更多

什么是概念聚类?

Ginni
更新于 2021年11月24日 11:19:48

2K+ 次浏览

概念聚类是一种机器学习中的聚类形式,它在给定一组未标记的对象的情况下,对这些对象进行分类设计。与通常识别相似对象组的传统聚类不同,概念聚类更进一步,还发现了每个组的特征定义,其中每个组定义一个概念或类别。因此,概念聚类是一个两步过程 - 首先执行聚类,然后进行表征。因此,聚类质量不仅仅是单个对象的属性。大多数概念聚类技术采用一种统计方法,该方法使用概率度量来决定概念或集群。概率……阅读更多

什么是期望最大化?

Ginni
更新于 2021年11月24日 10:11:39

598 次浏览

EM(期望最大化)算法是一种著名的迭代细化算法,可用于发现参数估计。它可以被认为是 k 均值范式的扩展,它根据集群均值将对象创建到与其最相似的集群中。EM 根据定义成员概率的权重将每个对象创建到集群中。换句话说,集群之间没有严格的界限。因此,新的均值是基于加权度量来评估的。EM 从组合模型参数的原始估计或“猜测”(统称为参数……阅读更多

为什么小波变换对聚类有用?

Ginni
更新于 2021年11月24日 07:10:54

1K+ 次浏览

WaveCluster 是一种多分辨率聚类算法,它首先通过在数据空间上叠加多维网格结构来总结记录。它可以使用小波变换来改变原始特征空间,从而找到变换空间中的稠密区域。在此方法中,每个网格单元总结映射到该单元的一组点的数。这些汇总数据通常适合放入主内存中,以便用于多分辨率小波变换和随后的聚类分析。小波变换是一种信号处理方法,它将信号分解成多个频率子带。小波模型可以用于……阅读更多

广告